国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

30FPS普通相機(jī)恢復(fù)200FPS細(xì)節(jié),4D重建方案來了

0
分享至



本文第一作者陳羽田,香港中文大學(xué) MMLab 博士二年級在讀,研究方向?yàn)槿S重建與生成,導(dǎo)師為薛天帆教授。個人主頁:https://yutian10.github.io

當(dāng)古裝劇中的長袍在武林高手凌空翻騰的瞬間揚(yáng)起 0.01 秒的驚艷弧度,當(dāng) VR 玩家想伸手抓住對手 “空中定格” 的劍鋒,當(dāng) TikTok 爆款視頻里一滴牛奶皇冠般的濺落要被 360° 無死角重放 —— 如何用普通的攝像機(jī),把瞬間即逝的高速世界 “凍結(jié)” 成可供反復(fù)拆解、傳送與交互的數(shù)字化 4D 時空,成為 3D 視覺領(lǐng)域的一個難題。


https://mp.weixin.qq.com/s/C1LiDwwRsfXiOhxKoG3qBA?click_id=1

然而,受限于硬件成本與數(shù)據(jù)傳輸帶寬,目前絕大多數(shù) 4D 采集陣列的最高幀率僅約 30 FPS;相比之下,傳統(tǒng)高速攝影通常需要 120 FPS 乃至更高。簡單升級相機(jī)硬件不僅價格高昂,還會帶來指數(shù)級增長的數(shù)據(jù)通量,難以在大規(guī)模部署中落地。另一條改變的思路是在重建階段 “補(bǔ)幀”。近期,例如 4D 高斯濺射(4D Gaussian Splatting)等動態(tài)場景重建方法能在簡單運(yùn)動中通過稀疏時序輸入合成連續(xù)幀,變相提升幀率,但面對布料擺動、高速旋轉(zhuǎn)等非線性復(fù)雜運(yùn)動,中間幀仍會出現(xiàn)運(yùn)動不連續(xù)、偽影明顯的問題。

于是,一個自然且關(guān)鍵的問題被提出:能否僅利用低幀率相機(jī)陣列,準(zhǔn)確恢復(fù)出高質(zhì)量的高速運(yùn)動 4D 模型?正是在這一動機(jī)下,我們提出 “異步采集 + 視頻擴(kuò)散模型修復(fù)” 的軟硬協(xié)同解決方案,為高速 4D 重建開辟了一條低成本、高質(zhì)量的新路徑,實(shí)現(xiàn)了僅利用 30 FPS 的普通相機(jī),恢復(fù)出相當(dāng)于 100-200 FPS 的高質(zhì)量動態(tài)細(xì)節(jié)




https://mp.weixin.qq.com/s/C1LiDwwRsfXiOhxKoG3qBA?click_id=1

  • 論文標(biāo)題:4DSloMo: 4D Reconstruction for High Speed Scene
  • with Asynchronous Capture
  • 項目主頁:https://openimaginglab.github.io/4DSloMo
  • 論文:https://arxiv.org/pdf/2507.05163
  • 代碼:https://github.com/OpenImagingLab/4DSloMo

硬件革新:異步捕捉,讓相機(jī) “錯峰拍攝”

核心思路,是突破單個相機(jī)的速度瓶頸,通過讓多個相機(jī)協(xié)同工作,實(shí)現(xiàn)一種 “接力式” 的拍攝方案。傳統(tǒng)的捕捉方案是讓相機(jī)陣列的所有相機(jī)在同一時刻拍照。而本文的異步捕捉 (Asynchronous Capture) 方案,則是人為地給不同相機(jī)或相機(jī)組設(shè)置一個微小的啟動延遲。



傳統(tǒng)同步方案(左),所有相機(jī)在同一時間點(diǎn)(如 t=0, t=0.04s)捕捉。我們的異步方案(右),通過錯開相機(jī) 2 的啟動時間,在 0s 和 0.04s 之間插入了一個新的捕捉點(diǎn)(t=0.02s),有效幀率直接翻倍。

想象一下,8 臺 25 FPS 的相機(jī),如果我們將它們分成 4 組,每組交替啟動,就能將時間切片切得更細(xì),實(shí)現(xiàn) 100 FPS 的有效捕捉幀率;如果分成 8 組,甚至能達(dá)到 200 FPS!整個過程無需任何額外的硬件成本,卻在時間維度上獲得了前所未有的信息密度。

軟件革新:視頻擴(kuò)散模型,為 4D 重建 “精裝修”

異步捕捉雖然解決了時間分辨率的問題,但也帶來了一個新的挑戰(zhàn):在任何一個特定的時間點(diǎn),參與拍攝的相機(jī)數(shù)量變少了,這會導(dǎo)致 “稀疏視角” 問題,從而在初步的 4D 重建結(jié)果中產(chǎn)生 “浮塊” 等視覺偽影。為了解決這個問題,我們訓(xùn)練了一個專門用于修復(fù) 4D 重建偽影的視頻擴(kuò)散模型 (Artifact-fix Video Diffusion Model)。



該模型的核心功能是接收一個包含重建偽影的視頻作為輸入 ,并生成一個精修后的高質(zhì)量視頻作為輸出。這里的關(guān)鍵思想是,作為輸入的視頻雖然在視覺上不完美,但它為擴(kuò)散模型提供了修復(fù)所需的關(guān)鍵時空上下文 (Spatio-temporal Context)—— 即場景的正確空間結(jié)構(gòu)和物體的核心運(yùn)動信息。模型利用這些上下文作為引導(dǎo),專注于去除偽影并補(bǔ)全細(xì)節(jié)。

為了實(shí)現(xiàn)這一功能,我們構(gòu)建了一個針對性的訓(xùn)練數(shù)據(jù)集。我們通過在高質(zhì)量的 4D 數(shù)據(jù)上模擬異步捕捉過程,生成包含典型偽影的降質(zhì)視頻 。隨后,我們將這些降質(zhì)視頻與原始的真值視頻 (Ground Truth) 配對,通過對一個大規(guī)模預(yù)訓(xùn)練視頻模型進(jìn)行微調(diào) (Fine-tuning),使其學(xué)習(xí)從包含偽影的輸入到清晰輸出的映射關(guān)系。

與常見的圖像擴(kuò)散模型相比,我們使用視頻模型的核心優(yōu)勢在于保證 “時間一致性 (Temporal Consistency)”。逐幀修復(fù)容易在連續(xù)幀之間引入紋理閃爍等不一致問題,而我們的視頻模型能夠利用時序先驗(yàn),在去除偽影的同時,生成在時間維度上連貫、平滑的動態(tài)結(jié)果。

整體流程:一個 “重建 - 優(yōu)化” 的迭代框架

我們的方法將硬件捕捉與 AI 算法相結(jié)合,構(gòu)建了一個迭代式的優(yōu)化框架:

1.初步重建 (Initial Reconstruction):首先,利用異步捕捉的視頻數(shù)據(jù),重建一個初步的 4D 高斯模型。該模型能捕捉高速動態(tài),但存在視覺偽影。

2.生成偽真值 (Pseudo Ground Truth Generation):接著,使用初步模型渲染出包含偽影的視頻。這些視頻將作為我們視頻擴(kuò)散模型的條件輸入。

3.視頻增強(qiáng) (Video Enhancement):將渲染視頻送入視頻擴(kuò)散模型。模型負(fù)責(zé)去除偽影并提升視頻質(zhì)量,輸出增強(qiáng)后的視頻。

4.模型優(yōu)化 (Model Optimization):最后,將增強(qiáng)后的高質(zhì)量視頻作為新的監(jiān)督信號 (Supervision Signal),用于進(jìn)一步優(yōu)化 4D 高斯模型,從而顯著提升最終的重建質(zhì)量。



整體框架:異步視頻 → 初步重建 → 視頻增強(qiáng) → 優(yōu)化 4D 模型。

方法效果

在 DNA-Rendering 和 Neural3DV 兩大公開數(shù)據(jù)集的測試中,我們的方法在峰值信噪比(PSNR)、結(jié)構(gòu)相似性(SSIM)和感知質(zhì)量(LPIPS)三項核心指標(biāo)上,超越了包括 K-Planes, 4DGS, GS4D 在內(nèi)的多種當(dāng)前頂尖(SOTA)方法。






https://mp.weixin.qq.com/s/C1LiDwwRsfXiOhxKoG3qBA?click_id=1

為了在真實(shí)世界中驗(yàn)證我們的想法,我們專門搭建了一套包含 12 個 25 FPS 相機(jī)的多視角捕捉系統(tǒng)。實(shí)驗(yàn)證明,即使在真實(shí)、復(fù)雜的異步捕捉環(huán)境下,我們的方法依然能夠穩(wěn)健地重建出高質(zhì)量、時空一致的 4D 內(nèi)容。


https://mp.weixin.qq.com/s/C1LiDwwRsfXiOhxKoG3qBA?click_id=1


https://mp.weixin.qq.com/s/C1LiDwwRsfXiOhxKoG3qBA?click_id=1

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
南博事件升級!關(guān)鍵人物挖出,徐前院長使出“苦肉計”確實(shí)尷尬…

南博事件升級!關(guān)鍵人物挖出,徐前院長使出“苦肉計”確實(shí)尷尬…

火山詩話
2025-12-20 16:28:41
泰柬之戰(zhàn)的效果來啦!柬埔寨電詐分子上演大逃亡,場面震撼……

泰柬之戰(zhàn)的效果來啦!柬埔寨電詐分子上演大逃亡,場面震撼……

翻開歷史和現(xiàn)實(shí)
2025-12-20 15:46:00
泰方點(diǎn)名調(diào)查柬“生命研究中心”,湘雅醫(yī)院火速撇清:從未合作

泰方點(diǎn)名調(diào)查柬“生命研究中心”,湘雅醫(yī)院火速撇清:從未合作

胡嚴(yán)亂語
2025-12-20 16:13:32
深圳“日入過萬”烤雞少年塌房了!獨(dú)家配方居然是用了“肉寶王”

深圳“日入過萬”烤雞少年塌房了!獨(dú)家配方居然是用了“肉寶王”

火山詩話
2025-12-20 10:25:37
心痛!30歲男銷售確認(rèn)死亡,目擊者講述事發(fā)經(jīng)過,車主懵了

心痛!30歲男銷售確認(rèn)死亡,目擊者講述事發(fā)經(jīng)過,車主懵了

魔都姐姐雜談
2025-12-20 09:19:55
東京舉辦特殊晚宴,高市與中亞5國舉杯共飲,對付中俄已有妙計

東京舉辦特殊晚宴,高市與中亞5國舉杯共飲,對付中俄已有妙計

博覽歷史
2025-12-20 17:55:50
1-1大冷!中國隊逼平韓國隊,末輪贏球=擺脫倒數(shù)第一

1-1大冷!中國隊逼平韓國隊,末輪贏球=擺脫倒數(shù)第一

何老師呀
2025-12-20 16:36:13
《阿凡達(dá)3》首映遭遇放映“滑鐵盧”:版本多,分辨率高,幀率翻倍,不少影院放映系統(tǒng)不堪重負(fù)

《阿凡達(dá)3》首映遭遇放映“滑鐵盧”:版本多,分辨率高,幀率翻倍,不少影院放映系統(tǒng)不堪重負(fù)

揚(yáng)子晚報
2025-12-20 13:24:32
當(dāng)年斥巨資拍攝的10大爛片,每一部都是電影界的奇恥大辱

當(dāng)年斥巨資拍攝的10大爛片,每一部都是電影界的奇恥大辱

小微看電影
2025-12-19 09:35:41
周星馳的《功夫》中,病怏怏的琛哥為什么能當(dāng)上斧頭幫的老大?

周星馳的《功夫》中,病怏怏的琛哥為什么能當(dāng)上斧頭幫的老大?

殺死虛無主義
2025-12-20 07:37:33
寧波大學(xué)附屬婦女兒童醫(yī)院發(fā)布情況說明后又刪了

寧波大學(xué)附屬婦女兒童醫(yī)院發(fā)布情況說明后又刪了

第一財經(jīng)資訊
2025-12-20 21:55:59
成都私人影院被曝涉“有償陪侍” 記者探訪:涉事門店已暫停經(jīng)營,警方介入調(diào)查

成都私人影院被曝涉“有償陪侍” 記者探訪:涉事門店已暫停經(jīng)營,警方介入調(diào)查

封面新聞
2025-12-20 19:21:27
【觀察】給聯(lián)盟打樣!森林狼獻(xiàn)祭流打法逼出雷霆硬傷

【觀察】給聯(lián)盟打樣!森林狼獻(xiàn)祭流打法逼出雷霆硬傷

體壇周報
2025-12-20 16:46:36
內(nèi)地上映第二天,電影《阿凡達(dá)3》票房破2億,觀眾:電影時長太長,看完體驗(yàn)很不好

內(nèi)地上映第二天,電影《阿凡達(dá)3》票房破2億,觀眾:電影時長太長,看完體驗(yàn)很不好

臺州交通廣播
2025-12-20 13:51:54
明朝的一首詞,抵得過千萬首唐詩宋詞,因?yàn)檫@首詞全篇都是名句

明朝的一首詞,抵得過千萬首唐詩宋詞,因?yàn)檫@首詞全篇都是名句

長風(fēng)文史
2025-12-18 15:00:28
網(wǎng)友在泰國駐華大使館下面留言打這里:柬埔寨幼兒骨髓提取中心

網(wǎng)友在泰國駐華大使館下面留言打這里:柬埔寨幼兒骨髓提取中心

深度報
2025-12-19 23:07:44
泰國為何要攻打柬埔寨,你了解這個緣由的話,換你你也打

泰國為何要攻打柬埔寨,你了解這個緣由的話,換你你也打

沒有偏旁的常慶
2025-12-20 13:30:42
柬埔寨電詐分子上演大逃亡,場面震撼!

柬埔寨電詐分子上演大逃亡,場面震撼!

環(huán)球熱點(diǎn)快評
2025-12-20 07:53:18
高盛:未來2年房價或再跌10-30%  警告可能出現(xiàn)房價負(fù)反饋循環(huán)

高盛:未來2年房價或再跌10-30% 警告可能出現(xiàn)房價負(fù)反饋循環(huán)

財富情報局
2025-12-19 23:06:25
羅素:愚蠢的四大特征

羅素:愚蠢的四大特征

尚曦讀史
2025-12-19 09:55:05
2025-12-20 23:39:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11957文章數(shù) 142514關(guān)注度
往期回顧 全部

藝術(shù)要聞

驚!肢體語言竟如此迷人,讓人無法抗拒!

頭條要聞

印度官員:若"臺灣有事" 印度不太可能像西方那樣回應(yīng)

頭條要聞

印度官員:若"臺灣有事" 印度不太可能像西方那樣回應(yīng)

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

2026央視跨年晚會陣容曝光,豪華陣仗

財經(jīng)要聞

求解“地方財政困難”

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

汽車要聞

嵐圖推進(jìn)L3量產(chǎn)測試 已完成11萬公里實(shí)際道路驗(yàn)證

態(tài)度原創(chuàng)

藝術(shù)
游戲
旅游
教育
公開課

藝術(shù)要聞

驚!肢體語言竟如此迷人,讓人無法抗拒!

新勞拉·克勞馥演員回憶《完美黑暗》項目取消經(jīng)歷

旅游要聞

虹口新春“五必”榜單來啦!一季度“樂購樂游”攻略輕松拿捏!

教育要聞

調(diào)查發(fā)現(xiàn):影響孩子成績的三大主要因素,居然沒有補(bǔ)習(xí)班

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版