国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

30FPS普通相機恢復200FPS細節(jié),4D重建方案來了

0
分享至



本文第一作者陳羽田,香港中文大學 MMLab 博士二年級在讀,研究方向為三維重建與生成,導師為薛天帆教授。個人主頁:https://yutian10.github.io

當古裝劇中的長袍在武林高手凌空翻騰的瞬間揚起 0.01 秒的驚艷弧度,當 VR 玩家想伸手抓住對手 “空中定格” 的劍鋒,當 TikTok 爆款視頻里一滴牛奶皇冠般的濺落要被 360° 無死角重放 —— 如何用普通的攝像機,把瞬間即逝的高速世界 “凍結(jié)” 成可供反復拆解、傳送與交互的數(shù)字化 4D 時空,成為 3D 視覺領(lǐng)域的一個難題。


https://mp.weixin.qq.com/s/C1LiDwwRsfXiOhxKoG3qBA?click_id=1

然而,受限于硬件成本與數(shù)據(jù)傳輸帶寬,目前絕大多數(shù) 4D 采集陣列的最高幀率僅約 30 FPS;相比之下,傳統(tǒng)高速攝影通常需要 120 FPS 乃至更高。簡單升級相機硬件不僅價格高昂,還會帶來指數(shù)級增長的數(shù)據(jù)通量,難以在大規(guī)模部署中落地。另一條改變的思路是在重建階段 “補幀”。近期,例如 4D 高斯濺射(4D Gaussian Splatting)等動態(tài)場景重建方法能在簡單運動中通過稀疏時序輸入合成連續(xù)幀,變相提升幀率,但面對布料擺動、高速旋轉(zhuǎn)等非線性復雜運動,中間幀仍會出現(xiàn)運動不連續(xù)、偽影明顯的問題。

于是,一個自然且關(guān)鍵的問題被提出:能否僅利用低幀率相機陣列,準確恢復出高質(zhì)量的高速運動 4D 模型?正是在這一動機下,我們提出 “異步采集 + 視頻擴散模型修復” 的軟硬協(xié)同解決方案,為高速 4D 重建開辟了一條低成本、高質(zhì)量的新路徑,實現(xiàn)了僅利用 30 FPS 的普通相機,恢復出相當于 100-200 FPS 的高質(zhì)量動態(tài)細節(jié)




https://mp.weixin.qq.com/s/C1LiDwwRsfXiOhxKoG3qBA?click_id=1

  • 論文標題:4DSloMo: 4D Reconstruction for High Speed Scene
  • with Asynchronous Capture
  • 項目主頁:https://openimaginglab.github.io/4DSloMo
  • 論文:https://arxiv.org/pdf/2507.05163
  • 代碼:https://github.com/OpenImagingLab/4DSloMo

硬件革新:異步捕捉,讓相機 “錯峰拍攝”

核心思路,是突破單個相機的速度瓶頸,通過讓多個相機協(xié)同工作,實現(xiàn)一種 “接力式” 的拍攝方案。傳統(tǒng)的捕捉方案是讓相機陣列的所有相機在同一時刻拍照。而本文的異步捕捉 (Asynchronous Capture) 方案,則是人為地給不同相機或相機組設(shè)置一個微小的啟動延遲。



傳統(tǒng)同步方案(左),所有相機在同一時間點(如 t=0, t=0.04s)捕捉。我們的異步方案(右),通過錯開相機 2 的啟動時間,在 0s 和 0.04s 之間插入了一個新的捕捉點(t=0.02s),有效幀率直接翻倍。

想象一下,8 臺 25 FPS 的相機,如果我們將它們分成 4 組,每組交替啟動,就能將時間切片切得更細,實現(xiàn) 100 FPS 的有效捕捉幀率;如果分成 8 組,甚至能達到 200 FPS!整個過程無需任何額外的硬件成本,卻在時間維度上獲得了前所未有的信息密度。

軟件革新:視頻擴散模型,為 4D 重建 “精裝修”

異步捕捉雖然解決了時間分辨率的問題,但也帶來了一個新的挑戰(zhàn):在任何一個特定的時間點,參與拍攝的相機數(shù)量變少了,這會導致 “稀疏視角” 問題,從而在初步的 4D 重建結(jié)果中產(chǎn)生 “浮塊” 等視覺偽影。為了解決這個問題,我們訓練了一個專門用于修復 4D 重建偽影的視頻擴散模型 (Artifact-fix Video Diffusion Model)。



該模型的核心功能是接收一個包含重建偽影的視頻作為輸入 ,并生成一個精修后的高質(zhì)量視頻作為輸出。這里的關(guān)鍵思想是,作為輸入的視頻雖然在視覺上不完美,但它為擴散模型提供了修復所需的關(guān)鍵時空上下文 (Spatio-temporal Context)—— 即場景的正確空間結(jié)構(gòu)和物體的核心運動信息。模型利用這些上下文作為引導,專注于去除偽影并補全細節(jié)。

為了實現(xiàn)這一功能,我們構(gòu)建了一個針對性的訓練數(shù)據(jù)集。我們通過在高質(zhì)量的 4D 數(shù)據(jù)上模擬異步捕捉過程,生成包含典型偽影的降質(zhì)視頻 。隨后,我們將這些降質(zhì)視頻與原始的真值視頻 (Ground Truth) 配對,通過對一個大規(guī)模預訓練視頻模型進行微調(diào) (Fine-tuning),使其學習從包含偽影的輸入到清晰輸出的映射關(guān)系。

與常見的圖像擴散模型相比,我們使用視頻模型的核心優(yōu)勢在于保證 “時間一致性 (Temporal Consistency)”。逐幀修復容易在連續(xù)幀之間引入紋理閃爍等不一致問題,而我們的視頻模型能夠利用時序先驗,在去除偽影的同時,生成在時間維度上連貫、平滑的動態(tài)結(jié)果。

整體流程:一個 “重建 - 優(yōu)化” 的迭代框架

我們的方法將硬件捕捉與 AI 算法相結(jié)合,構(gòu)建了一個迭代式的優(yōu)化框架:

1.初步重建 (Initial Reconstruction):首先,利用異步捕捉的視頻數(shù)據(jù),重建一個初步的 4D 高斯模型。該模型能捕捉高速動態(tài),但存在視覺偽影。

2.生成偽真值 (Pseudo Ground Truth Generation):接著,使用初步模型渲染出包含偽影的視頻。這些視頻將作為我們視頻擴散模型的條件輸入。

3.視頻增強 (Video Enhancement):將渲染視頻送入視頻擴散模型。模型負責去除偽影并提升視頻質(zhì)量,輸出增強后的視頻。

4.模型優(yōu)化 (Model Optimization):最后,將增強后的高質(zhì)量視頻作為新的監(jiān)督信號 (Supervision Signal),用于進一步優(yōu)化 4D 高斯模型,從而顯著提升最終的重建質(zhì)量。



整體框架:異步視頻 → 初步重建 → 視頻增強 → 優(yōu)化 4D 模型。

方法效果

在 DNA-Rendering 和 Neural3DV 兩大公開數(shù)據(jù)集的測試中,我們的方法在峰值信噪比(PSNR)、結(jié)構(gòu)相似性(SSIM)和感知質(zhì)量(LPIPS)三項核心指標上,超越了包括 K-Planes, 4DGS, GS4D 在內(nèi)的多種當前頂尖(SOTA)方法。






https://mp.weixin.qq.com/s/C1LiDwwRsfXiOhxKoG3qBA?click_id=1

為了在真實世界中驗證我們的想法,我們專門搭建了一套包含 12 個 25 FPS 相機的多視角捕捉系統(tǒng)。實驗證明,即使在真實、復雜的異步捕捉環(huán)境下,我們的方法依然能夠穩(wěn)健地重建出高質(zhì)量、時空一致的 4D 內(nèi)容。


https://mp.weixin.qq.com/s/C1LiDwwRsfXiOhxKoG3qBA?click_id=1


https://mp.weixin.qq.com/s/C1LiDwwRsfXiOhxKoG3qBA?click_id=1

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
國內(nèi)退休群體現(xiàn)狀被揭示:大部分退休人員,或?qū)⒚媾R2大的難題

國內(nèi)退休群體現(xiàn)狀被揭示:大部分退休人員,或?qū)⒚媾R2大的難題

陳博世財經(jīng)
2025-12-19 10:11:44
杭州剛提新車就撞人后續(xù):疑似被撞銷售不幸身亡,涉事司機麻煩了

杭州剛提新車就撞人后續(xù):疑似被撞銷售不幸身亡,涉事司機麻煩了

漢史趣聞
2025-12-18 11:38:12
最低-12℃!陜西今夜到明早有雨雪暴雪,出行注意→

最低-12℃!陜西今夜到明早有雨雪暴雪,出行注意→

91.6陜西交通廣播
2025-12-19 15:41:44
劉亦菲在家玩自拍!不料被鏡子“出賣”了,網(wǎng)友直呼:好女人啊!

小欣欣聊體育
2025-12-18 20:44:37

小鵬汽車法務(wù)部:已報案

小鵬汽車法務(wù)部:已報案

每日經(jīng)濟新聞
2025-12-18 14:52:26
你的辦公搭子,要漲價了

你的辦公搭子,要漲價了

中國新聞周刊
2025-12-19 13:33:38
國足出線難了!FIFA也幫不了,3大舉辦國反對2030世界杯擴軍64隊

國足出線難了!FIFA也幫不了,3大舉辦國反對2030世界杯擴軍64隊

侃球熊弟
2025-12-19 12:24:08
TikTok美國方案簽約,字節(jié)跳動繼續(xù)擁有TikTok算法知識產(chǎn)權(quán)

TikTok美國方案簽約,字節(jié)跳動繼續(xù)擁有TikTok算法知識產(chǎn)權(quán)

第一財經(jīng)資訊
2025-12-19 07:50:10
海南封關(guān)首日iPhone最高可減2140元 免稅店排長隊搶購

海南封關(guān)首日iPhone最高可減2140元 免稅店排長隊搶購

手機中國
2025-12-18 17:09:58
性能力與壽命關(guān)系被發(fā)現(xiàn)!男性40歲后,睪酮越高,死亡風險越低

性能力與壽命關(guān)系被發(fā)現(xiàn)!男性40歲后,睪酮越高,死亡風險越低

藥師說健康
2025-12-05 09:47:10
那個詛咒人類半個世紀的“50年魔咒”,真的開始松動了

那個詛咒人類半個世紀的“50年魔咒”,真的開始松動了

科學聲音
2025-12-18 20:06:30
美國底層女性垃圾白人曝光:社工直接給工具,就是讓他們吸死拉倒

美國底層女性垃圾白人曝光:社工直接給工具,就是讓他們吸死拉倒

忠于法紀
2025-12-18 20:14:00
曲協(xié)表態(tài)僅6天,郭德綱擔心的事還是發(fā)生,曹云金的話,有人信了

曲協(xié)表態(tài)僅6天,郭德綱擔心的事還是發(fā)生,曹云金的話,有人信了

科學發(fā)掘
2025-12-19 10:27:00
單扛強突+MVP!22歲中鋒帶隊進決賽:離開曼聯(lián)半年12球3助

單扛強突+MVP!22歲中鋒帶隊進決賽:離開曼聯(lián)半年12球3助

葉青足球世界
2025-12-19 08:29:19
2票之差,特朗普拿下對委內(nèi)瑞拉開戰(zhàn)權(quán),中方通告全球,表明立場

2票之差,特朗普拿下對委內(nèi)瑞拉開戰(zhàn)權(quán),中方通告全球,表明立場

時時有聊
2025-12-18 17:07:40
CBA最新消息!曝上海將裁掉弗格,沈梓捷受傷或賽季報銷

CBA最新消息!曝上海將裁掉弗格,沈梓捷受傷或賽季報銷

郝小小看體育
2025-12-19 11:29:04
國產(chǎn)奔馳GLE要來了!前臉大改,軸距加長,能比寶馬X5更好賣?

國產(chǎn)奔馳GLE要來了!前臉大改,軸距加長,能比寶馬X5更好賣?

優(yōu)視汽車
2025-12-19 14:08:02
剛從沐曦爆賺200億的葛衛(wèi)東又出手了!

剛從沐曦爆賺200億的葛衛(wèi)東又出手了!

商業(yè)與生活
2025-12-19 11:43:38
北京下周還有雪!今天空氣質(zhì)量將好轉(zhuǎn)——

北京下周還有雪!今天空氣質(zhì)量將好轉(zhuǎn)——

BRTV新聞
2025-12-19 12:57:41
曝阿莫林下賽季不再執(zhí)教曼聯(lián),兩人成替代候選!拉爵三年承諾無用

曝阿莫林下賽季不再執(zhí)教曼聯(lián),兩人成替代候選!拉爵三年承諾無用

羅米的曼聯(lián)博客
2025-12-19 07:30:10
2025-12-19 16:52:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11957文章數(shù) 142513關(guān)注度
往期回顧 全部

藝術(shù)要聞

諸樂三的寫意花鳥

頭條要聞

美批準對臺逾111億美元軍售 國防部回應(yīng)

頭條要聞

美批準對臺逾111億美元軍售 國防部回應(yīng)

體育要聞

“惡龍”埃托奧,正在毀滅喀麥隆足球

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔心的事還是發(fā)生

財經(jīng)要聞

非法集資911億!"金融大鱷"終審被判無期

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

親子
本地
時尚
家居
公開課

親子要聞

金寶貝獲“2025年度綜合實力兒童教育品牌”引領(lǐng)科學早教創(chuàng)新實踐

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風骨

女友BELLA+封面 | Jimmy&Ohm:人生拼圖

家居要聞

高端私宅 理想隱居圣地

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版