国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

北大彭宇新團隊提出NS-Diff,使擴散模型學(xué)會流體與剛體力學(xué)

0
分享至



本文是北京大學(xué)彭宇新教授團隊在文本生成視頻領(lǐng)域的最新研究成果,相關(guān)論文已被 CVPR 2026 接收



  • 論文標(biāo)題:NS-Diff: Fluid Navier–Stokes Guided Video Diffusion via Reinforcement Learning
  • 論文鏈接:http://39.108.48.32/mipl/download_paper.php?fileId=202601
  • 開源代碼:https://github.com/PKU-ICST-MIPL/NS-Diff_CVPR2026
  • 實驗室網(wǎng)址:https://www.wict.pku.edu.cn/mipl

背景與動機

想象一下,當(dāng)你讓 AI 生成一段「牛奶倒入咖啡產(chǎn)生絲滑旋渦」的視頻時,卻發(fā)現(xiàn) AI 根本無法生成出你想要的「絲滑旋渦」。雖然如今的 Sora、Wan 等視頻生成模型已經(jīng)能做出如電影般華麗的畫面,但它們往往只是「畫皮難畫骨」—— 因為 AI 并不真正懂得現(xiàn)實世界的物理定律,導(dǎo)致生成的視頻經(jīng)常出現(xiàn)違背常識的「穿幫」鏡頭。

在物理世界中,液體的流動遵循著復(fù)雜的納維 - 斯托克斯(Navier-Stokes)方程,而剛體的運動則有著嚴(yán)謹(jǐn)?shù)能壽E規(guī)律。實現(xiàn)視頻生成從「視覺真實」向「物理真實」的跨越,是當(dāng)前 AIGC 領(lǐng)域的重大挑戰(zhàn)。

針對這一難題,北京大學(xué)彭宇新教授團隊提出了給擴散模型裝上「物理引擎」的新方案 ——NS-Diff。該研究將物理約束與強化學(xué)習(xí)相結(jié)合,通過物理動力學(xué)檢測器和物理條件注入模塊,讓 AI 像人類一樣在生成畫面的同時,腦子里還緊繃著一根「物理定律」的弦。

實驗表明,NS-Diff 將視頻中的運動急動度(jerk)誤差降低了 43%,流體發(fā)散度降低了 33%,使 AI 生成的每一幀畫面不僅好看,而且遵循物理規(guī)律。這一成果表明將經(jīng)典物理約束融入視頻生成大模型,是解決視頻生成中物理失真問題的有效途徑。

技術(shù)方案



圖 1. 物理引導(dǎo)的視頻生成強化學(xué)習(xí)框架 NS-Diff

本文提出了一種物理引導(dǎo)的視頻生成強化學(xué)習(xí)框架 NS-Diff,將物理約束融入視頻擴散過程中,以提升生成視頻的物理真實感。其主要貢獻包括:(1)噪聲魯棒的物理動力學(xué)檢測器:設(shè)計了可在含噪潛在幀中精準(zhǔn)分析運動信息的檢測器,實現(xiàn)對剛體與流體區(qū)域的有效區(qū)分。(2)物理條件潛在注入模塊:將速度場、形變梯度等關(guān)鍵物理信息編碼,并通過交叉注意力機制注入 DiT 去噪器,從而實現(xiàn)對生成過程的物理引導(dǎo)。(3)強化學(xué)習(xí)優(yōu)化模塊:引入強化學(xué)習(xí),通過策略梯度對流體施加簡化的納維 - 斯托克斯約束,對剛體施加最小化急動度(Jerk)原則,確保了視頻生成中動態(tài)過程的物理合理性。具體如下:

1. 噪聲魯棒的物理動力學(xué)檢測器

實現(xiàn)物理引導(dǎo)去噪的關(guān)鍵在于高噪聲環(huán)境下對運動和材料屬性的精準(zhǔn)估計。由于去噪過程在隱空間(latent space)中運行,直接在 RGB 幀上使用 ARFlow 是不可行的。為此,本文設(shè)計了一種結(jié)合隱空間解碼的運動估計方案,具體流程如下:

















2. 物理條件潛在注入









3. 物理引導(dǎo)的強化學(xué)習(xí)優(yōu)化















4. 物理引導(dǎo)的自適應(yīng)激活







實驗結(jié)果

1. 實驗設(shè)置

本文在 PhysVideoBench 以及 UCF-101(包含 13,320 個真實世界人類動作視頻)和 WebVid-10M(包含 1000 萬個帶有文本描述的互聯(lián)網(wǎng)視頻)。本文從物理合理性和視覺質(zhì)量兩個角度對本文方法進行評估。

(1)物理指標(biāo):



2)視覺指標(biāo):

  • VBench:綜合視頻質(zhì)量指標(biāo)。本文遵循 VideoJam 的方法計算視頻外觀和運動質(zhì)量。
  • Fréchet Video Distance(FVD):衡量真實視頻與生成視頻之間的分布距離。
  • Frame Consistency:相鄰幀的 CLIP 圖像嵌入之間的平均余弦相似度,反映了時間上的連貫性。

2. 對比實驗結(jié)果



表 1. PhysVideoBench 數(shù)據(jù)集結(jié)果

在 PhysVideoBench 上,NS-Diff 在所有指標(biāo)上均實現(xiàn)了最佳性能。通過潛空間注入(Latent Injection)以及 Jerk / 散度損失(Jerk/divergence losses)引入物理先驗,提升了運動的真實性,尤其是在剛體和流體區(qū)域。相比于在給定用戶外力情況下模擬剛體動力學(xué)的 PhysGen,NS-Diff 在不需要預(yù)定義外力或模擬的情況下實現(xiàn)了更好的泛化能力,同時保持了更高的保真度和更低的散度誤差。實驗表明,本文的方法將 Jerk 誤差降低了 43%,流體散度降低了 33%,并使 FVD 提升了 22.7%,實現(xiàn)了更高的物理合理性和視覺質(zhì)量。



表 2. UCF-101 數(shù)據(jù)集結(jié)果

在 UCF-101 基準(zhǔn)測試中,本文的 NS-Diff 模型表現(xiàn)出色。具體而言,NS-Diff DiT 1B 版本的 FVD 為 106,幀一致性(Frame Consistency)達到 0.94;而 NS-Diff DiT 11B 版本則進一步將 FVD 降低至 85,幀一致性提升至 0.95。這表明本文的方法不僅提升了運動的物理準(zhǔn)確度,還顯著增強了生成視頻的時間連貫性。



表 3. WebVid-10M 數(shù)據(jù)集結(jié)果

為了評估物理引導(dǎo)學(xué)習(xí)框架在受限基準(zhǔn)測試之外的開放世界場景中的泛化能力,本文在 WebVid-10M 數(shù)據(jù)集上進行了文本生成視頻(Text-to-Video)合成測試。實驗旨在測試物理約束(剛體 / 流體動力學(xué))在面對包含新穎物體交互和環(huán)境的未知文本描述時,是否仍能保持合理性。本方法在運動質(zhì)量(FVD)和文圖對齊(CLIPSIM)兩個指標(biāo)上均優(yōu)于 VideoFactory。



圖 2. 可視化對比結(jié)果

圖 2 展示了 NS-Diff 與 ModelScope、PhysGen、Wan2.1 以及 OpenSora2 的視覺效果對比。結(jié)果分析表明,本文方法生成的視頻在剛體和流體運動方面表現(xiàn)得更加真實,顯著減少了諸如物體無故出現(xiàn)或消失、以及非自然的拆分或合并等不符合物理規(guī)律的偽影。此外,本文方法還大幅提升了幀間一致性,在處理籃球投籃、火山熔巖流、玻璃破碎等物理密集型場景時,能夠比對比模型展現(xiàn)出更高的時間連貫性和運動可信度。

結(jié)論

本文提出了一種基于強化學(xué)習(xí)的物理引導(dǎo)視頻擴散框架 NS-Diff。該框架通過抗噪物理動力學(xué)檢測器,實現(xiàn)了對視頻潛空間中剛體與流體區(qū)域的精準(zhǔn)識別。利用物理條件潛空間注入技術(shù),速度場、變形梯度及材料掩碼被有效整合至去噪流程中。此外,本文方法通過強化學(xué)習(xí)優(yōu)化機制,將納維 - 斯托克斯方程與最小急動度(Minimum-Jerk)原則轉(zhuǎn)化為訓(xùn)練約束,強制模型遵循物理運動規(guī)律。實驗結(jié)果表明,NS-Diff 在 PhysVideoBench、UCF-101 等多個基準(zhǔn)數(shù)據(jù)集上超過現(xiàn)有方法,在顯著降低物理運動誤差的同時,確保了視覺生成質(zhì)量。研究表明,將經(jīng)典物理約束深度融合于生成模型,是解決視頻生成中物理失真問題的有效途徑。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
心源性猝死為何盯上年輕人?這些高危因素,你可能每天都在做

心源性猝死為何盯上年輕人?這些高危因素,你可能每天都在做

大象新聞
2026-03-25 15:49:04
鹽城一超市閉店賠償爭議:15年工齡為何被“一刀切”按13年算?

鹽城一超市閉店賠償爭議:15年工齡為何被“一刀切”按13年算?

鹽城市民網(wǎng)
2026-03-24 11:42:32
張雪峰離世,商業(yè)版圖被扒,北京房產(chǎn)被賤賣,巨額資金流向曝光

張雪峰離世,商業(yè)版圖被扒,北京房產(chǎn)被賤賣,巨額資金流向曝光

蕭獻記錄風(fēng)土人情
2026-03-25 17:00:54
2002年,李玟在拍攝MV時,一眼看中了安志杰,兩人迅速墜入愛河。

2002年,李玟在拍攝MV時,一眼看中了安志杰,兩人迅速墜入愛河。

南權(quán)先生
2026-03-25 15:29:14
油價調(diào)整:注意,預(yù)計下調(diào)25元/噸,油價暫擱淺!

油價調(diào)整:注意,預(yù)計下調(diào)25元/噸,油價暫擱淺!

金投網(wǎng)
2026-03-25 11:01:14
說劉亦菲美被放大的,看看她和中華小姐冠軍同框就懂了

說劉亦菲美被放大的,看看她和中華小姐冠軍同框就懂了

手工制作阿殲
2026-03-25 11:36:59
個人公眾號“千問”停更近10年,近期接連遭阿里投訴均被駁回,號主:規(guī)避風(fēng)險不發(fā)AI文章,如果我不發(fā)聲,賬號就不保了

個人公眾號“千問”停更近10年,近期接連遭阿里投訴均被駁回,號主:規(guī)避風(fēng)險不發(fā)AI文章,如果我不發(fā)聲,賬號就不保了

中國能源網(wǎng)
2026-03-25 13:53:05
電動車逆行被撞身亡,家屬索賠120萬,法院判司機擔(dān)責(zé)40%引熱議!

電動車逆行被撞身亡,家屬索賠120萬,法院判司機擔(dān)責(zé)40%引熱議!

漁夫說事
2026-03-25 16:35:06
電商平臺速效救心丸搜索量同比增30倍,品牌方工作人員:的確有增長,價格不會因張雪峰事件上漲

電商平臺速效救心丸搜索量同比增30倍,品牌方工作人員:的確有增長,價格不會因張雪峰事件上漲

極目新聞
2026-03-25 10:57:19
張雪峰去世,AC米蘭官方發(fā)文致哀!他曾說:卡卡轉(zhuǎn)會就像復(fù)旦生去了清華

張雪峰去世,AC米蘭官方發(fā)文致哀!他曾說:卡卡轉(zhuǎn)會就像復(fù)旦生去了清華

可樂談情感
2026-03-25 10:28:28
隨著朝鮮1-1,泰國2-2,西安邀請賽積分榜出爐:中國男足排名第一

隨著朝鮮1-1,泰國2-2,西安邀請賽積分榜出爐:中國男足排名第一

側(cè)身凌空斬
2026-03-25 21:41:35
弟子單節(jié)砍20分,杜鋒卻滿臉不悅,球迷:現(xiàn)場有人喊他下課

弟子單節(jié)砍20分,杜鋒卻滿臉不悅,球迷:現(xiàn)場有人喊他下課

弄月公子
2026-03-25 22:02:43
金融圈美女舉報領(lǐng)導(dǎo)猥褻,保安立功!網(wǎng)友:張雪峰說的都是真的

金融圈美女舉報領(lǐng)導(dǎo)猥褻,保安立功!網(wǎng)友:張雪峰說的都是真的

火山詩話
2026-03-25 14:04:48
很多中字頭工程局都發(fā)不出工資了!

很多中字頭工程局都發(fā)不出工資了!

黯泉
2026-03-25 21:14:53
課本為何沒講“田忌賽馬”后續(xù)?愚蠢的勝利,讓他幾年后自食其果

課本為何沒講“田忌賽馬”后續(xù)?愚蠢的勝利,讓他幾年后自食其果

談史論天地
2026-03-24 15:45:06
語出驚人!摩根大通CEO戴蒙稱,伊朗戰(zhàn)爭長期來看是好事!為什么這樣說?

語出驚人!摩根大通CEO戴蒙稱,伊朗戰(zhàn)爭長期來看是好事!為什么這樣說?

王爺說圖表
2026-03-25 18:51:12
張雪峰:如果你不好好學(xué)習(xí),一旦掉入社會底層,和一群沒有素質(zhì)的人混在一起.....

張雪峰:如果你不好好學(xué)習(xí),一旦掉入社會底層,和一群沒有素質(zhì)的人混在一起.....

山東教育
2026-01-27 11:38:18
公安部172號令落地:70歲駕照不再終身有效,2026年這些事必須辦

公安部172號令落地:70歲駕照不再終身有效,2026年這些事必須辦

小怪吃美食
2026-03-24 17:29:52
光明日報:“自干五”是社會主義核心價值觀的堅定踐行者

光明日報:“自干五”是社會主義核心價值觀的堅定踐行者

山間聽雨
2026-03-25 20:35:23
扒開張雪峰的家底才明白:他最厲害的不是報志愿,而是選對妻子

扒開張雪峰的家底才明白:他最厲害的不是報志愿,而是選對妻子

風(fēng)起見你
2026-03-25 10:40:24
2026-03-25 23:32:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12598文章數(shù) 142593關(guān)注度
往期回顧 全部

科技要聞

紅極一時卻草草收場,Sora宣布正式關(guān)停

頭條要聞

成都寶媽1年買5套"老破小"實現(xiàn)以租養(yǎng)貸:首付100多萬

頭條要聞

成都寶媽1年買5套"老破小"實現(xiàn)以租養(yǎng)貸:首付100多萬

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰經(jīng)搶救無效不幸去世 年僅41歲

財經(jīng)要聞

管濤:中東局勢如何影響人民幣匯率走勢?

汽車要聞

智己LS8放大招 30萬內(nèi)8系旗艦+全線控底盤秀實力

態(tài)度原創(chuàng)

教育
藝術(shù)
手機
數(shù)碼
軍事航空

教育要聞

2026年高校專項計劃填報攻略:這份99元的資料包,值不值?

藝術(shù)要聞

《百花譜》,這個春天畫花不用愁!

手機要聞

真我商城將于4月25日停止運營,業(yè)務(wù)全面整合至OPPO體系

數(shù)碼要聞

經(jīng)典風(fēng)味別樣演繹,華擎Z890 Taichi太極十周年紀(jì)念版主板亮相

軍事要聞

伊朗重申非交戰(zhàn)國家船只可安全通過霍爾木茲海峽

無障礙瀏覽 進入關(guān)懷版