国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

StreamDiffusionV2: 將視頻生成從「離線生成」帶入「實時交互」

0
分享至



擴散生成模型的發(fā)展改變了實時視頻直播的內(nèi)容創(chuàng)作,一些基于圖片擴散模型的 AI 直播系統(tǒng)如 StreamDiffusion 和 StreamV2V 以其方便可控和快速響應(yīng)的特點被廣泛應(yīng)用。但是這些基于圖片擴散模型的方法時間一致性較差,而視頻擴散模型生成過程中的前后幀依賴關(guān)系提供了極佳的時間一致性。

最近的一些自回歸視頻生成研究能夠促使視頻生成的吞吐量接近「實時」 的目標(biāo),這使得在流式直播中應(yīng)用這些模型成為可能。

然而,一個被忽視的問題尚未得到解答:吞吐量達(dá)到「實時」表現(xiàn)但忽略延遲的系統(tǒng),能直接用于實時交互生成嗎?

近日,一項已經(jīng)被計算機系統(tǒng)頂級會議 MLSys 2026 接收的工作 StreamDiffusionV2,對這一問題進行了詳細(xì)討論并給出了解決方案。來自德克薩斯大學(xué)奧斯汀分校等機構(gòu)的研究者組成的團隊提出了一種無需訓(xùn)練、面向交互式直播的流式視頻生成系統(tǒng)。該系統(tǒng)可在多種類型 GPU 上穩(wěn)定運行,同時實現(xiàn)低延遲與高質(zhì)量生成。

StreamDiffusionV2 已全面開源,對個人用戶部署友好,在未應(yīng)用 TensorRT 或量化的情況下,能夠在僅配備雙卡 RTX 4090 的設(shè)備上穩(wěn)定 16 FPS 實時推理。其在 H100 上首幀延遲低于 0.5 秒,并在 4 卡設(shè)備上穩(wěn)定實現(xiàn) 14B 模型 58.28 FPS、1.3B 模型 64.52 FPS 的吞吐量。



  • 論文鏈接:https://arxiv.org/abs/2511.07399
  • 項目主頁:https://streamdiffusionv2.github.io/
  • 代碼鏈接:https://github.com/chenfengxu714/StreamDiffusionV2



圖 1 有限長度的批量視頻生成 vs. 該研究提出的流式低延遲的無限長度視頻生成

挑戰(zhàn):實時交互式生成的系統(tǒng)性瓶頸

最近,以 CausVid 和 Self-Forcing 等為代表的自回歸視頻生成模型(Auto-regressive Video Generation),在一定程度上維持了生成質(zhì)量的同時極大地加快了推理速度。

盡管這些方法亦能在離線模式下進行視頻到視頻(Video-to-video)生成,但其推理范式仍然難以直接適配實時直播場景。通過分析,研究團隊指出當(dāng)前方法面臨以下挑戰(zhàn):



圖 2 Baseline 視頻生成模型在 V2V 任務(wù)中的缺陷

  1. 實時 SLO 無法滿足:現(xiàn)有視頻擴散模型主要面向離線生成優(yōu)化,雖然提升了整體吞吐量,卻顯著拉高了首幀延遲,且難以滿足直播場景對每一幀嚴(yán)格時限和低抖動的服務(wù)級目標(biāo)(SLO)。
  2. 長時間生成中的時序漂移:主流視頻擴散系統(tǒng)在持續(xù)運行的直播場景中,內(nèi)容分布與用戶輸入會不斷變化,加劇了自回歸視頻生成模型的誤差累積,導(dǎo)致生成過程中出現(xiàn)風(fēng)格漂移和時間一致性退化。
  3. 高速動作下的畫面撕裂:現(xiàn)有模型多基于慢動作或平穩(wěn)運動數(shù)據(jù)訓(xùn)練,在面對快速鏡頭切換或劇烈運動時表現(xiàn)受限,生成中發(fā)生模糊、重影和動作撕裂等問題。
  4. 難以實現(xiàn)多 GPU 擴展:現(xiàn)有的序列并行帶來大量通信開銷抵消了計算的加速。在以單幀延遲為主導(dǎo)的實時負(fù)載下,無法擴展到多 GPU 并行推理。

綜上所述,這些挑戰(zhàn)表明,實時視頻擴散無法僅依賴離線生成范式的延伸,而亟需一種從系統(tǒng)層面重新設(shè)計、以實時約束為核心目標(biāo)的推理架構(gòu)。

深入分析:內(nèi)存帶寬約束導(dǎo)致的性能受限

為了對現(xiàn)有系統(tǒng)進行加速優(yōu)化,文章深入分析了當(dāng)前推理系統(tǒng)所處的性能瓶頸模式(Performance Regime):





圖 3 上圖:Roofline 模型分析不同批次大小和并行模式下的系統(tǒng)性能瓶頸;下圖:不同并行方式下的通信開銷。

先前雙向注意力 DiT 主要受計算能力限制,而在自回歸視頻生成中,尤其是低延遲的單幀 latent 參數(shù)下,因為需要加載長序列的 KV Cache,卻只對當(dāng)前輸入進行計算,使得內(nèi)存訪問開銷超過計算開銷,系統(tǒng)性能由內(nèi)存帶寬而非算力主導(dǎo)。

通過 Nsight Systems 等性能分析工具對實際推理過程中的內(nèi)存帶寬利用率、計算資源使用情況氣泡時間進行分析,并結(jié)合理論計算量與內(nèi)存訪問量估計,團隊驗證了當(dāng)前系統(tǒng)確實處于內(nèi)存帶寬受限(Memory-bound)的性能瓶頸狀態(tài)。

進一步地,序列并行(Sequence Parallelism)方法(如 Deepspeed-Ulysses 和 Ring-Attention)在推理中需要在每個 DiT Block 執(zhí)行一次跨設(shè)備通信,從而引入了顯著的通信開銷。通信過程本質(zhì)上也屬于數(shù)據(jù)搬運操作,與內(nèi)存訪問共同加劇了系統(tǒng)數(shù)據(jù)傳輸開銷。

上述發(fā)現(xiàn)促使作者從優(yōu)化內(nèi)存 - 計算平衡并降低并行推理通信開銷入手,構(gòu)建全新的流式視頻生成系統(tǒng)。

方法:算法與系統(tǒng)層面的聯(lián)合優(yōu)化

綜合前面對現(xiàn)有挑戰(zhàn)和性能瓶頸的分析,研究團隊從算法和系統(tǒng)兩方面給出了解決方案。



圖 4 系統(tǒng)的整體流程圖

算法層面:為了緩解長視頻生成下自回歸模型的誤差累計和風(fēng)格漂移的問題,文章引入 Sink-tokens 和動作感知的加噪機制,具體的方法如下:

  1. Sink-token 和滾動 KV Cache:早期生成的幀受誤差累計的影響小,故將其 KV 保持在 KV Cache 中作為 Sink-token 指導(dǎo)后續(xù)的生成。同時后續(xù)的 KV Cache 滾動更新,以實現(xiàn)無限長流式生成;
  2. 動作感知的動態(tài)加噪機制:根據(jù)相鄰幀之間的 L2 距離估計視頻的運動強度,并自適應(yīng)調(diào)整加噪比例。在運動劇烈時降低噪音以保留運動一致性,在運動較弱時提高噪音以提升生成質(zhì)量。



圖 5 動作程度估計和動態(tài)噪音策略示例

系統(tǒng)層面:在內(nèi)存帶寬受限情境下提升吞吐量,StreamDiffusionV2 采用了流水線化批量去噪策略,再將其擴展至模型網(wǎng)絡(luò)層的流水線并行,并加入了其他輔助的高效推理設(shè)計,具體內(nèi)容如下:

  1. SLO 感知的流水線化的批量去噪(Batch Denoising):采用流水線化批量去噪,將不同噪音程度的幀組成流水線并行處理,使得每次 DiT 推理都得到去噪完全的幀;同時使用 SLO 感知的 profiling 動態(tài)確定批處理規(guī)模和調(diào)度參數(shù);
  2. 模型網(wǎng)絡(luò)層的流水線并行(Pipeline Parallelism):將 DiT 的多 GPU 流水線并行推理結(jié)合分片批量去噪,實現(xiàn)穩(wěn)定的逐幀生成;利用異步通信使計算和通信重合,并引入 DiT 層調(diào)度器平衡不同設(shè)備開銷,以緩解流水線氣泡,提升系統(tǒng)整體吞吐量。



圖 6 批量去噪和流水線并行示意圖


https://mp.weixin.qq.com/s/dIhwxHZ_zbaZBFC-vECPEA

視頻 1 并行推理示例動畫

通過這樣的協(xié)同設(shè)計,StreamDiffusionV2 系統(tǒng)實現(xiàn)了高效、穩(wěn)定的流式生成,并通過 Cache 機制來保證時間一致性和生成質(zhì)量。

實驗結(jié)果

StreamDiffusionV2 論文實現(xiàn)了低延遲和高吞吐的平衡,具體效果如何,一圖勝千言!



圖 7 不同設(shè)置下吞吐量結(jié)果,1.3B 模型,H100 和 4090 顯卡



圖 8 不同設(shè)置下吞吐量結(jié)果,14B 模型,H100 顯卡





圖 9 上圖:第一幀時間對比,體現(xiàn)了 StreamDiffusionV2 的低延遲優(yōu)勢;下圖:系統(tǒng)端到端延遲統(tǒng)計分布圖,StreamDiffusionV2 有著緊密分布,低抖動,并達(dá)到亞秒級實時應(yīng)用要求。

與此同時,該系統(tǒng)同時也在實現(xiàn)了穩(wěn)定的高質(zhì)量生成,擁有良好的時間一致性,并對復(fù)雜 prompt 有著更好的適應(yīng)。


https://mp.weixin.qq.com/s/dIhwxHZ_zbaZBFC-vECPEA

視頻 2 Video-to-video 生成結(jié)果對比。從左至右,從上到下,分別為原視頻、StreamDiffusion、CausVid,以及 StreamDiffusionV2。


https://mp.weixin.qq.com/s/dIhwxHZ_zbaZBFC-vECPEA

視頻 3 實際場景交互式生成應(yīng)用實例

總結(jié)與展望

StreamDiffusionV2 彌合了離線視頻擴散與實時直播之間長期存在的系統(tǒng)鴻溝。使高質(zhì)量生成式直播首次具備工程可行性。





圖 10 上圖:計算設(shè)備的計算能力和內(nèi)存帶寬變化趨勢,內(nèi)存帶寬的增長速度更慢;下圖:自回歸視頻生成模型,計算和內(nèi)存操作開銷比例隨輸入幀序列長度的變化趨勢。

進一步地,這一工作順應(yīng)了硬件與算法發(fā)展的長期趨勢。由于 GPU 計算能力增長速度明顯超過顯存帶寬,自回歸推理正處于內(nèi)存訪問約束區(qū)域;與此同時,視頻生成算法不斷采用更高壓縮率與更結(jié)構(gòu)化的表示方式,也進一步加劇了推理階段的內(nèi)存訪問壓力。

在這樣的演進背景下,圍繞內(nèi)存訪問與實時約束進行系統(tǒng)級調(diào)度設(shè)計,將成為生成式服務(wù)的關(guān)鍵能力。

StreamDiffusionV2 提供的不僅是一套可運行的系統(tǒng)方案,更是一種面向未來實時生成場景的設(shè)計思路。

隨著生成模型持續(xù)擴展規(guī)模與應(yīng)用場景,這種以 SLO 為核心、以系統(tǒng)協(xié)同為驅(qū)動的流式推理架構(gòu),有望成為下一階段生成式直播基礎(chǔ)設(shè)施的重要方向。

作者介紹

本文作者來自德克薩斯大學(xué)奧斯汀分校、加州大學(xué)伯克利分校、Nunchaku AI、斯坦福大學(xué)、獨立研究者、First Intelligent、麻省理工學(xué)院以及 Shizuku AI。

該工作的主要研究由德克薩斯大學(xué)奧斯汀分校團隊完成,第一作者為博士生馮天瑞,通訊作者為助理教授徐晨豐。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
49歲翁帆突傳“喜訊”!喪夫5個月后高調(diào)露面,狀態(tài)好到出人意料

49歲翁帆突傳“喜訊”!喪夫5個月后高調(diào)露面,狀態(tài)好到出人意料

查爾菲的筆記
2026-03-16 19:12:07
中國排協(xié)官宣!15人集訓(xùn)名單公布,袁志接棒趙勇,江蘇女排大贏家

中國排協(xié)官宣!15人集訓(xùn)名單公布,袁志接棒趙勇,江蘇女排大贏家

跑者排球視角
2026-03-21 11:00:25
丹麥被爆擬炸毀機場跑道,以防美國入侵格陵蘭島

丹麥被爆擬炸毀機場跑道,以防美國入侵格陵蘭島

環(huán)球網(wǎng)資訊
2026-03-21 07:07:26
三分10中7!追平歷史紀(jì)錄!NBA星二代正式翻身

三分10中7!追平歷史紀(jì)錄!NBA星二代正式翻身

籃球教學(xué)論壇
2026-03-21 18:42:27
人到晚年才醒悟,每月3000退休金,別指望子女養(yǎng)老,親情也很現(xiàn)實

人到晚年才醒悟,每月3000退休金,別指望子女養(yǎng)老,親情也很現(xiàn)實

烙任情感
2026-03-20 16:50:09
大家有沒有莫名不喜歡一類長相?網(wǎng)友:面相這個東西,還真有學(xué)問

大家有沒有莫名不喜歡一類長相?網(wǎng)友:面相這個東西,還真有學(xué)問

另子維愛讀史
2026-03-20 21:45:48
美國動作巨星查克·諾里斯去世,享年86歲,曾與李小龍演對手戲

美國動作巨星查克·諾里斯去世,享年86歲,曾與李小龍演對手戲

界面新聞
2026-03-20 22:51:45
56歲許晴科技美后大回春!穿白色T恤裙+運動鞋,完全沒有大媽味

56歲許晴科技美后大回春!穿白色T恤裙+運動鞋,完全沒有大媽味

章眽八卦
2026-03-21 14:22:56
伊朗已無官員愿意與美國談判

伊朗已無官員愿意與美國談判

財聯(lián)社
2026-03-20 23:57:04
濮陽市人民政府駐上海聯(lián)絡(luò)處原主任翟俊尤接受紀(jì)律審查和監(jiān)察調(diào)查

濮陽市人民政府駐上海聯(lián)絡(luò)處原主任翟俊尤接受紀(jì)律審查和監(jiān)察調(diào)查

大象新聞
2026-03-21 16:05:06
潘石屹再次預(yù)判我國樓市!不出意外,未來3年,或迎來“三走向”

潘石屹再次預(yù)判我國樓市!不出意外,未來3年,或迎來“三走向”

巢客HOME
2026-03-19 19:55:03
太突然!老戲骨游飆猝逝,終年57歲!

太突然!老戲骨游飆猝逝,終年57歲!

地理三體說
2026-03-20 22:43:04
4年減少771萬人!影響,開始顯現(xiàn)了

4年減少771萬人!影響,開始顯現(xiàn)了

西部城市
2026-03-20 20:31:44
上將被查、院士被除名,這背后釋放的信號,比你想的更不簡單

上將被查、院士被除名,這背后釋放的信號,比你想的更不簡單

李昕言溫度空間
2026-03-19 22:56:18
毀三傷二!伊朗突襲科威特基地,五架“臺風(fēng)”戰(zhàn)機遭重創(chuàng)

毀三傷二!伊朗突襲科威特基地,五架“臺風(fēng)”戰(zhàn)機遭重創(chuàng)

武器縱論
2026-03-21 15:47:05
一票否決!歐盟內(nèi)部集體暴怒,德國總理當(dāng)場發(fā)話:這事沒完

一票否決!歐盟內(nèi)部集體暴怒,德國總理當(dāng)場發(fā)話:這事沒完

書紀(jì)文譚
2026-03-21 15:12:21
普京等到了!7艘油輪集體掉頭,對華合同說撕就撕,中方為何不慌

普京等到了!7艘油輪集體掉頭,對華合同說撕就撕,中方為何不慌

福建平子
2026-03-20 11:37:23
一天只吃一餐飯!網(wǎng)傳東莞一大姐暫未找到工作,露宿公園引發(fā)關(guān)注

一天只吃一餐飯!網(wǎng)傳東莞一大姐暫未找到工作,露宿公園引發(fā)關(guān)注

火山詩話
2026-03-21 06:15:48
女子7年前買的泡泡瑪特盲盒才發(fā)貨:59元購入現(xiàn)在二手平臺只要20多,收貨時“以為發(fā)錯了”,工作人員稱平臺之前不完善

女子7年前買的泡泡瑪特盲盒才發(fā)貨:59元購入現(xiàn)在二手平臺只要20多,收貨時“以為發(fā)錯了”,工作人員稱平臺之前不完善

瀟湘晨報
2026-03-20 21:21:12
臺積電:我們已經(jīng)顧不上美國工廠了,大陸再不給稀土,大家都得完

臺積電:我們已經(jīng)顧不上美國工廠了,大陸再不給稀土,大家都得完

阿器談史
2026-03-21 10:55:46
2026-03-21 19:11:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12555文章數(shù) 142588關(guān)注度
往期回顧 全部

科技要聞

宇樹招股書拆解,人形機器人出貨量第一!

頭條要聞

伊朗發(fā)射3800公里射程的導(dǎo)彈 最令美軍戰(zhàn)栗的細(xì)節(jié)披露

頭條要聞

伊朗發(fā)射3800公里射程的導(dǎo)彈 最令美軍戰(zhàn)栗的細(xì)節(jié)披露

體育要聞

誰在決定字母哥未來?

娛樂要聞

CMG盛典獲獎名單:章子怡高葉同獲影后

財經(jīng)要聞

通脹警報拉響,加息潮要來了?

汽車要聞

小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

態(tài)度原創(chuàng)

手機
游戲
藝術(shù)
旅游
軍事航空

手機要聞

一代神機再續(xù)命!華為Mate40系列被曝Q2升級鴻蒙6.0!

《紅色沙漠》重磅內(nèi)幕!開發(fā)者怒噴:抄襲《塞爾達(dá)》

藝術(shù)要聞

這才是真正的法帖鼻祖!為書壇續(xù)命900多年

旅游要聞

山東日照:“鬧春?!睅Щ鸫喝锗l(xiāng)村游

軍事要聞

特朗普:正考慮逐步降級對伊朗的軍事行動

無障礙瀏覽 進入關(guān)懷版