国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

生成不遺忘,「超長時序」世界模型!北大EgoLCD長短時記憶加持

0
分享至


新智元報道

編輯:LRST

【新智元導讀】視頻生成模型總是「記性不好」?生成幾秒鐘后物體就變形、背景就穿幫?北大、中大等機構聯(lián)合發(fā)布EgoLCD,借鑒人類「長短時記憶」機制,首創(chuàng)稀疏KV緩存+LoRA動態(tài)適應架構,徹底解決長視頻「內容漂移」難題,在EgoVid-5M基準上刷新SOTA!讓AI像人一樣擁有連貫的第一人稱視角記憶。

隨著Sora、Genie等模型的爆發(fā),視頻生成正從「圖生動」邁向「世界模擬器」的宏大目標。

然而,在通往「無限時長」視頻生成的路上,橫亙著一只攔路虎——「內容漂移」(Content Drift)。

你是否發(fā)現(xiàn),現(xiàn)有的視頻生成模型在生成長視頻時,往往也是「金魚記憶」:前一秒還是藍色瓷磚,后一秒變成了白色墻壁;原本手里的杯子,拿著拿著就變成了奇怪的形狀;

對于第一人稱(Egocentric)視角這種晃動劇烈、交互復雜的場景,模型更是極其容易「迷失」。

生成長視頻不難,難的是「不忘初心」。

近日,來自北京大學、中山大學、浙江大學、中科院和清華大學的研究團隊,提出了一種全新的長上下文擴散模型EgoLCD,不僅引入了「類腦的長短時記憶」設計,還提出了一套全新的結構化敘事Promp方案,成功讓AI在生成長視頻時「記住」場景布局和物體特征。


論文地址:https://arxiv.org/abs/2512.04515

項目主頁:https://aigeeksgroup.github.io/EgoLCD

在EgoVid-5M基準測試中,EgoLCD在時間一致性生成質量上全面碾壓OpenSora、SVD等主流模型,向構建具身智能世界模型邁出了關鍵一步!


核心痛點

AI為什么會「失憶」?

在長視頻生成中,傳統(tǒng)的自回歸(AR)模型非常容易出現(xiàn)生成式遺忘。

這就像讓一個人蒙眼畫畫,畫著畫著就偏離了最初的構圖。對于第一人稱視頻(如Ego4D數(shù)據集)來說,劇烈的相機抖動和復雜的手物交互,讓這種「漂移」更加致命。

傳統(tǒng)的Transformer雖然有注意力機制,但面對長序列,計算量呈二次方爆炸根本存不下那么多歷史信息;而簡單的滑動窗口又會丟掉早期的關鍵信息。

EgoLCD (Egocentric Video Generation with Long Context Diffusion) 將長視頻生成重新定義為一個「高效且穩(wěn)定的內存管理問題」。


長短時記憶系統(tǒng) (Long-Short Memory)

EgoLCD 設計了一種類似人類大腦的雙重記憶機制:

長期記憶(Long-Term Sparse KV Cache):不再傻傻地緩存所有Token,而是利用稀疏注意力機制,只存儲和檢索最關鍵的「語義錨點」(比如房間的布局、關鍵物體的特征)。這不僅大大降低了顯存占用,還鎖死了全局一致性。

短期記憶(Attention+LoRA):利用LoRA作為隱式記憶單元,增強短窗口注意力的適應性,快速捕捉當前視角的劇烈變化(如手的快速移動)。

一句話總結:長期記憶負責「穩(wěn)」,短期記憶負責「快」。

記憶調節(jié)損失 (Memory Regulation Loss)

為了防止模型在訓練時「偷懶」,團隊設計了一種特殊的損失函數(shù)。它強制模型生成的每一幀,都要與從長期記憶庫中檢索到的「歷史片段」保持語義對齊。

這就像給AI戴上了一個「緊箍咒」,一旦它生成的畫面開始「胡編亂造」(漂移),Loss就會懲罰它,迫使它回歸原本的設定。

結構化敘事提示 (Structured Narrative Prompting, SNP)

EgoLCD拋棄了簡單的文本提示,采用了一種分段式的、包含時間邏輯的結構化劇本。

訓練時:使用GPT-4o生成極其詳盡的幀級描述,訓練模型將視覺細節(jié)與文字嚴格對應。

推理時:SNP充當「外部顯性記憶」,通過檢索前序片段的Prompt,引導當前片段的生成,確保故事線和視覺風格的連貫。

性能炸裂



為了公正地評測「不遺忘」的能力,研究團隊甚至專門開發(fā)了一套新指標——NRDP (Normalized Referenced Drifting Penalty),專門用來懲罰那些「虎頭蛇尾」、越往后質量越差的模型。

實驗結果顯示:

一致性碾壓:在NRDP-Subject(主體一致性)和NRDP-Background(背景一致性)上,EgoLCD取得了壓倒性優(yōu)勢,漂移率極低。

超越基線:相比SVD、DynamiCrafter和OpenSora等頂流模型,EgoLCD在EgoVid-5M基準上的CD-FVD(時序連貫性)和動作一致性指標均為最佳。

極長生成:展示了長達60秒的連貫視頻生成(如一名演講者從黃昏講到深夜),人物衣著、背景樓宇細節(jié)始終如一,沒有發(fā)生形變!

通往具身智能的「黑客帝國」

EgoLCD不僅僅是一個視頻生成模型,它更像是一個「第一人稱世界模擬器」。

通過生成長時程、高一致性的第一人稱視頻,EgoLCD能夠為具身智能(機器人)提供海量的訓練數(shù)據,模擬復雜的物理交互和長序列任務(如做飯、修理)。

正如Sora讓人們看到了世界模型的雛形,EgoLCD則讓「通過視頻教會機器人理解世界」的夢想,變得前所未有的清晰。

參考資料:

https://arxiv.org/abs/2512.04515

秒追ASI

?點贊、轉發(fā)、在看一鍵三連?

點亮星標,鎖定新智元極速推送!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
嫁法國老頭真相大白5個月后,41歲李宇春近況曝出,一點也不意外

嫁法國老頭真相大白5個月后,41歲李宇春近況曝出,一點也不意外

庸人自擾0607
2025-12-25 20:37:35
農村,光棍已經泛濫成災了

農村,光棍已經泛濫成災了

霹靂炮
2025-12-25 22:45:42
日本發(fā)現(xiàn)原版吳三桂反叛檄文,揭開降清原因:難怪清廷要抹黑他

日本發(fā)現(xiàn)原版吳三桂反叛檄文,揭開降清原因:難怪清廷要抹黑他

掠影后有感
2025-12-25 12:43:41
女孩打翻水杯事情升級!官媒出手,怒批家屬小題大做,獲網友力挺

女孩打翻水杯事情升級!官媒出手,怒批家屬小題大做,獲網友力挺

興史興談
2025-12-26 08:17:35
圣誕節(jié)集裝箱驚雷:中國貨船帶60個導彈坑出海,對手徹夜難眠

圣誕節(jié)集裝箱驚雷:中國貨船帶60個導彈坑出海,對手徹夜難眠

矚望云霄
2025-12-26 20:05:40
前TVB花旦被前未婚夫溫暖舉動感動,坦誠有被愛感覺:我覺得很甜蜜

前TVB花旦被前未婚夫溫暖舉動感動,坦誠有被愛感覺:我覺得很甜蜜

TVB劇評社
2025-12-26 18:03:06
新一輪下崗潮殺到?這4個行業(yè)最先被淘汰,看看你中招沒

新一輪下崗潮殺到?這4個行業(yè)最先被淘汰,看看你中招沒

老特有話說
2025-12-25 12:15:23
2020年,孫小果被執(zhí)行死刑,母親為救他搭進去20年刑期,圖什么?

2020年,孫小果被執(zhí)行死刑,母親為救他搭進去20年刑期,圖什么?

詩意世界
2025-12-16 11:00:03
中國最重要的“東西大動脈”,要來了

中國最重要的“東西大動脈”,要來了

國民經略
2025-12-26 11:47:35
南京這把火,直燒到了北京一位“通天“人物的心坎上

南京這把火,直燒到了北京一位“通天“人物的心坎上

鶴羽說個事
2025-12-24 15:00:47
2025年預計新出生人口780萬

2025年預計新出生人口780萬

我是健康磚家
2025-12-27 06:33:19
比“丑”更可怕的是“無效豪華”:很多農村自建房正陷入這個怪圈

比“丑”更可怕的是“無效豪華”:很多農村自建房正陷入這個怪圈

夢想的現(xiàn)實
2025-12-22 09:21:01
多地整治“世襲崗”,網友:都是交叉安置,換形式不變本質,為啥

多地整治“世襲崗”,網友:都是交叉安置,換形式不變本質,為啥

你食不食油餅
2025-12-25 23:38:53
胖東來13.8萬元喬丹簽名球衣已賣?客服:僅此一件樣品暫未出售,另有多款球衣已售罄,后續(xù)會更新其他球星球衣

胖東來13.8萬元喬丹簽名球衣已賣?客服:僅此一件樣品暫未出售,另有多款球衣已售罄,后續(xù)會更新其他球星球衣

極目新聞
2025-12-26 13:43:52
德云社高層大洗牌!1人上桌,1人換桌,1人下桌,王惠位列其中

德云社高層大洗牌!1人上桌,1人換桌,1人下桌,王惠位列其中

小小李娛
2025-12-26 19:40:39
啥情況?0分0分0分,3名后衛(wèi)全0分,45歲少帥,賽后猛夸對方后衛(wèi)

啥情況?0分0分0分,3名后衛(wèi)全0分,45歲少帥,賽后猛夸對方后衛(wèi)

金山話體育
2025-12-27 06:27:51
何晴閨蜜爆料許何14歲搬離許亞軍家真相,許何喪母后發(fā)消息給她

何晴閨蜜爆料許何14歲搬離許亞軍家真相,許何喪母后發(fā)消息給她

李健政觀察
2025-12-26 22:25:50
日本侵略中國時,這個地區(qū)竟然出兵24萬,幫助日本人打中國

日本侵略中國時,這個地區(qū)竟然出兵24萬,幫助日本人打中國

歷史圖鑒
2025-12-26 17:40:03
放假通知!大學、中小學2026寒假時間確定了,家長卻表示難以接受

放假通知!大學、中小學2026寒假時間確定了,家長卻表示難以接受

復轉這些年
2025-12-27 00:36:21
掘金森林狼裁判報告:唯一漏判森林狼吃虧 約基奇犯規(guī)華子遭無視

掘金森林狼裁判報告:唯一漏判森林狼吃虧 約基奇犯規(guī)華子遭無視

羅說NBA
2025-12-27 06:46:28
2025-12-27 09:43:00
新智元 incentive-icons
新智元
AI產業(yè)主平臺領航智能+時代
14191文章數(shù) 66399關注度
往期回顧 全部

科技要聞

2026年的特斯拉:電動車承壓,AI接棒

頭條要聞

國民黨內"大佬"王金平說自己是中國人 他的話值得玩味

頭條要聞

國民黨內"大佬"王金平說自己是中國人 他的話值得玩味

體育要聞

開翻航母之后,他決定親手造一艘航母

娛樂要聞

王傳君生病后近照變化大,面部浮腫

財經要聞

投資巨鱷羅杰斯最新持倉:只留四種資產

汽車要聞

兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

態(tài)度原創(chuàng)

親子
房產
家居
時尚
教育

親子要聞

2025年的溫暖瞬間:兩個月大的寶寶跟媽媽學比心

房產要聞

炸裂,三亞360億超級清單發(fā)布,又一批重大配套要來了!

家居要聞

格調時尚 智慧品質居所

推廣中獎名單-更新至2025年12月15日推廣

教育要聞

如何避免擁有一個土味十足的英文名?

無障礙瀏覽 進入關懷版