国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

CVPR 2026|AI開始會拍電影了:一分鐘十鏡頭,全程不崩劇情

0
分享至



安照崇現(xiàn)為哥本哈根大學博士生,隸屬于 Pioneer Centre for Artificial Intelligence 和 ELLIS 項目,導師為 Serge Belongie 教授。他于 2023 年獲得蘇黎世聯(lián)邦理工學院(ETH Zurich)計算機科學碩士學位,導師為 Luc Van Gool 教授。他的研究方向主要包括三維理解、視頻生成以及多模態(tài)模型。

多鏡頭視頻生成是自然世界敘事的重要表達形式,也是視頻生成領域中一個挑戰(zhàn)性的研究方向。

與單鏡頭視頻不同,多鏡頭視頻并不是簡單地把幾個片段拼接起來,而是要求模型同時處理兩類信息:一類需要在不同鏡頭之間保持穩(wěn)定,例如人物身份、環(huán)境主體和故事主線;另一類則需要隨著敘事自然變化,例如視角切換、動作推進和場景轉(zhuǎn)場。

這一任務通??梢远x為:給定每個 shot 的 prompt,以及一個可選的初始圖像作為首幀條件,模型需要生成多個 shot,并同時維持跨 shot 的內(nèi)容一致性和對每個 shot prompt 的準確遵循。

這意味著,模型必須能夠持續(xù)維護長程的跨鏡頭上下文。然而,現(xiàn)有方法大致存在兩類局限:一類方法依賴固定窗口,在窗口內(nèi)同時生成多個 shot,但隨著窗口滑動,較早鏡頭的信息會被丟棄;另一類方法先生成各 shot 關鍵幀,再以關鍵幀為條件生成各 shot,但這樣限制了 shot 間交互,難以有效傳遞 shot 內(nèi)更復雜的敘事細節(jié)。

最近,來自 Meta 與 University of Copenhagen 的研究者提出了 OneStory: Coherent Multi-Shot Video Generation with Adaptive Memory(收錄于 CVPR 2026)。



論文地址:https://arxiv.org/pdf/2512.07802

這項工作聚焦于一個核心問題:如何在生成多鏡頭視頻時,有效保留長程跨鏡頭上下文,從而實現(xiàn)更強的敘事一致性。其核心思路,是為多鏡頭視頻生成建立一種全局但緊湊的跨鏡頭記憶機制。



圖 1 OneStory 可生成分鐘級、十鏡頭的長視頻故事,在復雜敘事推進過程中保持人物與場景的一致性;同時統(tǒng)一支持 image-to-multi-shot 與 text-to-multi-shot 兩種生成設置,并在 out-of-domain 場景中展現(xiàn)出良好的泛化能力。

OneStory 做了什么?



圖 2 OneStory 的訓練與推理流程示意圖。訓練階段,模型以前兩個 shot 為條件生成第三個 shot;推理階段,模型根據(jù)輸入 caption 按 shot-by-shot 的方式逐步生成多鏡頭視頻。

OneStory 首先將多鏡頭視頻生成重新表述為一個更自然的問題:next-shot generation。也就是說,模型不再一次性生成整段長視頻,而是像講故事一樣,基于前面已經(jīng)生成的鏡頭,生成下一個鏡頭(每個鏡頭同時生成)。這樣的設定實現(xiàn)了shot-by-shot的自回歸式多鏡頭生成。

與此同時,OneStory 以預訓練的 image-to-video 基礎模型作為初始化,因此可以自然繼承基礎模型本身強大的視覺條件生成能力。通過這樣的任務重構(gòu),OneStory 的第一個 shot 可以由用戶通過使用任一 text-to-video 或 image-to-video 模型得到,而后續(xù) shot 則由 onestory 根據(jù)輸入的shot prompt 逐步生成。

也正因如此,OneStory 能夠在同一個模型中統(tǒng)一支持text-to-multi-shot video和image-to-multi-shot video兩種生成方式。



圖 3 OneStory 中 Frame Selection 和 Adaptive Conditioner 的結(jié)構(gòu)示意圖。兩者共同實現(xiàn)了自適應記憶建模,從而支持全局但緊湊的跨鏡頭上下文表示,用于連貫的敘事生成。

在此基礎上,OneStory 設計了兩個關鍵模塊。

1. Frame Selection:找到真正相關的歷史 memory

并不是所有前序鏡頭對當前鏡頭的生成都同等重要。

例如,第 1 個鏡頭中出現(xiàn)主角,第 2 個鏡頭切換到配角,第 3 個鏡頭又回到主角。那么在生成第 3 個鏡頭時,第 1 個鏡頭往往比第 2 個鏡頭更關鍵?;谶@種跨鏡頭相關性不均等的現(xiàn)象,OneStory 引入了Frame Selection模塊,從所有歷史鏡頭中自動挑選出與當前鏡頭 prompt 在語義上最相關的一些幀,作為當前 shot 生成時的 memory。

這一設計不僅避免了固定窗口滑動帶來的遺忘問題,也使模型能夠真正構(gòu)建起全局的跨鏡頭上下文。



圖 4 與以往方法按時間順序機械分配 patchifier 不同,Adaptive Conditioner 根據(jù)內(nèi)容相關性動態(tài)分配不同粒度的 patchifier,從而更高效地利用跨鏡頭記憶。

2. Adaptive Conditioner:把 memory 壓縮成高效條件信息

僅僅 「記住」還不夠,如何高效地將這些歷史信息輸入生成器同樣關鍵。

OneStory 的Adaptive Conditioner會根據(jù) Frame Selection 模塊預測的重要性,對選中的歷史幀進行自適應patchification:更重要的信息保留更細粒度的表示,不那么關鍵的信息則被更強地壓縮。這樣一來,模型就在計算成本可控的前提下,將歷史上下文轉(zhuǎn)化為緊湊而有效的條件信號,并直接注入生成過程。



圖 5 多 shot 視頻數(shù)據(jù)收集流程

此外,論文沒有沿用「整段故事需要一個總腳本,再輔以分鏡頭定義」的數(shù)據(jù)構(gòu)建方式,而是僅保留分鏡頭 prompt,并將每個鏡頭寫成帶有前文指代關系的描述。這樣的數(shù)據(jù)形式更貼近真實的故事講述邏輯,也讓用戶的提示控制更加簡化。

實驗結(jié)果



圖 6 定性比較結(jié)果。OneStory 能夠更忠實地遵循 shot-level captions,生成在內(nèi)容和敘事上更加連貫的多鏡頭視頻。

各實驗表明,OneStory 能夠在復雜提示不斷變化的情況下持續(xù)推進敘事,同時保持人物和環(huán)境的一致性。論文中也提供了對 OneStory 在復雜敘事場景中的表現(xiàn)分析,包括:

  • 外觀變化下的人物一致性保持
  • 從大全景到局部特寫時的空間定位能力
  • 人與物體交互發(fā)展過程中的敘事延續(xù)能力

這些現(xiàn)象說明,OneStory 學到的并不只是表層的視覺連續(xù)性,而更接近于一種跨鏡頭敘事理解能力。

OneStory 的意義是什么?

如果說單鏡頭視頻生成解決的是「把一段畫面做出來」,那么多鏡頭視頻生成真正要解決的,就是「把一個故事講下去」。

OneStory 給出的答案是:不是一味拉長上下文窗口,也不是依賴單張關鍵幀,而是通過自適應記憶建模,在全局信息建模能力和計算效率之間找到平衡。它讓模型在跨鏡頭生成時,既能夠記住過去,又不會被冗余信息淹沒。

對于長視頻生成和可控世界模型而言,這是一條非常值得關注的方向,因為 OneStory 為視頻模型提供了一種有效的自適應 memory 管理機制,也為更長時程、更高一致性的視頻生成打開了新的可能。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
真膈應啊!一老人走了,鄰居發(fā)帖稱家門被貼了塊紅布,又懵又火大

真膈應??!一老人走了,鄰居發(fā)帖稱家門被貼了塊紅布,又懵又火大

火山詩話
2026-04-13 10:40:34
隨著深圳13連勝,遼寧80-75山東,CBA最新排名出爐!山東下滑第8

隨著深圳13連勝,遼寧80-75山東,CBA最新排名出爐!山東下滑第8

薇說體育
2026-04-13 22:17:58
中印糖尿病患者數(shù)量對比:印度有超2億糖尿病人,中國多少呢?

中印糖尿病患者數(shù)量對比:印度有超2億糖尿病人,中國多少呢?

悠悠說世界
2026-04-13 23:00:15
又一起吃他汀猝死!醫(yī)生再三提醒:春季吃他汀的人,要警惕這4點

又一起吃他汀猝死!醫(yī)生再三提醒:春季吃他汀的人,要警惕這4點

岐黃傳人孫大夫
2026-04-13 14:10:03
索賠2億!被捧為迅雷救世主的清華高材生,帶情婦卷1.7億跑路5年

索賠2億!被捧為迅雷救世主的清華高材生,帶情婦卷1.7億跑路5年

毒sir財經(jīng)
2026-04-03 23:02:02
70架軍機抵達以色列,又上當了,巴鐵大軍出動,戰(zhàn)爭隨時爆發(fā)

70架軍機抵達以色列,又上當了,巴鐵大軍出動,戰(zhàn)爭隨時爆發(fā)

咸魚金腦袋
2026-04-13 20:32:35
中蒙俄管道生變?托卡耶夫強勢插隊,蒙古國:不能讓哈國半路截胡

中蒙俄管道生變?托卡耶夫強勢插隊,蒙古國:不能讓哈國半路截胡

你笑的好甜美
2026-04-13 12:50:47
媽耶!《冰湖重生》評論區(qū)笑麻了哈哈哈哈,可惜了李昀銳

媽耶!《冰湖重生》評論區(qū)笑麻了哈哈哈哈,可惜了李昀銳

老吳教育課堂
2026-04-13 16:46:03
沒換過隊還能榜首!NBA官方公布本賽季球衣銷量榜,庫1詹5

沒換過隊還能榜首!NBA官方公布本賽季球衣銷量榜,庫1詹5

懂球帝
2026-04-13 22:48:15
央行:3月末廣義貨幣(M2)余額353.86萬億元 同比增長8.5%

央行:3月末廣義貨幣(M2)余額353.86萬億元 同比增長8.5%

財聯(lián)社
2026-04-13 17:04:12
知名時政記者爆料王石被抓,本人回應了

知名時政記者爆料王石被抓,本人回應了

財通社
2026-04-12 19:53:51
隨著穆帥率隊2-0,布拉加1-0,艾華卡3-1,葡超最新積分榜出爐

隨著穆帥率隊2-0,布拉加1-0,艾華卡3-1,葡超最新積分榜出爐

側(cè)身凌空斬
2026-04-13 03:34:18
iPhone 17 突然降價,4月12日,現(xiàn)貨開賣!

iPhone 17 突然降價,4月12日,現(xiàn)貨開賣!

科技堡壘
2026-04-12 11:43:16
中國肺癌發(fā)病率世界第一!提醒:罪魁禍首已揪出,7種食物要少吃

中國肺癌發(fā)病率世界第一!提醒:罪魁禍首已揪出,7種食物要少吃

健康之光
2026-03-23 20:10:05
在迪拜工作華人感慨:不要信媒體吹牛,迪拜相當于我國二線城市

在迪拜工作華人感慨:不要信媒體吹牛,迪拜相當于我國二線城市

福建睿平
2026-04-13 11:06:38
王珞丹現(xiàn)狀:搬進深山生活,母親不再催婚,41歲和兩只狗相依為命

王珞丹現(xiàn)狀:搬進深山生活,母親不再催婚,41歲和兩只狗相依為命

冷紫葉
2026-04-11 16:48:00
比亞迪財務總監(jiān)周亞琳,年薪1013.5萬元!比王傳福高近200萬元,成A股首位年薪破千萬的財務掌門人

比亞迪財務總監(jiān)周亞琳,年薪1013.5萬元!比王傳福高近200萬元,成A股首位年薪破千萬的財務掌門人

新浪財經(jīng)
2026-04-13 13:51:13
全紅嬋風波大結(jié)局!事件涉多位運動員,一人已被抓,處罰結(jié)果曝光

全紅嬋風波大結(jié)局!事件涉多位運動員,一人已被抓,處罰結(jié)果曝光

青杉依舊啊啊
2026-04-11 23:50:24
巴基斯坦國防部長:新一輪美伊談判將很快開始

巴基斯坦國防部長:新一輪美伊談判將很快開始

界面新聞
2026-04-13 21:21:31
特朗普封鎖霍爾木茲!想掐斷伊朗和中國的生命線?中國如何應對?

特朗普封鎖霍爾木茲!想掐斷伊朗和中國的生命線?中國如何應對?

老嘪科普
2026-04-13 20:58:57
2026-04-13 23:32:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12751文章數(shù) 142624關注度
往期回顧 全部

藝術要聞

22位中國當代名家油畫作品

頭條要聞

媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關系

頭條要聞

媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關系

體育要聞

一支球隊不夠爛,也是一種悲哀

娛樂要聞

初代“跑男團”合體,鄧超、鹿晗缺席

財經(jīng)要聞

談判未完全關閉?3國力促美伊重啟談判

科技要聞

"抄作業(yè)"近四年,馬斯克版微信周五上線

汽車要聞

不止命名更純粹 領克10/10+要做純電操控新王

態(tài)度原創(chuàng)

時尚
教育
健康
旅游
手機

會穿衣的女人有優(yōu)勢!衣服不圖多、展現(xiàn)曲線,大方高級又舒適

教育要聞

【教研幫扶】 廣東省教育研究院“走進粵東西北(湛江)教研幫扶活動”初中語文專場活動舉行

干細胞抗衰4大誤區(qū),90%的人都中招

旅游要聞

看見古村|貴州堯上古寨:古村新姿,山水人文載鄉(xiāng)愁

手機要聞

曝 iPhone Air還有第二代,你期待嗎?

無障礙瀏覽 進入關懷版