国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

智源研究院發(fā)布悟界Emu3.5,開啟多模態(tài)世界大模型新紀(jì)元

0
分享至

2025年10月30日,智源研究院在北京舉辦“悟界 · Emu系列技術(shù)交流會(huì)”,智源研究院院長(zhǎng)王仲遠(yuǎn)、多模態(tài)大模型負(fù)責(zé)人王鑫龍,發(fā)布了Emu3.5多模態(tài)世界大模型。這項(xiàng)工作的發(fā)布開啟了人工智能從語(yǔ)言學(xué)習(xí)向多模態(tài)世界學(xué)習(xí)演進(jìn)的新紀(jì)元,率先指明了多模態(tài) Scaling 的新范式。而Emu作為“悟界”系列模型的重要組成部分,標(biāo)志著AI正加速?gòu)臄?shù)字世界邁向物理世界的關(guān)鍵一步。



2024年10月,智源研究院發(fā)布了全球首個(gè)原生多模態(tài)世界模型Emu3,該模型只基于下一個(gè)token預(yù)測(cè),無(wú)需擴(kuò)散模型或組合方法,實(shí)現(xiàn)圖像、文本、視頻的大一統(tǒng)。模型一經(jīng)上線便在技術(shù)社區(qū)引發(fā)了熱議。

一年后,智源發(fā)布Emu3.5,在“Next-Token Prediction”范式的基礎(chǔ)上,模擬人類自然學(xué)習(xí)方式,以自回歸架構(gòu)實(shí)現(xiàn)了對(duì)多模態(tài)序列的“Next-State Prediction (NSP)”,獲得了可泛化的世界建模能力。



王仲遠(yuǎn)表示:“通過 Emu3 我們驗(yàn)證了自回歸架構(gòu)實(shí)現(xiàn)多模態(tài)理解與生成大一統(tǒng)的可行性,Emu3.5 則開啟了多模態(tài) Scaling 的新時(shí)代。更重要的是,它為通往更通用的、能夠理解并與物理世界交互的通用人工智能,提供了一條堅(jiān)實(shí)的、可度量的實(shí)踐路徑!

Emu3.5在超過 10 萬(wàn)億 token 的大規(guī)模多模態(tài)數(shù)據(jù)基礎(chǔ)上展開訓(xùn)練,其視頻數(shù)據(jù)訓(xùn)練量時(shí)長(zhǎng)實(shí)現(xiàn)從15年到 790年的躍升,參數(shù)量從8B上升至34B,揭示了原生多模態(tài)Scaling范式。其推理時(shí),創(chuàng)新性地提出“離散擴(kuò)散自適應(yīng)”(Discrete Diffusion Adaptation,DiDA)技術(shù),這一高效的混合推理預(yù)測(cè)方法,可以在不犧牲性能的前提下,將每張圖片的推理速度提升了近 20 倍,首次使自回歸模型的生成效率媲美頂尖的閉源擴(kuò)散模型。

王鑫龍介紹:“EMU3.5突破了原生多模態(tài)的大規(guī)模預(yù)訓(xùn)練、大規(guī)模強(qiáng)化學(xué)習(xí)和高效推理,指出了多模態(tài)世界模型的一種簡(jiǎn)單易擴(kuò)展的Scaling范式。”

EMU3.5 模型開始具備學(xué)習(xí)現(xiàn)實(shí)世界物理動(dòng)態(tài)與因果的能力,為探索通用世界模型奠定了堅(jiān)實(shí)的基礎(chǔ)。它具備三大重要特點(diǎn)。一是從意圖到規(guī)劃,模型能夠理解高層級(jí)的人類意圖(如“如何制作一艘宇宙飛船”“如何做咖啡拉花”),并自主生成詳細(xì)、連貫的多步驟行動(dòng)路徑。二是動(dòng)態(tài)世界模擬,模型在統(tǒng)一框架內(nèi)無(wú)縫融合了對(duì)世界的理解、規(guī)劃與模擬,能夠預(yù)測(cè)物理動(dòng)態(tài)、時(shí)空演化和長(zhǎng)時(shí)程因果關(guān)系。三是可成為泛化交互基礎(chǔ):其涌現(xiàn)出的因果推理和規(guī)劃能力,為 AI 與人類及物理環(huán)境進(jìn)行泛化交互(如具身操控)提供了關(guān)鍵的認(rèn)知基礎(chǔ)。

這些特點(diǎn)這讓新一代世界模型具備從“理解”到“行動(dòng)”的全面智能能力,可生成行動(dòng)指南、進(jìn)行圖文編輯,并且同時(shí)具備物理直覺可開展多場(chǎng)景的探索。



Emu3.5 能以精準(zhǔn)可控的方式完成文圖生成



展現(xiàn)出基于視覺理解的圖像生成能力

Emu3.5 的多模態(tài)指導(dǎo)能力:輸入“如何做芹菜餃子”,模型輸出有步驟的圖文指導(dǎo)

Emu3.5 在多模態(tài)指導(dǎo)中展現(xiàn)出卓越的時(shí)序一致性與步驟推理能力,讓復(fù)雜任務(wù)的執(zhí)行過程一目了然。多模態(tài)敘事能力上,Emu 3.5能圍繞任意主題生成沉浸式的故事體驗(yàn),釋放無(wú)限想象力。此外模型可實(shí)現(xiàn)跨場(chǎng)景的具身操作,具備泛化的動(dòng)作規(guī)劃與復(fù)雜交互能力,并能在世界探索中保持長(zhǎng)距離一致性與可控交互,兼顧真實(shí)與虛擬的動(dòng)態(tài)環(huán)境,實(shí)現(xiàn)自由探索與精準(zhǔn)控制。



Emu 3.5 能圍繞任意主題生成沉浸式的體驗(yàn),上面是宇航員在探索中遇到皮卡丘的故事



只需一句“疊衣服”的簡(jiǎn)單指令,Emu3.5便能自主規(guī)劃、拆解任務(wù),并精確生成機(jī)器人完成一整套復(fù)雜的折疊動(dòng)作



Emu3.5 能夠完成復(fù)雜的圖文編輯任務(wù):進(jìn)行時(shí)空變換后,依舊保持物體與場(chǎng)景的高度一致

同時(shí),圖文編輯方面,它既能通過自然語(yǔ)言實(shí)現(xiàn)任意指令的圖片編輯與時(shí)空變換,也能以精準(zhǔn)、智能、可控且富有創(chuàng)意的方式完成文圖生成,讓文字與視覺內(nèi)容的融合更加自然與高保真。在基準(zhǔn)測(cè)試中,Emu3.5 的表現(xiàn)超越了眾多知名的閉源模型。

王仲遠(yuǎn)總結(jié),以第一性原理看大模型未來(lái),我們相信AI的下一次躍遷,將來(lái)自模型對(duì)現(xiàn)實(shí)世界的深層表征與可泛化行動(dòng)指導(dǎo)的能力。我們期待與更多科研機(jī)構(gòu)與產(chǎn)業(yè)伙伴一起,開創(chuàng)多模態(tài)世界大模型新范式,探索通往AGI的演進(jìn)之路。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
為什么感覺美國(guó)在走向衰落?那是因?yàn)槟闶侵袊?guó)人

為什么感覺美國(guó)在走向衰落?那是因?yàn)槟闶侵袊?guó)人

扶蘇聊歷史
2025-12-19 10:02:54
南昌起義中,朱德是第九軍副軍長(zhǎng),那軍長(zhǎng)是誰(shuí)?建國(guó)后擔(dān)任何職?

南昌起義中,朱德是第九軍副軍長(zhǎng),那軍長(zhǎng)是誰(shuí)?建國(guó)后擔(dān)任何職?

方圓文史
2025-12-25 16:06:56
伊朗媒體:“大量人員”在騷亂中死亡

伊朗媒體:“大量人員”在騷亂中死亡

揚(yáng)子晚報(bào)
2026-01-11 20:22:41
有點(diǎn)小摩擦,馬卡:亞馬爾在場(chǎng)上質(zhì)問赫伊森是否瘋了

有點(diǎn)小摩擦,馬卡:亞馬爾在場(chǎng)上質(zhì)問赫伊森是否瘋了

懂球帝
2026-01-12 07:50:14
終于快復(fù)出了!官宣趙繼偉通過體測(cè),期待調(diào)動(dòng)隊(duì)友解決進(jìn)攻問題!

終于快復(fù)出了!官宣趙繼偉通過體測(cè),期待調(diào)動(dòng)隊(duì)友解決進(jìn)攻問題!

籃球資訊達(dá)人
2026-01-12 13:25:23
蔡依林演唱會(huì)被舉報(bào)沖上熱搜,主辦方已發(fā)布嚴(yán)正聲明

蔡依林演唱會(huì)被舉報(bào)沖上熱搜,主辦方已發(fā)布嚴(yán)正聲明

韓小娛
2026-01-12 09:14:14
被3個(gè)孩子輪流養(yǎng)老后才發(fā)現(xiàn):人老了,房子和存款有多么重要

被3個(gè)孩子輪流養(yǎng)老后才發(fā)現(xiàn):人老了,房子和存款有多么重要

惟來(lái)
2026-01-11 13:14:27
解雇穆里尼奧后 費(fèi)內(nèi)巴切就奪冠 貢多齊首秀首球+冠軍+MVP

解雇穆里尼奧后 費(fèi)內(nèi)巴切就奪冠 貢多齊首秀首球+冠軍+MVP

智道足球
2026-01-11 16:50:16
1.12五百萬(wàn)基金|衛(wèi)星大爆發(fā)!A股大龍有大動(dòng)作!

1.12五百萬(wàn)基金|衛(wèi)星大爆發(fā)!A股大龍有大動(dòng)作!

龍行天下虎
2026-01-12 13:30:14
可控核聚變,開弓沒有回頭箭,不計(jì)成本沖刺,只能成功不能失敗

可控核聚變,開弓沒有回頭箭,不計(jì)成本沖刺,只能成功不能失敗

Thurman在昆明
2026-01-12 11:39:43
隨著國(guó)米2-2,AC米蘭1-1,拉齊奧1-0,意甲最新積分榜射手榜出爐

隨著國(guó)米2-2,AC米蘭1-1,拉齊奧1-0,意甲最新積分榜射手榜出爐

凌空倒鉤
2026-01-12 06:21:09
為啥唐氏兒“千人一面”?好像都長(zhǎng)得一模一樣?是什么原因引起的

為啥唐氏兒“千人一面”?好像都長(zhǎng)得一模一樣?是什么原因引起的

向航說(shuō)
2026-01-02 00:20:03
央視主持人文清現(xiàn)狀:胖到不敢認(rèn),在桂林陪讀,老公在澳洲當(dāng)院長(zhǎng)

央視主持人文清現(xiàn)狀:胖到不敢認(rèn),在桂林陪讀,老公在澳洲當(dāng)院長(zhǎng)

近史談
2026-01-12 14:00:30
伊朗宗教高層:若哈梅內(nèi)伊遭襲,將對(duì)美以發(fā)動(dòng)全球圣戰(zhàn)

伊朗宗教高層:若哈梅內(nèi)伊遭襲,將對(duì)美以發(fā)動(dòng)全球圣戰(zhàn)

桂系007
2026-01-12 00:23:38
你無(wú)意中發(fā)現(xiàn)過別人哪些秘密?網(wǎng)友:這不是我一個(gè)單身狗能看的

你無(wú)意中發(fā)現(xiàn)過別人哪些秘密?網(wǎng)友:這不是我一個(gè)單身狗能看的

帶你感受人間冷暖
2025-12-18 00:10:08
三位當(dāng)打國(guó)腳確定參加津門虎冬訓(xùn)時(shí)間!未來(lái)將挑大梁,值得期待

三位當(dāng)打國(guó)腳確定參加津門虎冬訓(xùn)時(shí)間!未來(lái)將挑大梁,值得期待

振剛說(shuō)足球
2026-01-12 13:41:00
伊拉克U23主帥:我們很難攻破中國(guó)隊(duì)球門,但攻破了泰國(guó)隊(duì)的

伊拉克U23主帥:我們很難攻破中國(guó)隊(duì)球門,但攻破了泰國(guó)隊(duì)的

懂球帝
2026-01-12 01:00:12
她是葉帥最后一任妻子,生下一雙兒女,現(xiàn)年96歲,孫女是知名歌星

她是葉帥最后一任妻子,生下一雙兒女,現(xiàn)年96歲,孫女是知名歌星

歷史龍?jiān)w
2026-01-10 08:55:08
600億抄底!美財(cái)長(zhǎng)的學(xué)生竟然收購(gòu)了中國(guó)萬(wàn)達(dá),難怪王健林會(huì)輸!

600億抄底!美財(cái)長(zhǎng)的學(xué)生竟然收購(gòu)了中國(guó)萬(wàn)達(dá),難怪王健林會(huì)輸!

蜉蝣說(shuō)
2026-01-11 17:51:23
柬埔寨鐵籠拉人后續(xù)!警方已找到三輪車主,籠子是買來(lái)養(yǎng)動(dòng)物的

柬埔寨鐵籠拉人后續(xù)!警方已找到三輪車主,籠子是買來(lái)養(yǎng)動(dòng)物的

夜深愛雜談
2026-01-11 20:24:26
2026-01-12 14:31:00
科技正能量 incentive-icons
科技正能量
科技改變世界,正能量科技媒體
2781文章數(shù) 19207關(guān)注度
往期回顧 全部

科技要聞

小米二手車價(jià)大跳水:SU7半年跌5萬(wàn)元

頭條要聞

臺(tái)媒:大陸在朱日和基地復(fù)制"總統(tǒng)府" 不可掉以輕心

頭條要聞

臺(tái)媒:大陸在朱日和基地復(fù)制"總統(tǒng)府" 不可掉以輕心

體育要聞

聰明的球員,不是教練教出來(lái)的

娛樂要聞

閆學(xué)晶:脫離群眾太久 忘了自己的根

財(cái)經(jīng)要聞

揭秘“穩(wěn)賺不賠”的代工項(xiàng)目騙局

汽車要聞

增配不加價(jià) 北京現(xiàn)代 第五代 勝達(dá)2026款上市

態(tài)度原創(chuàng)

旅游
本地
時(shí)尚
藝術(shù)
公開課

旅游要聞

哈爾濱“鉆石!崩寺p落日

本地新聞

云游內(nèi)蒙|“包”你再來(lái)?一座在硬核里釀出詩(shī)意的城

普通人就該照搬這些穿搭!衣服不用買太貴,自然耐看又舒適

藝術(shù)要聞

畫完這組畫,他抑郁了,后來(lái)自殺了

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版