網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

世界模型元年啟示錄：動機、亂戰(zhàn)與暗礁

2026-04-16 23:53:55　來源: 智械島

浙江舉報

分享至

出品 | 智械島

作者 | 霍如筠（北京）

4月16日，阿里巴巴發(fā)布了開放式世界模型Happy Oyster，騰訊開源了3D世界模型HY-World 2.0。

同一天，兩家中國互聯(lián)網(wǎng)巨頭宣示了自己在世界模型賽道上的存在感。

此前不到一個月，李飛飛的World Labs剛完成10億美元融資，Yann LeCun的AMI Labs更是以10.3億美元的種子輪震驚硅谷。

資本、巨頭、創(chuàng)業(yè)者蜂擁而入，一個響亮的口號迅速傳遍行業(yè)：世界模型是大語言模型之后最重要的賽道。

但如果你真的去問這些玩家“世界模型到底是什么”，很可能會得到一堆彼此矛盾的回答。

有人說是“可交互的3D世界”，有人說是“理解物理規(guī)律的因果模型”，有人說是“機器人訓練的數(shù)字仿真器”，還有人干脆說“就是更高級的視頻生成”。

這不是學術討論的分歧，而是整個賽道正在經(jīng)歷的認知混亂。

這篇文章試圖理清這場混亂。我們會從三個層層遞進的問題入手：為什么所有大廠突然都在押注世界模型？他們的產(chǎn)品到底在做什么，哪些是實、哪些是虛？以及，那些被光環(huán)掩蓋的困境和模糊地帶，究竟有多深？

一、為什么突然All in世界模型？

要理解世界模型為何突然爆火，得先回到大語言模型的一個尷尬事實。

過去兩年，ChatGPT們展示了驚人的語言能力，也暴露了一個致命短板：它們不懂物理世界。

你問一個LLM“把杯子從桌子邊緣推下去會怎樣”，它能回答“杯子會掉到地上”，卻并不能真正理解重力、加速度、碰撞，它只是從訓練數(shù)據(jù)中記住了類似的句子。

2026年初的一項研究指出，幻覺不是數(shù)據(jù)問題，不是訓練問題，而是LLM架構的內(nèi)在缺陷。

這個缺陷在純文本任務中或許可以忍受，但當AI要進入真實世界：操控機器人、駕駛汽車、在工廠里作業(yè)，它就變成了一個無法繞過的坎，你不能讓一個自動駕駛模型“大概正確”地判斷前方障礙物，也不能讓一個工業(yè)機器人“差不多”地預測零件運動軌跡。

于是，一個更根本的需求浮出水面：我們需要一個能理解物理世界因果律的AI。

它不只要能說，還要能做；不只要看見，還要能預判。這就是世界模型被推到聚光燈下的根本原因。

大語言模型改變了人和信息的關系，而世界模型要改變的，是人和現(xiàn)實的關系。

過去兩年AI的商業(yè)化主要停留在信息處理，寫文案、做翻譯、生成代碼，但下一波增長引擎顯然在物理世界：具身智能、自動駕駛、智能制造。

這些場景的共同要求是：AI必須理解空間、預測動態(tài)、規(guī)劃動作。

所以，大廠押注世界模型，本質(zhì)上是在爭奪“后LLM時代”的技術制高點。誰先讓AI真正理解物理世界，誰就能在下一輪產(chǎn)業(yè)周期中占據(jù)主導。

國內(nèi)外玩家的打法截然不同。

美國那邊，DeepMind、World Labs、AMI Labs更像是在做基礎科學。

他們關心的是如何讓AI擁有像人類一樣的物理直覺和因果推理能力，商業(yè)化是遠期目標。Yann LeCun自己都承認，AMI的產(chǎn)品可能要幾年后才能看到。

中國則是另一番景象。阿里和騰訊幾乎在發(fā)布模型的同時就綁定了商業(yè)場景：Happy Oyster瞄準影視制作和游戲開發(fā)的付費用戶，HY-World 2.0直接輸出可導入Unity/UE的3D資產(chǎn)，做起了AI造世界的生意。

還有Sand.ai的VidMuse，圍繞音樂生成視頻這個細分場景，上線幾個月就做到了千萬美元級別的年收入。

中國團隊的邏輯很務實：世界模型首先得是一個能賺錢的產(chǎn)品。

這兩種路線沒有高下之分，但決定了各自的節(jié)奏和風險。美國團隊敢于押注十年后的突破，中國團隊則必須在一年內(nèi)看到回報。

問題是，當所有人都擠在同一個熱詞下喊口號時，局外人很難分清誰在做什么。

二、關于技術標準的拷問

花時間看完各家產(chǎn)品的介紹，你很可能會陷入更大的困惑。因為每個世界模型長得都不一樣，它們的底層邏輯甚至彼此矛盾。

先來看最反直覺的一派。Yann LeCun的AMI Labs走了一條很少有人敢跟的路，他們不認為AI需要生成逼真的畫面。

LeCun的JEPA架構刻意丟棄像素細節(jié)，只在抽象的隱空間里做預測。最新發(fā)布的LeWorldModel只有1500萬參數(shù)，單GPU幾小時就能訓練完，但規(guī)劃速度比傳統(tǒng)方法快了48倍。

缺點是，它的輸出人類看不懂，你不能“看到”它預測的未來，只能相信它算對了。

這是一個純粹的學術路線，離普通用戶很遠，但LeCun賭的是：真正的智能不需要模擬每一片樹葉的飄落，只需要理解“風會吹落樹葉”這個因果。

另一條路來自李飛飛的World Labs。李飛飛相信，智能必須建立在三維空間的顯式理解之上。她的Marble模型能從一張照片或一段文字生成一個可編輯、可導航的3D世界，用戶可以在里面自由移動視角。

World Labs還開源了渲染引擎Spark 2.0，讓普通瀏覽器都能流暢加載上億個3D點。

一個坦誠的評價是：Marble擅長重建空間的樣子，但對空間中會發(fā)生什么的理解還比較薄弱。

你可以走進它生成的房間，但你推不動里面的椅子，也打不翻桌上的杯子。它是一個靜態(tài)世界的復刻者，而不是動態(tài)物理的模擬器。

最熱鬧的陣營當屬生成派。谷歌的Genie 3、阿里的Happy Oyster、騰訊的HY-World 2.0都屬于這一類。

他們的邏輯是：只要生成的畫面足夠逼真、交互足夠流暢，物理規(guī)律自然會被學出來。

阿里在Happy Oyster里做了一個很有意思的功能叫導演模式，用戶可以在視頻播放的過程中隨時輸入文字指令，改變劇情走向、切換鏡頭角度。騰訊更務實，直接輸出可二次編輯的3D資產(chǎn)，讓游戲開發(fā)者可以導入Unity或UE引擎里直接用。

但這類產(chǎn)品有一個共同的軟肋：長時序一致性和物理準確性仍然不穩(wěn)定。

Genie 3的演示很驚艷，但幾分鐘后畫面就開始走樣。阿里的漫游模式目前只能支持1分鐘的連續(xù)位移，超過這個時間會發(fā)生什么？官方?jīng)]說。

騰訊的3D資產(chǎn)在單一場景下看起來不錯，但它的優(yōu)勢主要體現(xiàn)在場景完整度和對輸入圖片的遵循程度，這些都是“看起來像”的指標，而不是“物理上對”的指標。

最后還有一個特殊的玩家：英偉達。Cosmos平臺不生產(chǎn)世界模型，它生產(chǎn)“生產(chǎn)世界模型的工具”。

數(shù)據(jù)處理管線、視頻分詞器、預訓練基礎模型，全部免費開放下載。黃仁勛的算盤很清楚：無論哪條路線最終勝出，訓練和推理都需要英偉達的GPU。

這是最聰明的生意，不賭方向，只賭算力。

那么，這些世界模型哪些是名副其實的？一個關鍵的技術標準是：真正的世界模型必須是“動作條件化”的，也就是說，輸入一個動作，模型要能輸出世界狀態(tài)的變化。

你用鍵盤按“W”，畫面里的視角應該向前移動；你給機器人一個抓取指令，模型應該預測物體的位置變化。

按照這個標準，李飛飛的Marble就不太合格，用戶只能看，不能做。它更像一個3D重建工具，而不是世界模擬器。

谷歌的Genie 3和阿里的Happy Oyster雖然支持交互，但物理準確性存疑。騰訊的HY-World 2.0輸出的是靜態(tài)資產(chǎn)，本身就不涉及動態(tài)預測。

換句話說，目前市場上幾乎沒有一家達到了“完美物理世界模擬器”的標準。每家都在自己的能力范圍內(nèi)，選擇了一個可展示、可商業(yè)化的切入點。

這本身沒有錯，錯的是大家都在用“世界模型”這個模糊的大詞來包裝自己，讓外界誤以為他們已經(jīng)解決了所有問題。

三、那些被刻意回避的模糊地帶

只讀各家公司的新聞稿，會覺得世界模型已經(jīng)進入了規(guī)?；涞氐那耙梗恍┍缓雎缘募毠?jié)拼出了一幅截然不同的圖景。

數(shù)據(jù)問題首當其沖。訓練一個真正的世界模型，需要海量的“觀察、動作、結果”三元組，但現(xiàn)實中沒有這樣的現(xiàn)成數(shù)據(jù)集。

有人用游戲數(shù)據(jù)，動作標簽完美，但游戲里的物理是引擎模擬的，不是真實物理。

有人用人類第一人稱視頻，最接近真實世界，但視頻里沒有動作標簽，而且人的頭部運動和手部動作糾纏在一起，模型根本分不清是誰在動。

還有人用真實機器人遙操作數(shù)據(jù)，保真度最高，但采集一小時數(shù)據(jù)可能要花費數(shù)萬美元，根本跑不起來規(guī)模。

這意味著每個世界模型都有天生的“能力邊界”。

評估真空是另一個麻煩。你打開任何一家世界模型公司的官網(wǎng)，幾乎都能看到“登頂全球權威評測榜第一”的標語。

問題是，這些評測榜單本身就不成熟。有的側(cè)重視覺逼真度，有的側(cè)重物理準確性，有的側(cè)重任務完成率。一個在視覺榜單上拿第一的模型，可能在物理榜單上墊底。

這種標準的不統(tǒng)一，讓各家可以各說各話。普通人根本搞不清這到底是同一個榜單的不同類別，還是營銷話術的巧妙編排。

還有一個被刻意回避的“不可能三角”。

世界模型面臨三個相互制約的指標：空間尺度、視覺保真度、實時交互性。

你不可能同時做到“世界很大、畫面很清晰、交互很流暢”。李飛飛的Marble就是最好的例子：1.1版本畫質(zhì)好但空間范圍有限，1.1-Plus版本能生成大場景但畫質(zhì)發(fā)糊。

昆侖萬維的Matrix-Game 3.0能做到720P下40FPS的實時生成，但演示場景的風格和復雜度都很有限。

幾乎沒有產(chǎn)品會主動承認自己的短板，它們更傾向于展示最優(yōu)工況下的演示視頻，而把極限條件下的失敗藏起來。這種選擇性展示正在制造一個危險的泡沫。

最后，資本的狂歡也帶來了新的投機風險。

一個值得注意的現(xiàn)象是，資本從追捧“大廠老兵”轉(zhuǎn)向押注頂尖高校的年輕學者。逆矩陣科技的兩位創(chuàng)始人，一個98年、一個04年，來自北大，首輪融資超千萬美元。

他們的技術路線是“強化學習+世界模型”，目前只有論文，沒有產(chǎn)品。這不是說年輕人不行，而是說在范式混沌期，資本愿意為“定義下一代技術”的可能性支付極高的溢價。

但大多數(shù)這樣的實驗室項目，最終無法跨越“論文→產(chǎn)品”的鴻溝。Yann LeCun這樣的圖靈獎得主都承認商業(yè)化要等幾年，更何況是剛畢業(yè)的博士生？

四、結語

世界模型的目標，是讓AI能夠預測甚至干預物理世界。那么，如果AI的預測錯了，誰來承擔責任？

設想一個場景：一輛自動駕駛汽車的世界模型在仿真中“想象”出一個不存在的障礙物，導致車輛緊急剎車，被后車追尾。

這個鍋應該甩給算法工程師，還是仿真數(shù)據(jù)的提供方？

再設想：一個工業(yè)機器人的世界模型錯誤預測了零件的運動軌跡，撞壞了整條生產(chǎn)線。保險公司的理賠標準是什么？

更極端的場景：有人用世界模型生成了一個逼真的虛假3D災難視頻，在社交媒體上引發(fā)恐慌。平臺有沒有審核義務？法律如何界定這種“虛擬與現(xiàn)實混淆”的傷害？

這些問題，目前沒有任何一家公司、任何一個國家給出了清晰的答案。世界模型的倫理框架和法律邊界，遠遠落后于技術的發(fā)展速度。

當資本和媒體聚焦于“誰能造出最逼真的虛擬世界”時，一個更根本的問題被擱置了：我們真的準備好了嗎？

這或許才是世界模型賽道最被低估的變量。不是算力，不是數(shù)據(jù)，不是算法，而是責任。

聯(lián)系郵箱：Cogtopia@163.com

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

游戲行業(yè)裁員潮持續(xù)，近半數(shù)開發(fā)者因就業(yè)不穩(wěn)定考慮離職

IT之家 2026-04-19 09:18:07
0 跟貼 0
報告：30-50美元游戲成玩家新首選價位

IT之家 2026-04-19 08:58:07
0 跟貼 0

π0.7來了！涌現(xiàn)出組合泛化、跨本體遷移能力，VLA又行了？

機器之心Pro 2026-04-17 18:23:23
0 跟貼 0

直播預約 | 世界模型，點燃下一個AI爆點（第二期）

機器之心Pro 2026-04-17 14:42:05
0 跟貼 0
當機器人在路上突然向男子跑去，男子害怕地趕忙從電車上跑了下去

歡趣速遞 2026-04-18 11:42:09
1 跟貼 1

日本游客暴漲中國游客暴跌！背后三大邏輯

春天來了啊 2026-04-18 09:06:26
0 跟貼 0

倫理防線不可靠！分布偏移誘導，大模型進入暗黑模式

新智元 2026-04-18 18:17:38
0 跟貼 0
機器人參賽馬拉松，程序員抱著電腦猛追

BRTV新聞 2026-04-19 03:18:13
4 跟貼 4

智元機器人，要做AI大模型平臺和開放生態(tài)

36氪 2026-04-18 10:05:08
1 跟貼 1
Agent2World來了，把世界模型做成可運行的符號環(huán)境

機器之心Pro 2026-02-02 15:24:04
0 跟貼 0
爸爸分享開學后的生活軌跡，不是在接孩子就是在接孩子的路上

樂活萌探 2026-04-18 12:01:36
1 跟貼 1
北約30國駐布魯塞爾大使集體訪日日本外務?。汉币?/a>

參考消息 2026-04-18 17:59:50
11103 跟貼 11103
北京馬拉松名場面，本以為是人類操控機器，下一秒機器人直接把操作員“甩飛”

觀象視頻 2026-04-16 18:04:40
2770 跟貼 2770
解放軍護衛(wèi)艦與外艦纏斗20小時細節(jié)披露

上觀新聞 2026-04-18 12:26:59
12516 跟貼 12516
偶遇程序員追著機器人跑，終于明白學計算機要體測的原因了

遼寧老年報全搜索 2026-04-19 01:29:00
0 跟貼 0
伊朗就霍爾木茲海峽發(fā)表最新聲明多國回應

環(huán)球網(wǎng) 2026-04-18 14:18:01
6003 跟貼 6003
劉儀偉問機器人：你有男友？搞笑互動引熱議！

雪里溫柔z 2026-04-15 06:33:23
0 跟貼 0
當機器人遇上廣西三月三，穿上少數(shù)民族服飾起舞！

財經(jīng)時間官方 2026-04-18 18:31:42
0 跟貼 0
楊立昆發(fā)布史上最“輕”世界模型，單GPU可訓，規(guī)劃速度提升48倍

DeepTech深科技 2026-03-24 17:52:42
53 跟貼 53
十年過去，四位小花不同人生軌跡盤點

娛樂星環(huán) 2026-04-17 16:13:08
1 跟貼 1
女孩電車長時間沒騎充不上電，利用高中物理知識瘋狂轉(zhuǎn)動后輪激活

笑場速遞 2026-04-16 14:34:49
63 跟貼 63
打進=“自殺”火箭偏不信邪，極限操作原地封神，球迷看嗨了

左腳爆射得分 2026-04-16 12:05:32
0 跟貼 0
機器人穿上少數(shù)民族花裙在廣西街頭翩翩起舞動作絲滑

星辰視頻 2026-04-18 17:41:06
354 跟貼 354
編程智能體的隱藏bug，被上交IPADS團隊用數(shù)學邏輯給揪出來了

DeepTech深科技 2026-04-18 11:18:39
0 跟貼 0
這就是物理老師說的最快排水方法嗎”

大蒜脾氣大 2026-04-17 16:10:34
58 跟貼 58
從6D全彩芯片到物理AI，禾賽欲再定義激光雷達賽道

經(jīng)濟觀察報 2026-04-19 00:09:55
0 跟貼 0
π0.7發(fā)布，機器人迎來GPT-2時刻

智東西 2026-04-18 17:19:27
1 跟貼 1
張雪機車荷蘭站首回合正賽獲第四名

央視新聞客戶端 2026-04-18 21:11:59
9121 跟貼 9121
自動燒烤路子挺好用

清哥說片 2026-04-17 11:21:47
1 跟貼 1
這把應該春晚看的！機器人馬拉松

娛樂大爆炸v 2026-04-19 03:13:13
0 跟貼 0
Elephant走紅：AI開始為“Token浪費”算細賬

華爾街見聞官方 2026-04-17 16:51:57
0 跟貼 0
大S心聲揭秘：邏輯清晰背后的真實訴求

千山暮雪h 2026-04-18 00:59:01
5 跟貼 5
不用費心打理，告別冰冷機械感，它把溫柔陪伴做到了極致

Maxonor創(chuàng)意公元 2026-04-18 16:57:12
0 跟貼 0
悲痛！62歲頂級科學家張效信車禍去世，曾毅然放棄美國高薪綠卡回國，選擇報效祖國！

融煤資訊 2026-04-19 03:20:07
0 跟貼 0
智元發(fā)布人形機器人遠征A3 10小時長續(xù)航，開箱即用

甲子光年 2026-04-18 04:50:58
1 跟貼 1
中國人形機器人在波蘭街頭驅(qū)趕野豬，“勸退”成功后揮手告別

鳳凰衛(wèi)視 2026-04-16 12:00:15
0 跟貼 0
川崎 H2R模型摩托

制造科技 2026-04-16 21:58:46
12 跟貼 12
深度長文：跨越千年的追問，我們的世界是真實的嗎？

宇宙時空 2026-04-18 09:49:22
0 跟貼 0
國內(nèi)首個機器人特種兵，垂直鋼壁上飛檐走壁

極果酷玩 2026-04-16 14:37:05
0 跟貼 0
為什么再用力，繩子中間也會下垂？物理早已注定！

田一名sir 2026-04-15 03:04:53
1 跟貼 1

斯諾克戰(zhàn)報！4強專業(yè)戶轟7-2，肖國棟德比逆轉(zhuǎn)，張安達爆冷名將？

劉姚堯的文字城堡

2026-04-19 07:55:54

杜蘭特傷停，火箭VS湖人G1首發(fā)陣容出爐，東契奇?zhèn)鱽砗孟?>
</a>
<h3>
<a href=

世界體育圈

2026-04-19 08:40:43

智械島

在這里，人類和AI是島民。

22文章數(shù) 4關注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

藝術

家居

房產(chǎn)

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產(chǎn)30天

手機 / 數(shù)碼

房產(chǎn) / 家居

世界模型元年啟示錄：動機、亂戰(zhàn)與暗礁

一、為什么突然All in世界模型？

二、關于技術標準的拷問

三、那些被刻意回避的模糊地帶

LPL第二賽段：找回狀態(tài)，JDG成功讓一追二擊敗WBG

女子與情人在車上發(fā)生關系后被殺 還被灌農(nóng)藥偽造殉情

女子與情人在車上發(fā)生關系后被殺 還被灌農(nóng)藥偽造殉情

時隔25年重返英超！沒有人再嘲笑他了

劉德華回應潘宏彬去世，拒談喪禮細節(jié)

華誼兄弟，8年虧光85億

傳Meta下月擬裁8000 大舉清退人力為AI騰位

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態(tài)度原創(chuàng)

華為Pura X Max：被曝24日開賣！華為Pura 90：發(fā)售日成謎！

鄭麗文大陸之行引發(fā)熱議，孫中山贈對聯(lián)成焦點！

法式線條 時光靜淌

官宣簽約最強城更！?？跇鞘?，突然殺入神秘房企！

世界模型元年啟示錄：動機、亂戰(zhàn)與暗礁

一、為什么突然All in世界模型？

二、關于技術標準的拷問

三、那些被刻意回避的模糊地帶

LPL第二賽段：找回狀態(tài)，JDG成功讓一追二擊敗WBG

女子與情人在車上發(fā)生關系后被殺還被灌農(nóng)藥偽造殉情

女子與情人在車上發(fā)生關系后被殺還被灌農(nóng)藥偽造殉情

時隔25年重返英超！沒有人再嘲笑他了

劉德華回應潘宏彬去世，拒談喪禮細節(jié)

華誼兄弟，8年虧光85億

奇瑞威麟R08 PRO正式上市售價14.48萬元起

華為Pura X Max：被曝24日開賣！華為Pura 90：發(fā)售日成謎！

鄭麗文大陸之行引發(fā)熱議，孫中山贈對聯(lián)成焦點！

法式線條時光靜淌

官宣簽約最強城更！?？跇鞘?，突然殺入神秘房企！