国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

當(dāng)AI開始“理解”空間:世界模型能否重新定義AI的未來?

0
分享至

在位于斯坦福大學(xué)附近的World Labs實(shí)驗(yàn)室內(nèi),李飛飛團(tuán)隊(duì)展示了這個(gè)令人驚訝的演示?!艾F(xiàn)在的AI系統(tǒng)能識(shí)別圖像、生成文本,但它們不理解世界是如何運(yùn)作的,”這位AI領(lǐng)域的先驅(qū)者解釋道,“如果一個(gè)機(jī)器人無法預(yù)測(cè)杯子從桌上掉下會(huì)發(fā)生什么,它就無法在真實(shí)世界中有效工作?!?/p>



11月12日,李飛飛創(chuàng)立的World Labs公司正式推出了其首款商用產(chǎn)品——世界模型Marble,引發(fā)了AI界的地震。這是世界模型競(jìng)賽中的一次重大加速,也可能是通向更通用人工智能的關(guān)鍵一步。

從識(shí)別到理解:世界模型為何成為AI圣杯?

在世界模型的學(xué)術(shù)論文中,有一個(gè)經(jīng)典例子:當(dāng)一個(gè)人類孩子看到積木塔被推倒,他不僅能描述眼前發(fā)生的現(xiàn)象,還能預(yù)測(cè)類似情況在其他物體上的結(jié)果——比如沙堡被踢倒,或者多米諾骨牌被推倒。

這種將物理規(guī)則抽象化、泛化的能力,正是當(dāng)前AI系統(tǒng)所缺乏的。

深度學(xué)習(xí)在過去十年取得了驚人進(jìn)步,但大多數(shù)系統(tǒng)仍停留在‘模式識(shí)別’層面,”一位國(guó)內(nèi)AI實(shí)驗(yàn)室負(fù)責(zé)人評(píng)價(jià)道,“它們可以識(shí)別貓、生成圖片,但并不真正理解貓有體積、有重量,會(huì)受到重力影響?!?/p>

世界模型的概念并非全新。早在2018年,DeepMind就提出了類似構(gòu)想,將其描述為“一種能夠理解環(huán)境動(dòng)態(tài)并預(yù)測(cè)未來的模型”。但直到最近,隨著算力增長(zhǎng)和理論突破,這一概念才從學(xué)術(shù)論文走向商業(yè)應(yīng)用。

李飛飛在采訪中闡述了她的愿景:“人類通過內(nèi)心模擬來理解世界。當(dāng)你看到烏云密布,你會(huì)預(yù)測(cè)可能要下雨;當(dāng)你看到一個(gè)人朝你揮手,你會(huì)預(yù)測(cè)他是在打招呼。這種預(yù)測(cè)能力是人類智能的核心?!?/p>



World Labs的創(chuàng)立正是為了將這一愿景變?yōu)楝F(xiàn)實(shí)。據(jù)TechCrunch報(bào)道,這家由李飛飛聯(lián)合創(chuàng)立的初創(chuàng)公司已籌集了大量資金,投資者包括硅谷頂級(jí)風(fēng)投和戰(zhàn)略技術(shù)公司。

Marble亮相:世界模型的首個(gè)商業(yè)產(chǎn)品有何不同?

Marble作為World Labs的首個(gè)商業(yè)產(chǎn)品,展示了世界模型技術(shù)的成熟度。與傳統(tǒng)的AI系統(tǒng)相比,Marble的核心突破在于其能夠從有限的視覺輸入中預(yù)測(cè)未來的場(chǎng)景狀態(tài)



在技術(shù)演示中,Marble展示了幾種令人印象深刻的能力:

物理預(yù)測(cè):給定一個(gè)簡(jiǎn)單場(chǎng)景——如桌面上擺放的積木,Marble能夠準(zhǔn)確預(yù)測(cè)如果推動(dòng)其中一塊積木,整個(gè)結(jié)構(gòu)將如何反應(yīng)。更驚人的是,它能夠處理訓(xùn)練數(shù)據(jù)中未見過的新形狀物體。

不確定性量化:與給出單一預(yù)測(cè)的傳統(tǒng)模型不同,Marble能夠明確表示預(yù)測(cè)中的不確定性。當(dāng)場(chǎng)景模糊或結(jié)果具有多種可能性時(shí),模型會(huì)給出概率分布,而非武斷的單一答案。

多時(shí)間尺度推理:Marble能夠進(jìn)行從幾毫秒到幾分鐘不同時(shí)間跨度的預(yù)測(cè),適應(yīng)不同應(yīng)用場(chǎng)景的需求。

“Marble不是另一個(gè)生成漂亮視頻的工具,”World Labs CTO強(qiáng)調(diào),“它是理解世界因果結(jié)構(gòu)的嘗試。當(dāng)我們展示一個(gè)球從桌上滾落時(shí),Marble不僅預(yù)測(cè)球會(huì)掉下去,還理解這是因?yàn)橹亓ψ饔?,并且能夠?qū)⑦@一理解推廣到其他類似場(chǎng)景?!?/p>



從已公布的技術(shù)細(xì)節(jié)來看,Marble很可能建立在視覺-語言聯(lián)合表征的基礎(chǔ)上。這意味著它不僅僅處理像素?cái)?shù)據(jù),還構(gòu)建了關(guān)于物體屬性、物理規(guī)則和因果關(guān)系的內(nèi)部表示。

全球?qū)嶒?yàn)室的世界模型已經(jīng)開始布局

World Labs并非唯一覬覦世界模型這一圣杯的玩家。在全球范圍內(nèi),一場(chǎng)無聲的競(jìng)賽早已展開。

OpenAI早在GPT-4時(shí)期就開始探索世界模型的集成。據(jù)泄露信息顯示,他們正在開發(fā)名為“Project Stella”的世界模型項(xiàng)目,旨在為下一代AI系統(tǒng)提供物理推理能力。

DeepMind作為世界模型的早期探索者,其最新產(chǎn)品“Genie”已能夠從單張圖像生成交互式環(huán)境。雖然目前主要應(yīng)用于游戲領(lǐng)域,但其技術(shù)框架具有向通用世界模型擴(kuò)展的潛力。

Meta則選擇了不同的路徑——通過超大規(guī)模視頻訓(xùn)練構(gòu)建隱式世界模型。Yann LeCun團(tuán)隊(duì)一直倡導(dǎo)自監(jiān)督學(xué)習(xí)路徑,認(rèn)為通過觀察海量視頻數(shù)據(jù),AI可以自發(fā)學(xué)習(xí)世界運(yùn)作的基本原理。

在中國(guó),字節(jié)跳動(dòng)、阿里巴巴百度等科技巨頭也紛紛布局相關(guān)研究。字節(jié)跳動(dòng)的AI Lab據(jù)傳正在開發(fā)專注于視頻預(yù)測(cè)的世界模型,而百度則更關(guān)注世界模型在自動(dòng)駕駛領(lǐng)域的應(yīng)用。蘑菇車聯(lián)將自己的MogoMind大模型,部署在了一套名為“AI網(wǎng)絡(luò)”的系統(tǒng)中。這個(gè)網(wǎng)絡(luò)并非存在于云端,而是像“神經(jīng)元”一樣,分布在城市道路的每一個(gè)智能基站、每一輛智能網(wǎng)聯(lián)汽車之中。MogoMind并非一個(gè)靜態(tài)的“地圖”,它是一個(gè)活的、會(huì)呼吸的“世界模型”。它實(shí)時(shí)吸收著每一輛車的行駛軌跡、每一條道路的擁堵狀況、每一個(gè)路口的信號(hào)燈狀態(tài),甚至每一滴雨、每一陣風(fēng)對(duì)路況的影響。它讓道路上的每一臺(tái)設(shè)備、每一輛車,都變成了一個(gè)能夠“理解”空間、參與協(xié)作的智能體。

世界模型已成為下一代AI競(jìng)爭(zhēng)的分水嶺,擁有強(qiáng)大世界模型的AI系統(tǒng),將可能在機(jī)器人、自動(dòng)駕駛、虛擬現(xiàn)實(shí)等需要與現(xiàn)實(shí)世界交互的領(lǐng)域建立決定性優(yōu)勢(shì)。

從實(shí)驗(yàn)室到市場(chǎng):世界模型能解決哪些實(shí)際問題?

世界模型看似抽象,但其商業(yè)應(yīng)用前景十分廣闊。Marble作為首款商用產(chǎn)品,瞄準(zhǔn)了幾個(gè)關(guān)鍵領(lǐng)域:

自動(dòng)駕駛:當(dāng)前自動(dòng)駕駛系統(tǒng)主要基于模式識(shí)別——識(shí)別車輛、行人、交通標(biāo)志。但如果遇到訓(xùn)練數(shù)據(jù)中未見過的情況,系統(tǒng)就容易失效。世界模型可以使自動(dòng)駕駛車輛理解物理規(guī)則,預(yù)測(cè)其他道路使用者的行為,從而提高在邊緣情況下的安全性。

機(jī)器人技術(shù):工業(yè)機(jī)器人在結(jié)構(gòu)化環(huán)境中表現(xiàn)出色,但 struggle 適應(yīng)動(dòng)態(tài)變化的環(huán)境。通過集成世界模型,機(jī)器人能夠預(yù)測(cè)自身動(dòng)作的后果,進(jìn)行更復(fù)雜的規(guī)劃和工作。

“想象一個(gè)家庭機(jī)器人看到水杯靠近桌邊,它應(yīng)該能預(yù)測(cè)水杯可能掉落,從而主動(dòng)將其推到安全位置,”一位機(jī)器人公司CEO描繪道,“這種預(yù)見性是目前機(jī)器人完全不具備的?!?/p>

醫(yī)療診斷:世界模型在醫(yī)療影像分析中也有潛力。通過理解人體器官隨時(shí)間的變化規(guī)律,AI可以更準(zhǔn)確地預(yù)測(cè)疾病 progression,為個(gè)性化治療提供參考。

娛樂與內(nèi)容創(chuàng)作:在游戲和影視行業(yè),世界模型可以創(chuàng)建更加逼真的物理模擬,生成符合物理規(guī)律的動(dòng)畫效果,大幅降低內(nèi)容制作成本。

工業(yè)數(shù)字孿生:世界模型能夠創(chuàng)建更加準(zhǔn)確的工業(yè)過程模擬,幫助企業(yè)優(yōu)化生產(chǎn)流程,預(yù)測(cè)設(shè)備故障。

值得注意的是,World Labs選擇了企業(yè)市場(chǎng)作為Marble的首發(fā)陣地,而非消費(fèi)者應(yīng)用。這一策略既反映了當(dāng)前技術(shù)成熟度的限制,也顯示了其對(duì)商業(yè)化路徑的清晰思考。

世界模型面臨的三座大山

盡管前景誘人,世界模型的發(fā)展仍面臨重大技術(shù)挑戰(zhàn)。

復(fù)雜性挑戰(zhàn):真實(shí)世界的物理規(guī)則極其復(fù)雜。從剛性體動(dòng)力學(xué)到軟物質(zhì)物理,從流體力學(xué)到空氣動(dòng)力學(xué),構(gòu)建一個(gè)統(tǒng)一的世界模型需要整合大量物理知識(shí)。更不必說還要模擬人類行為的社會(huì)規(guī)則和心理動(dòng)機(jī)。

計(jì)算成本:世界模型的訓(xùn)練和推理需要巨大的計(jì)算資源。實(shí)時(shí)預(yù)測(cè)高保真度視覺場(chǎng)景的未來狀態(tài),對(duì)目前最先進(jìn)的硬件也是嚴(yán)峻挑戰(zhàn)。

評(píng)估難題:如何評(píng)估世界模型的性能?與圖像分類或?qū)ο髾z測(cè)不同,世界模型的預(yù)測(cè)質(zhì)量難以用簡(jiǎn)單指標(biāo)衡量。一個(gè)預(yù)測(cè)可能在像素級(jí)別準(zhǔn)確,但語義級(jí)別錯(cuò)誤,反之亦然。

李飛飛在采訪中承認(rèn)這些挑戰(zhàn)的存在:“我們正在攀登一座高山,目前可能只到達(dá)了山腳。但每一步進(jìn)步都會(huì)開啟新的可能性?!?/p>

World Labs采用了一種務(wù)實(shí)策略——不追求一次性解決所有問題,而是聚焦特定領(lǐng)域的可行應(yīng)用,通過解決實(shí)際問題逐步改進(jìn)技術(shù)。

世界模型將把AI帶向何方?

世界模型的發(fā)展可能重新定義AI與人類的關(guān)系。

短期來看,世界模型將增強(qiáng)現(xiàn)有AI系統(tǒng)在復(fù)雜環(huán)境中的表現(xiàn)。從更可靠的自動(dòng)駕駛到更靈活的家庭機(jī)器人,這些進(jìn)步可能在3-5年內(nèi)改變多個(gè)行業(yè)。

中期來看,世界模型可能成為實(shí)現(xiàn)通用人工智能(AGI)的關(guān)鍵組件。理解世界運(yùn)作規(guī)律、能夠進(jìn)行因果推理的AI系統(tǒng),將更接近人類智能的核心特征。

長(zhǎng)期而言,世界模型可能改變?nèi)祟愓J(rèn)識(shí)世界的方式。就像望遠(yuǎn)鏡擴(kuò)展了我們對(duì)宇宙的認(rèn)識(shí),顯微鏡揭示了微觀世界,世界模型可能成為人類理解復(fù)雜系統(tǒng)的新工具——從氣候變化到經(jīng)濟(jì)發(fā)展,從疾病傳播到社會(huì)動(dòng)態(tài)。

這或許正是世界模型最令人興奮的前景:AI不僅能在已知任務(wù)中表現(xiàn)出色,還能將理解遷移到未知領(lǐng)域,像人類一樣靈活地適應(yīng)新環(huán)境。

世界模型競(jìng)賽的發(fā)令槍已經(jīng)響起,而李飛飛和她的團(tuán)隊(duì)無疑是最先沖出起跑線的選手之一。無論最終誰率先沖線,這場(chǎng)比賽的結(jié)果都將深刻塑造AI——乃至人類社會(huì)的未來。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
讓成長(zhǎng)發(fā)生:一條“AI+教育”落地的求真路

讓成長(zhǎng)發(fā)生:一條“AI+教育”落地的求真路

鋅刻度
2026-04-21 15:25:31
偉偉道來 | 伊朗為什么越來越強(qiáng)硬

偉偉道來 | 伊朗為什么越來越強(qiáng)硬

經(jīng)濟(jì)觀察報(bào)
2026-04-27 12:08:53
山西澤州發(fā)生重大刑事案件,33歲嫌犯潛逃,警方發(fā)布協(xié)查通報(bào)

山西澤州發(fā)生重大刑事案件,33歲嫌犯潛逃,警方發(fā)布協(xié)查通報(bào)

極目新聞
2026-04-27 17:56:03
匈牙利一夜變天:馬扎爾開啟全面清算!歐爾班往哪走?

匈牙利一夜變天:馬扎爾開啟全面清算!歐爾班往哪走?

大江看潮
2026-04-27 09:05:55
馬加爵死刑背后:女同學(xué)透露一個(gè)難以啟齒的秘密

馬加爵死刑背后:女同學(xué)透露一個(gè)難以啟齒的秘密

深度報(bào)
2026-04-27 22:10:57
羅永浩連發(fā)6個(gè)問句怒懟!俞敏洪反思“東方甄選多位主播離職”,有網(wǎng)友說“任何一個(gè)人遭遇羅永浩、董宇輝這種忘恩負(fù)義的小人都?jí)騿堋?>
    </a>
        <h3>
      <a href=魯中晨報(bào)
2026-04-27 17:56:12
快訊!巴拿馬海關(guān)新消息!

快訊!巴拿馬海關(guān)新消息!

故事終將光明磊落
2026-04-27 18:31:24
新規(guī)落地!5月1日起,飯局應(yīng)酬、私下轉(zhuǎn)賬全程監(jiān)管

新規(guī)落地!5月1日起,飯局應(yīng)酬、私下轉(zhuǎn)賬全程監(jiān)管

笑熬漿糊111
2026-04-28 00:05:09
米飯被點(diǎn)名!醫(yī)生直言:米飯冷凍24小時(shí),抗性淀粉翻倍控糖護(hù)腸

米飯被點(diǎn)名!醫(yī)生直言:米飯冷凍24小時(shí),抗性淀粉翻倍控糖護(hù)腸

路醫(yī)生健康科普
2026-04-26 19:55:03
大逆轉(zhuǎn)!希金斯4-9翻盤,13-12勝奧沙利文,晉級(jí)世錦賽8強(qiáng)

大逆轉(zhuǎn)!希金斯4-9翻盤,13-12勝奧沙利文,晉級(jí)世錦賽8強(qiáng)

懂球帝
2026-04-27 23:14:19
生氣到砸桿,吳宜澤13-11塞爾比進(jìn)世錦賽8強(qiáng),從沒見這么差的比賽

生氣到砸桿,吳宜澤13-11塞爾比進(jìn)世錦賽8強(qiáng),從沒見這么差的比賽

真理是我親戚
2026-04-28 00:29:51
華住會(huì)崩了,旗下酒店工作人員回應(yīng)

華住會(huì)崩了,旗下酒店工作人員回應(yīng)

現(xiàn)代快報(bào)
2026-04-27 21:50:07
費(fèi)東斌,非法收受他人財(cái)物,數(shù)額特別巨大

費(fèi)東斌,非法收受他人財(cái)物,數(shù)額特別巨大

新京報(bào)政事兒
2026-04-27 10:20:03
4200萬的“斷繳潮”:數(shù)字背后引發(fā)的思考?

4200萬的“斷繳潮”:數(shù)字背后引發(fā)的思考?

深度報(bào)
2026-04-26 22:46:57
村民匿名舉報(bào)企業(yè)污染 竟然第一時(shí)間被對(duì)方“精準(zhǔn)定位” 投訴人信息是怎樣被泄露的?

村民匿名舉報(bào)企業(yè)污染 竟然第一時(shí)間被對(duì)方“精準(zhǔn)定位” 投訴人信息是怎樣被泄露的?

閃電新聞
2026-04-27 15:49:56
李想稱理想L9 Livis比上汽大眾ID.ERA 9X至少領(lǐng)先兩代,大眾高管回應(yīng):理想僅價(jià)格和營(yíng)銷水平領(lǐng)先,我們絕不會(huì)自稱是“500萬內(nèi)最好”產(chǎn)品

李想稱理想L9 Livis比上汽大眾ID.ERA 9X至少領(lǐng)先兩代,大眾高管回應(yīng):理想僅價(jià)格和營(yíng)銷水平領(lǐng)先,我們絕不會(huì)自稱是“500萬內(nèi)最好”產(chǎn)品

魯中晨報(bào)
2026-04-27 11:28:06
教育迎來大洗牌!9月全國(guó)統(tǒng)一執(zhí)行,中小學(xué)徹底變天

教育迎來大洗牌!9月全國(guó)統(tǒng)一執(zhí)行,中小學(xué)徹底變天

戶外阿毽
2026-04-26 18:19:14
男子曝入職全球頂尖科技公司時(shí)突然被降薪20萬,拒offer后被嘲諷:你的愛國(guó)情懷不值20萬嗎

男子曝入職全球頂尖科技公司時(shí)突然被降薪20萬,拒offer后被嘲諷:你的愛國(guó)情懷不值20萬嗎

爆角追蹤
2026-04-27 14:54:06
姚高員辭去杭州市市長(zhǎng)職務(wù)

姚高員辭去杭州市市長(zhǎng)職務(wù)

澎湃新聞
2026-04-27 21:04:26
055大驅(qū)直接發(fā)射鷹擊-20,當(dāng)著七國(guó)的面開火,解放軍反制穩(wěn)控南海

055大驅(qū)直接發(fā)射鷹擊-20,當(dāng)著七國(guó)的面開火,解放軍反制穩(wěn)控南海

諦聽骨語本尊
2026-04-27 19:29:52
2026-04-28 04:16:49
山自 incentive-icons
山自
寫點(diǎn)有趣的。關(guān)注自動(dòng)駕駛和AI商業(yè)變革。
125文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實(shí)測(cè)出來了

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

體育要聞

人類馬拉松"破二"新紀(jì)元,一場(chǎng)跑鞋軍備競(jìng)賽

娛樂要聞

黃楊鈿甜為“耳環(huán)風(fēng)波”出鏡道歉:謠言已澄清

財(cái)經(jīng)要聞

Meta 140億收購(gòu)Manus遭中國(guó)發(fā)改委否決

汽車要聞

不那么小眾也可以 smart的路會(huì)越走越寬

態(tài)度原創(chuàng)

本地
親子
房產(chǎn)
公開課
軍事航空

本地新聞

云游中國(guó)|逛世界風(fēng)箏都 留學(xué)生探秘中國(guó)傳統(tǒng)文化

親子要聞

10歲女童確診胰腺癌,醫(yī)生怒問父母:怎能天天給孩子吃這些?

房產(chǎn)要聞

信號(hào)!海南商業(yè)版圖,迎來大變局!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗外長(zhǎng)折返伊斯蘭堡內(nèi)情披露

無障礙瀏覽 進(jìn)入關(guān)懷版