国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

李飛飛最新長文:AI很火,但方向可能偏了

0
分享至

AI很會(huì)說話,但還不會(huì)理解世界。

前幾天,Google的Gemini 3 Pro發(fā)布,朋友圈瞬間刷屏。很多人都在感嘆:谷歌一出手,就知有沒有。下一代模型,是不是參數(shù)更多?能支持更長的上下文?照這么發(fā)展下去,是不是真的要實(shí)現(xiàn)AGI(通用人工智能)了?

但是,著名計(jì)算機(jī)科學(xué)家、美國國家工程院院士、斯坦福大學(xué)教授李飛飛卻不這么認(rèn)為。11月10日,她就發(fā)布了一則長文,系統(tǒng)闡述了她對目前AI大模型的看法??偨Y(jié)一下,大概是:

目前AI卷參數(shù),卷算法的方向,可能跑偏了。模型不理解世界,就實(shí)現(xiàn)不了真正的智能。

為什么這么說?什么又叫“理解世界”?這和我又有什么關(guān)系?

系統(tǒng)整理了一下我的理解,和你分享。

01

大語言模型,就像讀了很多書,但沒出過門的秀才

你一定知道ChatGPT,或者谷歌的Gemini。你也一定用過DeepSeek、豆包。這些產(chǎn)品背后的核心技術(shù),都是大語言模型(LLM)。

大語言模型做的事情,簡單來說,是“預(yù)測下一個(gè)詞是什么”。你問它,“床前明月光”,它就能預(yù)測,后邊幾個(gè)詞大概率是“疑是地上霜”。

靠著這種看似簡單的“接茬”能力,在吃下了大量數(shù)據(jù)之后,大模型已經(jīng)進(jìn)化到了驚人的地步。它能通過律師資格考試,也能做復(fù)雜的奧數(shù)題。

那,這樣子下去,是不是很快就有能自主學(xué)習(xí)、完成任務(wù)的通用人工智能了?

不一定。雖然語言大模型看上去很厲害,但如果問它一些特別簡單的問題,比如,這輛車離那棵樹有幾米?這個(gè)箱子能塞進(jìn)后備箱嗎?它卻大概率會(huì)瞎蒙,還會(huì)出現(xiàn)“杯子松手后飛上天”的情況。

它們雖然懂物理公式,卻不懂物理常識(shí)。對此,李飛飛打了個(gè)比方。大概意思是,大語言模型,就像黑暗中的秀才(wordsmiths in the dark)。

想象一下。有一位秀才,在一間黑屋子里,讀過一萬本關(guān)于蘋果的書。他知道,蘋果通常和“紅”、“甜”、“圓”出現(xiàn)在一起,他知道,蘋果的化學(xué)分子式,牛頓被蘋果砸中的故事。如果讓他寫一篇關(guān)于蘋果的論文,他寫得不比專家差。但是,如果你把一個(gè)真的蘋果遞到他手里,他卻不知道這是什么。

今天,語言大模型的“智慧”,本質(zhì)上靠的是語言的統(tǒng)計(jì)規(guī)律,而并非扎根現(xiàn)實(shí)。

這也解釋了,為什么你的AI助手,動(dòng)不動(dòng)就會(huì)“胡說八道”。因?yàn)?,如果AI只遵照語法通順,它完全可以認(rèn)為,太陽會(huì)從西邊升起。即便這在物理世界里,不可能發(fā)生。

它讀了萬卷書,卻從未行萬里路。

02

語言可以瞎編,但物理世界不會(huì)撒謊

那怎么辦?

李飛飛說,這就要讓AI,掌握“空間智能”了。

舉個(gè)例子。喝咖啡。

你的大腦在這一瞬間,會(huì)處理很多信息。你的眼睛,要判斷杯子和嘴邊的距離;你的手部肌肉,要根據(jù)杯子的重量,精確調(diào)整抓握的力度;你的皮膚,要感知杯壁的溫度,防止?fàn)C傷;你的手腕,要配合身體的傾斜,保持杯口的水平,防止咖啡灑出來。

在這個(gè)過程中,你用到語言了嗎?你有沒有在心里默念,把肱二頭肌收縮30%,手腕向左旋轉(zhuǎn)5度?沒有。整個(gè)過程,靠的是感知、想象、行動(dòng)。

這種“不通過語言,理解物理世界,和物理世界互動(dòng)的能力”,就是空間智能。

而李飛飛也認(rèn)為,有了空間智能加持的AI,才會(huì)通向真正的,智能。因?yàn)橹悄艿谋举|(zhì),是能在不確定的世界中持續(xù)預(yù)測、行動(dòng)、達(dá)成目標(biāo)。這不能靠大腦憑空產(chǎn)生。

舉個(gè)例子。嬰兒是怎么知道因果關(guān)系的?

他坐在地上,把積木推倒,積木嘩啦一下散落在了地上。他覺得好玩,又推了一次。又是嘩啦一聲。一次次的物理互動(dòng)中,他逐漸建立了一條神經(jīng)連接:把積木推倒,必然導(dǎo)致“嘩啦”一聲。邏輯的雛形,因此開始。

再舉個(gè)例子。沃森和克里克,是怎么發(fā)現(xiàn)DNA雙螺旋結(jié)構(gòu)的?

要知道,當(dāng)時(shí)他們手里,只有一張像是模糊的“X”的照片??窟@張照片,推導(dǎo)不出DNA結(jié)構(gòu)。


沒辦法,他們只好像搭積木的小孩一樣,用金屬棒和鐵絲,試圖復(fù)現(xiàn)DNA的空間結(jié)構(gòu)。直到某個(gè)瞬間,他們把模型轉(zhuǎn)到雙螺旋的角度,咔嚓一聲,一切都對上了。那一刻,他們沒有說話,但他們看到了生命的真相。


偉大的發(fā)現(xiàn),往往先在空間中成型,才被翻譯成語言。

所以,李飛飛才會(huì)說:“看”和“動(dòng)”,不是低級(jí)的本能,而是高級(jí)智能的基石。大自然花了 5 億年進(jìn)化“視覺”,只花了最后幾萬年進(jìn)化“語言”。因?yàn)楦兄澜?,遠(yuǎn)比描述世界要難得多,也重要得多。

語言可以瞎編,但物理世界不會(huì)撒謊。

03

AI的未來,或許是從預(yù)測下一個(gè)詞,到預(yù)測下一幀世界

什么是,預(yù)測下一幀世界?舉個(gè)例子。

你手里拿著一個(gè)玻璃杯,然后松開了手。現(xiàn)在,你的腦子里是不是立刻就預(yù)測到了:杯子掉下去,砸在地上,摔碎了?你不需要等它真的碎,你的腦子已經(jīng)預(yù)測到了。

這就是“預(yù)測下一幀世界”。擁有了這個(gè)能力,AI不需要讀萬卷書來記住“火是燙的”,模擬與世界的互動(dòng),就能推導(dǎo)出“手伸進(jìn)火里->皮膚燒傷”的物理必然性。

預(yù)測下一個(gè)詞,遵循的是“語法邏輯”;而預(yù)測下一幀世界,遵循的是“物理邏輯”。這就是李飛飛認(rèn)為,掌握空間智能的AI該做的事情。她把它稱為,世界模型。

之前,如果你讓AI畫一個(gè)“凌亂的房間”,它會(huì)生成一張像模像樣的圖片。但是,你沒辦法看看桌子底下有什么,把地上的臟衣服撿起來。但在世界模型生成的房間,你可以蹲下來看床底、拉開抽屜。因?yàn)榉块g里有重力、有光影,還有遮擋關(guān)系。

這和目前的AI視頻,也有本質(zhì)區(qū)別。因?yàn)锳I視頻,只是“看上去理解了世界”,本質(zhì)上還是在黑屋子里,預(yù)測下一個(gè)像素。

比如,吃漢堡。雖然AI視頻可以預(yù)測到,當(dāng)人的嘴到了漢堡上,漢堡大概率會(huì)變形、會(huì)缺少一塊,但它并不理解,漢堡為什么是軟的,以及,人咬下一口之后,那一塊漢堡其實(shí)是到了人的嘴里。它也沒辦法換個(gè)位置,看看漢堡的面包底是不是焦了。

預(yù)測下一幀世界。理解了??墒牵@要怎么做到?

語言,說白了就是一個(gè)詞接著一個(gè)詞,是一維的序列信號(hào)。但世界是三維的,甚至還要加時(shí)間維度。重力決定了蘋果怎么掉,原子結(jié)構(gòu)決定了光線怎么反射。要預(yù)測下一幀世界,就得讓語義、幾何、物理規(guī)律保持一致,這比處理語言復(fù)雜太多了。

李飛飛也很坦率,聊了幾個(gè)他們團(tuán)隊(duì)還在死磕的方向。

比如,找公式。

大語言模型之所以成功,是因?yàn)檎业搅艘粋€(gè)簡單的任務(wù)函數(shù):預(yù)測下一個(gè)詞。世界模型,也能找到這樣一個(gè)簡單優(yōu)雅的公式嗎?目前還需要努力。

比如,找數(shù)據(jù)。

要訓(xùn)練具有空間智能的世界模型,就得找到海量空間數(shù)據(jù)。去哪找?他們正在開發(fā)一種,從互聯(lián)網(wǎng)上的二維視頻里,提取空間信息的算法。

過去的AI,是在用概率“猜”下一個(gè)詞;未來的AI,或許能用物理“算”下一幀世界。

04

精確地把“想象”變成“真實(shí)”,也許是下個(gè)時(shí)代最大的機(jī)會(huì)之一

李飛飛的World Labs,已經(jīng)做出了一款叫Marble的產(chǎn)品。

具體網(wǎng)址:https://marble.worldlabs.ai/。

只要你提供一句描述,一張照片,它就可以生成一個(gè)可以探索的空間。

我試著上傳了一張我們新辦公室的照片,沒想到還真能行。


(圖片來自:Marble)

是不是還挺有意思的?幾秒鐘內(nèi),它不僅識(shí)別出了里面的桌子、椅子,還腦補(bǔ)出了空間位置。雖然還很粗糙??赡苁俏抑簧蟼髁艘粡堈掌脑?。

那么,如果未來的AI真的如李飛飛所說的那樣,有了空間智能,又意味著什么?

首先,對于普通人來說,是AI進(jìn)入現(xiàn)實(shí)社會(huì),所帶來的極大便利。

一旦空間智能成熟,離機(jī)器人走入家庭,就真的不遠(yuǎn)了。它能理解“花瓶是易碎的,要繞著走”;能理解“地上有水,要先拖干”。讓機(jī)器人幫你疊衣服、整理雜亂的玩具房、甚至照顧老人起居,將變成現(xiàn)實(shí)。甚至再進(jìn)一步,讓納米機(jī)器人在血管里送藥。

而當(dāng)AI基于空間智能,掌握了從現(xiàn)實(shí)中抽象出規(guī)律的能力,它們或許,就能像牛頓和愛因斯坦一樣,擁有“科學(xué)家的直覺”。從而,真正發(fā)現(xiàn)規(guī)律、進(jìn)行創(chuàng)新。

接著,對于創(chuàng)業(yè)者來說,加持空間智能的AI,可能意味著一些新的機(jī)會(huì)。

比如,真正“可控”的視頻生成。

現(xiàn)在的視頻AI(比如 Sora),雖然厲害,但還是有點(diǎn)“抽盲盒”。它可以生成一只貓。但你很難控制貓的走位、光影的角度。這對商業(yè)廣告、電影制作來說,就有點(diǎn)難操作。甲方要求臉必須再轉(zhuǎn)15%,你不能說“AI 隨機(jī)生成的我改不了”。

李飛飛在訪談里就舉了一個(gè)例子。他們和索尼的一家虛擬制作公司合作,用了Marble搭建場景,可以自由地選擇拍攝角度,生產(chǎn)效率提升了40倍。

比如,做一些“想象成真”的ToC產(chǎn)品。

例如,裝修。拍一張毛坯房的照片,說改成北歐風(fēng),暖色調(diào)。幾秒鐘后,你就可以得到一個(gè)可以到處走,還能修改沙發(fā)位置的虛擬樣板間。例如,3D相冊,給一張老房子的照片,就能得到一個(gè)3D空間。你可以看看桌上的擺設(shè),看看墻上的掛歷,再次回到小時(shí)候。

李飛飛提到了一個(gè)讓我特別意外的場景:心理治療。有團(tuán)隊(duì)找上門,表示想用這個(gè)技術(shù),來治療“恐高癥”。通過瞬間生成的虛擬懸崖,就能幫病人一步步克服恐懼。

又比如,賣合成數(shù)據(jù),給做機(jī)器人的公司。

本質(zhì)上,這就是給機(jī)器人,開了一間學(xué)校。你不需要造機(jī)器人,你只需要生產(chǎn)特定領(lǐng)域的“教材”。比如,專門生產(chǎn)“怎么修汽車”的數(shù)據(jù),賣給修車機(jī)器人公司;專門生產(chǎn)“怎么做手術(shù)”的數(shù)據(jù),賣給醫(yī)療機(jī)器人公司。

精確地把“想象”變成看得見、摸得著的“真實(shí)”,也許是接下來最大的機(jī)會(huì)之一。

最后的話

好了??偨Y(jié)一下。

為什么AI現(xiàn)在這么厲害,但還是會(huì)犯一些低級(jí)錯(cuò)誤?可能因?yàn)?,它沒有真正理解世界,而只是在統(tǒng)計(jì)規(guī)律中找答案。所以未來,AI的發(fā)展方向,可能要拐一下,從預(yù)測下一個(gè)詞,到預(yù)測下一幀世界。也就是真正掌握,空間智能。

那,這個(gè)方向?qū)Σ粚???huì)不會(huì)通向真正的智能?

我不知道。但至少,這是一個(gè)值得嘗試的方向。因?yàn)槟壳暗拇笳Z言模型,確實(shí)遇到了瓶頸。參數(shù)越來越大,算力越來越強(qiáng),但一致性,總也沒有特別好的解決方案。

而且,如果這個(gè)方向真的走通了,確實(shí)會(huì)帶來一些變化。機(jī)器人可能真的能進(jìn)入家庭。甚至,AI可能真的能像科學(xué)家一樣,從現(xiàn)實(shí)中發(fā)現(xiàn)規(guī)律,而不只是從數(shù)據(jù)中總結(jié)規(guī)律。

當(dāng)然,這一切都還很早。Marble,還很粗糙。世界模型的“公式”還沒找到,空間數(shù)據(jù)也還不夠。但至少,通往智能的那個(gè)未來,又多了幾分念想。

畢竟,科技進(jìn)步從來不是一條直線。

繞點(diǎn)遠(yuǎn)路,沒啥。

參考資料:

1、From Words to Worlds: Spatial Intelligence is AI’s Next Frontier

2、谷歌開發(fā)者指南:Introduction to Large Language Models | MachineLearning

觀點(diǎn)/ 劉潤主筆/ 景九編輯/ 歌平版面/ 黃 靜

這是劉潤公眾號(hào)第2783篇原創(chuàng)文章。未經(jīng)授權(quán),禁止任何機(jī)構(gòu)或個(gè)人抓取本文內(nèi)容,用于訓(xùn)練AI大模型等用途



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
臺(tái)“衛(wèi)福部”稱將以“Chinese Taipei”名義向世衛(wèi)組織申請有關(guān)認(rèn)證,國臺(tái)辦回應(yīng)

臺(tái)“衛(wèi)福部”稱將以“Chinese Taipei”名義向世衛(wèi)組織申請有關(guān)認(rèn)證,國臺(tái)辦回應(yīng)

環(huán)球網(wǎng)資訊
2025-12-24 11:24:08
南博風(fēng)波后續(xù):全網(wǎng)追查“借畫不還”的神秘老同志,揭開歷史迷霧

南博風(fēng)波后續(xù):全網(wǎng)追查“借畫不還”的神秘老同志,揭開歷史迷霧

公子麥少
2025-12-21 14:54:43
1979年,楊顯東參觀完大寨后怒批陳永貴:他騙全國人民,騙黨中央

1979年,楊顯東參觀完大寨后怒批陳永貴:他騙全國人民,騙黨中央

帝哥說史
2025-12-19 06:25:03
電磁炮+140垂發(fā)!川普官宣"特朗普級(jí)戰(zhàn)列艦",看圖后感嘆:太美了

電磁炮+140垂發(fā)!川普官宣"特朗普級(jí)戰(zhàn)列艦",看圖后感嘆:太美了

離離言幾許
2025-12-23 11:14:27
胡靜曬豪門生活,和朱兆祥五兄妹住6000平莊園,貓山王榴蓮掛滿枝

胡靜曬豪門生活,和朱兆祥五兄妹住6000平莊園,貓山王榴蓮掛滿枝

瘋說時(shí)尚
2025-12-24 10:26:11
1962年雷鋒因公殉職,41年后調(diào)查人員揭露真相,令人淚目!

1962年雷鋒因公殉職,41年后調(diào)查人員揭露真相,令人淚目!

抽象派大師
2025-12-22 01:46:01
3-0!齊達(dá)內(nèi)兒子閃耀非洲杯:率隊(duì)開門紅!放棄入選法國隊(duì)賺大了

3-0!齊達(dá)內(nèi)兒子閃耀非洲杯:率隊(duì)開門紅!放棄入選法國隊(duì)賺大了

球場沒跑道
2025-12-25 10:53:26
南博事件升級(jí)!參與定"偽"的專家徐沄秋被扒,果然有情況

南博事件升級(jí)!參與定"偽"的專家徐沄秋被扒,果然有情況

鋭娛之樂
2025-12-21 08:30:41
陳慧琳素顏逛美國超市,臉好方,腮幫子鼓起來了,牙齒不整齊!

陳慧琳素顏逛美國超市,臉好方,腮幫子鼓起來了,牙齒不整齊!

庭小娛
2025-12-21 14:51:03
梅根沒招了!夏洛特公主鋼琴首秀很驚艷,莉莉貝特公主太可惜了

梅根沒招了!夏洛特公主鋼琴首秀很驚艷,莉莉貝特公主太可惜了

人物檔案局
2025-12-25 11:31:01
她是毛主席外孫女,2022年坐擁50億財(cái)富,丈夫身價(jià)超800億

她是毛主席外孫女,2022年坐擁50億財(cái)富,丈夫身價(jià)超800億

鶴羽說個(gè)事
2025-12-13 14:37:20
緬北女魔頭魏榕:用“珍珠奶茶”折磨女孩,她的惡毒遠(yuǎn)超你想象

緬北女魔頭魏榕:用“珍珠奶茶”折磨女孩,她的惡毒遠(yuǎn)超你想象

就一點(diǎn)
2025-07-27 13:38:01
今年上海發(fā)生居住場所火災(zāi)4928起,消防部門專項(xiàng)推進(jìn)冬季火災(zāi)防控

今年上海發(fā)生居住場所火災(zāi)4928起,消防部門專項(xiàng)推進(jìn)冬季火災(zāi)防控

澎湃新聞
2025-12-24 17:44:27
中央定調(diào)!2026年房貸1%貼息全國落地,月供降幅精準(zhǔn)測算來了

中央定調(diào)!2026年房貸1%貼息全國落地,月供降幅精準(zhǔn)測算來了

老特有話說
2025-12-24 21:41:08
女子因肺栓塞不幸走了!醫(yī)生:天冷寧可躺一天,也別干這6事!

女子因肺栓塞不幸走了!醫(yī)生:天冷寧可躺一天,也別干這6事!

墜入二次元的海洋
2025-12-21 13:02:09
強(qiáng)逼賴清德下臺(tái),張亞中再戰(zhàn)江湖,島內(nèi)思考統(tǒng)一,國臺(tái)辦許下承諾

強(qiáng)逼賴清德下臺(tái),張亞中再戰(zhàn)江湖,島內(nèi)思考統(tǒng)一,國臺(tái)辦許下承諾

南宗歷史
2025-12-24 18:44:44
賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國,守著3000平老宅安靜養(yǎng)老

賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國,守著3000平老宅安靜養(yǎng)老

古書記史
2025-12-12 11:21:38
哈登有望重返休城!6換4交易方案助杜登重聚,伊森+海王成籌碼

哈登有望重返休城!6換4交易方案助杜登重聚,伊森+海王成籌碼

毒舌NBA
2025-12-25 10:04:17
明年養(yǎng)老金繼續(xù)漲?人社部部長表態(tài)了!不按工齡調(diào)整可行嗎?

明年養(yǎng)老金繼續(xù)漲?人社部部長表態(tài)了!不按工齡調(diào)整可行嗎?

李健政觀察
2025-12-25 09:27:54
突發(fā)!曝鄭州中原保時(shí)捷4S店人去樓空,賬號(hào)私密,三朵金花已跳槽

突發(fā)!曝鄭州中原保時(shí)捷4S店人去樓空,賬號(hào)私密,三朵金花已跳槽

觀察鑒娛
2025-12-25 08:44:12
2025-12-25 13:36:49
劉潤 incentive-icons
劉潤
劉潤,潤米咨詢創(chuàng)始人,“5分鐘商學(xué)院”課程主理人,著名商業(yè)顧問
4681文章數(shù) 24686關(guān)注度
往期回顧 全部

科技要聞

屠龍少年被"招安"!英偉達(dá)平安夜豪擲200億

頭條要聞

女子入室殺害好友三名未成年子女 隨后在樓內(nèi)上吊自殺

頭條要聞

女子入室殺害好友三名未成年子女 隨后在樓內(nèi)上吊自殺

體育要聞

單賽季11冠,羽壇“安洗瑩時(shí)代”真的來了

娛樂要聞

金莎小19歲男友求婚成功!兩人雪地?fù)砦?/h3>

財(cái)經(jīng)要聞

美國未來18個(gè)月不對中國芯片加額外關(guān)稅

汽車要聞

預(yù)售31.3萬元起 全新奧迪Q5L將于1月內(nèi)上市

態(tài)度原創(chuàng)

手機(jī)
家居
旅游
時(shí)尚
軍事航空

手機(jī)要聞

三星Wide Fold與蘋果iPhone Fold渲染圖曝光,折疊屏對決將至

家居要聞

經(jīng)典彌新 品味浪漫居所

旅游要聞

元旦迎新跑,火熱報(bào)名中→

對不起周柯宇,是陳靖可先來的

軍事要聞

澤連斯基版“和平計(jì)劃”透露哪些信息

無障礙瀏覽 進(jìn)入關(guān)懷版