国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

李飛飛一年前究竟說(shuō)了啥?怎么又火了

0
分享至

聞樂(lè) 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

大語(yǔ)言模型的局限在哪里?

AI教母李飛飛這樣說(shuō):

大自然中是沒(méi)有語(yǔ)言存在的,你不會(huì)從天空中直接看到文字。
語(yǔ)言是一種純粹的生成的信號(hào)。



語(yǔ)言信號(hào)的輸出主要基于人類給的輸入信號(hào),可以說(shuō),語(yǔ)言是不獨(dú)立于人之外的。

然而,物理世界是客觀存在的。所以提取、理解、生成3D世界的數(shù)據(jù)、實(shí)現(xiàn)空間智能和處理語(yǔ)言問(wèn)題時(shí)截然不同。



沒(méi)想到,李飛飛一年前的訪談被扒出來(lái),又引發(fā)大量圍觀。

她這段話意味著,大語(yǔ)言模型或許還不是真正的智能。

真正的智能將是信號(hào)感知、物理以及和現(xiàn)實(shí)世界相結(jié)合的產(chǎn)物。



下面來(lái)看看大家還在熱議些啥吧。

空間智能可以借鑒語(yǔ)言模型,但仍存在本質(zhì)差異

這場(chǎng)討論的焦點(diǎn)在于,現(xiàn)在基于語(yǔ)言信號(hào)訓(xùn)練的模型到底懂不懂物理世界的常識(shí)

首先,回顧一下李飛飛的說(shuō)法。

她認(rèn)為語(yǔ)言模型及當(dāng)今的多模態(tài)語(yǔ)言模型的底層表示是一維的。它們?cè)诟旧暇褪遣僮饔陔x散token的一維序列上,所以模型對(duì)于書面文本這種一維序列的表示是非常自然的。



然而,在處理空間智能問(wèn)題時(shí),核心是世界的三維本質(zhì)。

雖然多模態(tài)大語(yǔ)言模型也能看圖像,但它是將其他模態(tài)硬塞進(jìn)這種一維token序列的底層表示中,這種一維且由人類生成的數(shù)據(jù),可能無(wú)法很好地表示物理世界,造成信息損失。

如果直接讓模型處理3D數(shù)據(jù),那么表示類型與模型旨在執(zhí)行的任務(wù)類型之間將會(huì)有更好的匹配。



而空間智能的挑戰(zhàn)就是在于從這個(gè)真實(shí)世界中提取、表示和生成信息。

除了這個(gè)維度上的差異,從更哲學(xué)的角度來(lái)說(shuō),她認(rèn)為語(yǔ)言是一種純粹由生成產(chǎn)生的信號(hào)。自然界中并不存在預(yù)設(shè)的語(yǔ)言形式,也就是說(shuō)語(yǔ)言不能獨(dú)立于人類之外。

大模型能夠通過(guò)學(xué)習(xí)并反芻所輸入的數(shù)據(jù),無(wú)論輸入什么樣的數(shù)據(jù),模型都能用足夠的泛化能力處理語(yǔ)言任務(wù)。這是因?yàn)檎Z(yǔ)言,或者說(shuō)文本的本質(zhì)允許模型在生成范式下表現(xiàn)得出色。



與語(yǔ)言不同,3D世界是真實(shí)存在于外部的。這個(gè)世界遵循著物理定律,并因材料等多種因素而具有其自身的結(jié)構(gòu)。

因此,要讓模型倒推出3D世界的信息,并能夠表示和生成它,在技術(shù)層面上,空間智能可以借鑒語(yǔ)言模型,但從哲學(xué)的范疇來(lái)看,這兩者仍存在本質(zhì)差異。



有人舉了一堆例子來(lái)證明李飛飛的觀點(diǎn),同時(shí)說(shuō)明語(yǔ)言模型在理解物理世界時(shí)確實(shí)有局限。

基于語(yǔ)言信號(hào)訓(xùn)練的模型在物理世界任務(wù)中表現(xiàn)差

比如用一個(gè)小實(shí)驗(yàn)來(lái)測(cè)試Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro三個(gè)多模態(tài)大模型的物理常識(shí),并與人類兒童表現(xiàn)做對(duì)比。



研究用Animal-AI這個(gè)用來(lái)測(cè)試動(dòng)物和人工智能體物理認(rèn)知的3D環(huán)境來(lái)測(cè)試大模型,讓大模型通過(guò)前進(jìn)/后退、左轉(zhuǎn)/右轉(zhuǎn)、環(huán)境描述與規(guī)劃控制三個(gè)指令控制一個(gè)小角色在虛擬環(huán)境中完成任務(wù)。



第一個(gè)實(shí)驗(yàn)是讓大模型完成一些簡(jiǎn)單的任務(wù),如直接找到小球,還有一些稍難的任務(wù),如躲開障礙物找到小球。

結(jié)果發(fā)現(xiàn)模型只能搞定最簡(jiǎn)單的任務(wù),稍難一點(diǎn)就不行了。

第二個(gè)實(shí)驗(yàn)是在第一個(gè)實(shí)驗(yàn)的基礎(chǔ)上增加教學(xué)案例,比如演示正確做法,結(jié)果模型表現(xiàn)也沒(méi)有明顯的提升。

對(duì)比之后再看,這些大模型的表現(xiàn)遠(yuǎn)不及人類兒童,也比不上專門為這個(gè)環(huán)境測(cè)試的機(jī)器人。



還有其他研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)名為ABench-Physics的工具,專門用來(lái)測(cè)試大語(yǔ)言模型在物理推理方面的能力,核心就是想搞清楚這些模型到底能不能真的理解物理、解決物理問(wèn)題。



測(cè)試分兩部分,Phy A由400道競(jìng)賽級(jí)別的物理難題組成,先給大模型來(lái)個(gè)基礎(chǔ)測(cè)試。

Phy B屬于動(dòng)態(tài)部分:修改Phy A中題目的數(shù)字,但不改變物理原理,用來(lái)測(cè)試大模型能不能進(jìn)行靈活的物理推理。

結(jié)果顯示,最厲害的模型在Phy A上的正確率只有43%,而在Phy B中模型的平均準(zhǔn)確率下降了22.5%。

這說(shuō)明模型并不是真懂物理。



還有團(tuán)隊(duì)用視覺(jué)任務(wù)測(cè)試大模型,比如讓模型判斷照片中哪些物體更近,或者匹配相同的事物。

人類對(duì)這些任務(wù)的正確率能達(dá)到95.7%,而幾個(gè)模型最高的正確率僅有51%。在視覺(jué)感知上,大模型還遠(yuǎn)不及人類。



這些結(jié)果都進(jìn)一步證明了李飛飛之前訪談中關(guān)于大模型理解真實(shí)物理世界局限性的觀點(diǎn)。

也得到了網(wǎng)友們的認(rèn)同。



模型的開發(fā)確實(shí)正在擴(kuò)展到將模型建立在物理與多模態(tài)理解的基礎(chǔ)上。



討論升級(jí)

當(dāng)然了,有正方就有反方。

有人先是反駁了關(guān)于語(yǔ)言的論述。



也有人認(rèn)為,在某些情況下,語(yǔ)言描述現(xiàn)實(shí)的能力可能會(huì)比感知更優(yōu)。



還有人說(shuō)模型的語(yǔ)言不用局限于人類的語(yǔ)言、文本等,人工智能或許能創(chuàng)造出自己的語(yǔ)言來(lái)理解物理世界。



或者,我們?cè)撍伎?,用語(yǔ)言訓(xùn)練大模型取得現(xiàn)有成就的根本因素又是什么呢?



對(duì)于這場(chǎng)討論,你又有什么樣的看法呢?


[1]https://x.com/rohanpaul_ai/status/1965242567085490547
[2]https://www.youtube.com/watch?v=vIXfYFB7aBI

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
乾隆登基后,平反了諸多被雍正打壓的叔伯,為何不愿平反其大伯?

乾隆登基后,平反了諸多被雍正打壓的叔伯,為何不愿平反其大伯?

鶴羽說(shuō)個(gè)事
2026-03-01 18:29:37
買紅妹現(xiàn)狀:把孩子當(dāng)成頭等大事,已和孫楠和解,55歲仍是單身

買紅妹現(xiàn)狀:把孩子當(dāng)成頭等大事,已和孫楠和解,55歲仍是單身

說(shuō)歷史的老牢
2026-03-01 10:13:00
火爆??!場(chǎng)邊沖打主帥!交易!DNP!要拆隊(duì)呀?別這樣,好歹西部第3

火爆??!場(chǎng)邊沖打主帥!交易!DNP!要拆隊(duì)呀?別這樣,好歹西部第3

天光破云來(lái)
2026-03-01 13:05:46
美軍嚴(yán)重誤判,五角大樓認(rèn)為不管咋轟炸中國(guó),解放軍都不敢還手

美軍嚴(yán)重誤判,五角大樓認(rèn)為不管咋轟炸中國(guó),解放軍都不敢還手

空谷幽幽藍(lán)
2026-02-20 21:47:25
中國(guó)造就是強(qiáng)!法軍用了都說(shuō)好,宗申三蹦子機(jī)動(dòng)性遠(yuǎn)超軍用越野車

中國(guó)造就是強(qiáng)!法軍用了都說(shuō)好,宗申三蹦子機(jī)動(dòng)性遠(yuǎn)超軍用越野車

鷹眼Defence
2026-03-01 18:39:48
40架殲-20出動(dòng)!中國(guó)250架戰(zhàn)機(jī)軍演強(qiáng)度超越紅旗

40架殲-20出動(dòng)!中國(guó)250架戰(zhàn)機(jī)軍演強(qiáng)度超越紅旗

似水流年忘我
2026-02-28 16:33:14
月薪五千的朝鮮姑娘,和她們回不去的中國(guó)夢(mèng)

月薪五千的朝鮮姑娘,和她們回不去的中國(guó)夢(mèng)

百姓聞世界
2026-02-17 07:29:21
感謝西藏吧,沒(méi)有他們今天的中國(guó)大概率是全民穆斯林!

感謝西藏吧,沒(méi)有他們今天的中國(guó)大概率是全民穆斯林!

阿諢體育
2026-02-18 12:44:39
TVB一哥太太的假劉海太怪惹負(fù)評(píng)!聽民意轉(zhuǎn)新造型 網(wǎng)民洗版激贊:大美人終于回歸

TVB一哥太太的假劉海太怪惹負(fù)評(píng)!聽民意轉(zhuǎn)新造型 網(wǎng)民洗版激贊:大美人終于回歸

TVB資訊臺(tái)
2026-03-01 21:59:34
報(bào)復(fù)來(lái)了!伊朗超級(jí)導(dǎo)彈登場(chǎng),教以色列做人,鐵穹成了笑話

報(bào)復(fù)來(lái)了!伊朗超級(jí)導(dǎo)彈登場(chǎng),教以色列做人,鐵穹成了笑話

健身狂人
2026-03-01 17:19:13
記者:賽后籃協(xié)主席、郭士強(qiáng)和趙睿都哭了,大家壓力確實(shí)很大

記者:賽后籃協(xié)主席、郭士強(qiáng)和趙睿都哭了,大家壓力確實(shí)很大

懂球帝
2026-03-01 21:41:53
你知道最禽獸的事是什么嗎?網(wǎng)友的故事讓人毛骨悚然!

你知道最禽獸的事是什么嗎?網(wǎng)友的故事讓人毛骨悚然!

特約前排觀眾
2026-02-28 00:15:03
哈梅內(nèi)伊身亡細(xì)節(jié)公開!美以對(duì)伊朗發(fā)動(dòng)“斬首式”打擊,沖突走向難料

哈梅內(nèi)伊身亡細(xì)節(jié)公開!美以對(duì)伊朗發(fā)動(dòng)“斬首式”打擊,沖突走向難料

上觀新聞
2026-03-01 11:17:06
美以打擊伊朗的連“中”反應(yīng):從石油人民幣到一帶一路,一場(chǎng)無(wú)法隔岸觀火的變局

美以打擊伊朗的連“中”反應(yīng):從石油人民幣到一帶一路,一場(chǎng)無(wú)法隔岸觀火的變局

吾球商業(yè)地理
2026-03-01 10:33:26
馬年首虎!涉嫌嚴(yán)重違紀(jì)違法,韓嵩被查

馬年首虎!涉嫌嚴(yán)重違紀(jì)違法,韓嵩被查

中國(guó)基金報(bào)
2026-02-28 20:55:42
“去中國(guó)化”最徹底的4個(gè)國(guó)家,有一個(gè)已經(jīng)完全西化了

“去中國(guó)化”最徹底的4個(gè)國(guó)家,有一個(gè)已經(jīng)完全西化了

北緯的咖啡豆
2026-02-24 09:16:33
新人中東度蜜月突遇戰(zhàn)爭(zhēng)爆發(fā),新娘在領(lǐng)空關(guān)閉前幸運(yùn)離境,新郞滯留:買了餅干和水,機(jī)票改簽到10多天后,市區(qū)不時(shí)傳來(lái)爆炸聲

新人中東度蜜月突遇戰(zhàn)爭(zhēng)爆發(fā),新娘在領(lǐng)空關(guān)閉前幸運(yùn)離境,新郞滯留:買了餅干和水,機(jī)票改簽到10多天后,市區(qū)不時(shí)傳來(lái)爆炸聲

極目新聞
2026-03-01 19:33:19
執(zhí)教難題何時(shí)破局!王皓為向鵬和林詩(shī)棟愁壞,主教練并不好當(dāng)

執(zhí)教難題何時(shí)破局!王皓為向鵬和林詩(shī)棟愁壞,主教練并不好當(dāng)

卿子書
2026-03-02 09:14:26
顧順章叛變后,交代了四名中共負(fù)責(zé)人,第一個(gè)名字就讓徐恩曾傻眼

顧順章叛變后,交代了四名中共負(fù)責(zé)人,第一個(gè)名字就讓徐恩曾傻眼

大運(yùn)河時(shí)空
2026-02-23 11:10:03
【開盤】A股三大股指集體低開,油氣、黃金板塊大漲

【開盤】A股三大股指集體低開,油氣、黃金板塊大漲

澎湃新聞
2026-03-02 09:49:03
2026-03-02 10:23:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12211文章數(shù) 176399關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個(gè)深刻教訓(xùn)

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個(gè)深刻教訓(xùn)

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂(lè)要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來(lái)襲

財(cái)經(jīng)要聞

中東局勢(shì)影響如何?十大券商策略來(lái)了

汽車要聞

理想汽車2月交付26421輛 歷史累計(jì)交付超159萬(wàn)輛

態(tài)度原創(chuàng)

旅游
本地
家居
時(shí)尚
公開課

旅游要聞

正月十三至十七到莆田,看國(guó)家級(jí)非遺楓亭游燈鬧元宵

本地新聞

津南好·四時(shí)總相宜

家居要聞

素色肌理 品意式格調(diào)

從每天只睡4小時(shí)到8小時(shí):一個(gè)失眠者的自救指南

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版