国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

李飛飛一年前究竟說了啥?怎么又火了

0
分享至

聞樂 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

大語言模型的局限在哪里?

AI教母李飛飛這樣說:

大自然中是沒有語言存在的,你不會從天空中直接看到文字。
語言是一種純粹的生成的信號。



語言信號的輸出主要基于人類給的輸入信號,可以說,語言是不獨立于人之外的。

然而,物理世界是客觀存在的。所以提取、理解、生成3D世界的數(shù)據(jù)、實現(xiàn)空間智能和處理語言問題時截然不同。



沒想到,李飛飛一年前的訪談被扒出來,又引發(fā)大量圍觀。

她這段話意味著,大語言模型或許還不是真正的智能。

真正的智能將是信號感知、物理以及和現(xiàn)實世界相結合的產物。



下面來看看大家還在熱議些啥吧。

空間智能可以借鑒語言模型,但仍存在本質差異

這場討論的焦點在于,現(xiàn)在基于語言信號訓練的模型到底懂不懂物理世界的常識

首先,回顧一下李飛飛的說法。

她認為語言模型及當今的多模態(tài)語言模型的底層表示是一維的。它們在根本上就是操作于離散token的一維序列上,所以模型對于書面文本這種一維序列的表示是非常自然的。



然而,在處理空間智能問題時,核心是世界的三維本質。

雖然多模態(tài)大語言模型也能看圖像,但它是將其他模態(tài)硬塞進這種一維token序列的底層表示中,這種一維且由人類生成的數(shù)據(jù),可能無法很好地表示物理世界,造成信息損失。

如果直接讓模型處理3D數(shù)據(jù),那么表示類型與模型旨在執(zhí)行的任務類型之間將會有更好的匹配。



而空間智能的挑戰(zhàn)就是在于從這個真實世界中提取、表示和生成信息。

除了這個維度上的差異,從更哲學的角度來說,她認為語言是一種純粹由生成產生的信號。自然界中并不存在預設的語言形式,也就是說語言不能獨立于人類之外。

大模型能夠通過學習并反芻所輸入的數(shù)據(jù),無論輸入什么樣的數(shù)據(jù),模型都能用足夠的泛化能力處理語言任務。這是因為語言,或者說文本的本質允許模型在生成范式下表現(xiàn)得出色。



與語言不同,3D世界是真實存在于外部的。這個世界遵循著物理定律,并因材料等多種因素而具有其自身的結構。

因此,要讓模型倒推出3D世界的信息,并能夠表示和生成它,在技術層面上,空間智能可以借鑒語言模型,但從哲學的范疇來看,這兩者仍存在本質差異。



有人舉了一堆例子來證明李飛飛的觀點,同時說明語言模型在理解物理世界時確實有局限。

基于語言信號訓練的模型在物理世界任務中表現(xiàn)差

比如用一個小實驗來測試Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro三個多模態(tài)大模型的物理常識,并與人類兒童表現(xiàn)做對比。



研究用Animal-AI這個用來測試動物和人工智能體物理認知的3D環(huán)境來測試大模型,讓大模型通過前進/后退、左轉/右轉、環(huán)境描述與規(guī)劃控制三個指令控制一個小角色在虛擬環(huán)境中完成任務。



第一個實驗是讓大模型完成一些簡單的任務,如直接找到小球,還有一些稍難的任務,如躲開障礙物找到小球。

結果發(fā)現(xiàn)模型只能搞定最簡單的任務,稍難一點就不行了。

第二個實驗是在第一個實驗的基礎上增加教學案例,比如演示正確做法,結果模型表現(xiàn)也沒有明顯的提升。

對比之后再看,這些大模型的表現(xiàn)遠不及人類兒童,也比不上專門為這個環(huán)境測試的機器人。



還有其他研究團隊設計了一個名為ABench-Physics的工具,專門用來測試大語言模型在物理推理方面的能力,核心就是想搞清楚這些模型到底能不能真的理解物理、解決物理問題。



測試分兩部分,Phy A由400道競賽級別的物理難題組成,先給大模型來個基礎測試。

Phy B屬于動態(tài)部分:修改Phy A中題目的數(shù)字,但不改變物理原理,用來測試大模型能不能進行靈活的物理推理。

結果顯示,最厲害的模型在Phy A上的正確率只有43%,而在Phy B中模型的平均準確率下降了22.5%。

這說明模型并不是真懂物理。



還有團隊用視覺任務測試大模型,比如讓模型判斷照片中哪些物體更近,或者匹配相同的事物。

人類對這些任務的正確率能達到95.7%,而幾個模型最高的正確率僅有51%。在視覺感知上,大模型還遠不及人類。



這些結果都進一步證明了李飛飛之前訪談中關于大模型理解真實物理世界局限性的觀點。

也得到了網友們的認同。



模型的開發(fā)確實正在擴展到將模型建立在物理與多模態(tài)理解的基礎上。



討論升級

當然了,有正方就有反方。

有人先是反駁了關于語言的論述。



也有人認為,在某些情況下,語言描述現(xiàn)實的能力可能會比感知更優(yōu)。



還有人說模型的語言不用局限于人類的語言、文本等,人工智能或許能創(chuàng)造出自己的語言來理解物理世界。



或者,我們該思考,用語言訓練大模型取得現(xiàn)有成就的根本因素又是什么呢?



對于這場討論,你又有什么樣的看法呢?


[1]https://x.com/rohanpaul_ai/status/1965242567085490547
[2]https://www.youtube.com/watch?v=vIXfYFB7aBI

— 完 —

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
連夜下架!楊冪代言的“無頭大衣”嚇哭全網

連夜下架!楊冪代言的“無頭大衣”嚇哭全網

廣告案例精選
2025-12-19 16:17:40
印度首富的家庭瑣事:小兒媳和大伯哥多次牽手,小兒子毫不在意

印度首富的家庭瑣事:小兒媳和大伯哥多次牽手,小兒子毫不在意

小書生吃瓜
2025-12-16 16:49:54
“朱令案”、“吳今案”嫌疑人:一個大伯是副國級,一個身家千億

“朱令案”、“吳今案”嫌疑人:一個大伯是副國級,一個身家千億

歷史八卦社
2023-12-25 11:27:06
千問開全員會干死豆包現(xiàn)場圖瘋傳,阿里內部回應

千問開全員會干死豆包現(xiàn)場圖瘋傳,阿里內部回應

鞭牛士
2025-12-19 13:54:10
機關事業(yè)退休老人必看!60號文件,就是你的養(yǎng)老錢說明書

機關事業(yè)退休老人必看!60號文件,就是你的養(yǎng)老錢說明書

白淺娛樂聊
2025-12-19 10:25:20
A股深夜重磅,千億級大并購來了!

A股深夜重磅,千億級大并購來了!

每日經濟新聞
2025-12-19 23:48:19
五名親綠“大法官”違規(guī)裁決, 國民黨團擬告發(fā)濫權瀆職

五名親綠“大法官”違規(guī)裁決, 國民黨團擬告發(fā)濫權瀆職

海峽導報社
2025-12-20 13:20:03
“贗品”《江南春》,為何能被神秘“顧客”以6800元買走?

“贗品”《江南春》,為何能被神秘“顧客”以6800元買走?

木蹊說
2025-12-19 14:07:19
僅差32次!僅差45個!老詹迎來兩項神級里程碑,愈老愈妖

僅差32次!僅差45個!老詹迎來兩項神級里程碑,愈老愈妖

世界體育圈
2025-12-20 13:22:08
全網驚嘆 C羅肌肉照16小時獲贊1400萬+評論30萬 馬斯克:我也要練

全網驚嘆 C羅肌肉照16小時獲贊1400萬+評論30萬 馬斯克:我也要練

風過鄉(xiāng)
2025-12-20 10:50:05
33分5板6助4帽,隊史第一人!你再這么打下去,擺爛要變成爭冠了

33分5板6助4帽,隊史第一人!你再這么打下去,擺爛要變成爭冠了

鍋子籃球
2025-12-20 13:00:07
烏克蘭一位母親的采訪讓人破防:三個女兒都嫁中國人,不要彩禮

烏克蘭一位母親的采訪讓人破防:三個女兒都嫁中國人,不要彩禮

南權先生
2025-12-19 16:35:22
越秀南路有兩人受傷,廣州警方通報:抓獲犯罪嫌疑人趙某(男,34歲)

越秀南路有兩人受傷,廣州警方通報:抓獲犯罪嫌疑人趙某(男,34歲)

極目新聞
2025-12-19 23:39:16
直降2140元!iPhone 17全系大幅降價,性價比飆升

直降2140元!iPhone 17全系大幅降價,性價比飆升

科技堡壘
2025-12-20 11:05:31
王小騫崩潰大哭!11歲女兒患上“正食癥”,心率高達120心肌損傷

王小騫崩潰大哭!11歲女兒患上“正食癥”,心率高達120心肌損傷

振華觀史
2025-12-20 10:26:23
帶狗上桌吃飯后續(xù):偽造和解書,多家店遭殃,店鋪將追究法律責任

帶狗上桌吃飯后續(xù):偽造和解書,多家店遭殃,店鋪將追究法律責任

奇思妙想草葉君
2025-12-19 22:12:03
沒有朱孝天的f4確實差點意思!周渝民哭到不行,言承旭狀態(tài)好疲憊

沒有朱孝天的f4確實差點意思!周渝民哭到不行,言承旭狀態(tài)好疲憊

樂悠悠娛樂
2025-12-20 11:00:01
14年前,用全部積蓄買下10萬個比特幣的新東方老師,如今現(xiàn)狀怎樣

14年前,用全部積蓄買下10萬個比特幣的新東方老師,如今現(xiàn)狀怎樣

一盅情懷
2025-12-11 14:06:19
19日18時至21日12時,廣州全市暫停辦理戶口、居民身份證、居住證等業(yè)務

19日18時至21日12時,廣州全市暫停辦理戶口、居民身份證、居住證等業(yè)務

新快報新聞
2025-12-19 21:11:12
初代網紅涼了!營業(yè)10年閉店離場,網紅餐廳為何逃不過曇花一現(xiàn)?

初代網紅涼了!營業(yè)10年閉店離場,網紅餐廳為何逃不過曇花一現(xiàn)?

青眼財經
2025-12-19 14:40:56
2025-12-20 13:55:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11884文章數(shù) 176340關注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

牛彈琴:歐洲最后還是慫了 最打臉的就是馮德萊恩

頭條要聞

牛彈琴:歐洲最后還是慫了 最打臉的就是馮德萊恩

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

戚薇女兒大變樣,10歲就進入“尷尬期”

財經要聞

日本加息落地:暴跌沒有,麻煩在后頭

汽車要聞

嵐圖推進L3量產測試 已完成11萬公里實際道路驗證

態(tài)度原創(chuàng)

健康
時尚
旅游
藝術
軍事航空

這些新療法,讓化療不再那么痛苦

今年冬天流行的“露襪”穿法,時髦又減齡!

旅游要聞

明十三陵景陵將于12月22日對公眾預約開放

藝術要聞

馬巖松新作!桂林“超級星”正式揭幕!

軍事要聞

澤連斯基:前線局勢愈發(fā)艱難

無障礙瀏覽 進入關懷版