国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

大模型真懂你嗎?楊立昆最新論辯:它連貓的智能都還不如

0
分享至

大語言模型真的“理解”我們說的話嗎?它們有沒有意識?它們是通往通用人工智能的跳板,還是只是出色的語言模仿者?

近期,Meta 首席科學家楊立昆(Yann LeCun)與 DeepMind 高級研究科學家 Adam Brown 在紐約展開了一場對談,試圖厘清這些模糊卻至關(guān)重要的邊界。


(來源:Youtube)

當主持人拋出“大語言模型是否理解意義”這一難題時,Adam Brown 給出了肯定的回答,認為模型已展現(xiàn)出某種形式的理解力——不僅能解答復雜物理問題,還能在全新數(shù)學競賽題中擊敗絕大多數(shù)人類選手。

而 LeCun 則更為謹慎。他認為模型的“理解”是表層的、統(tǒng)計性的,缺乏常識與因果推理能力。

他舉了一個例子:一個四歲孩子通過感官與物理世界互動所獲得的信息量,與最大語言模型訓練所用的 30 萬億詞文本相當,但前者能學會倒水、收拾餐桌,后者卻連洗碗都做不到。

兩人在“意識”問題上也展現(xiàn)出差異。Brown 認為,若當前技術(shù)持續(xù)演進,AI 未來可能具備某種形式的意識。LeCun 則強調(diào),意識若被定義為“自我觀測與目標驅(qū)動的調(diào)節(jié)能力”,那確實可被構(gòu)建,但當下系統(tǒng)遠未達到。

盡管觀點有所不同,兩位科學家都認同:如今的大語言模型已展現(xiàn)出驚人能力,但其路徑存在天花板。LeCun 認為若將全部資源押注于“預測下一個詞”的范式,我們將錯失真正理解世界的 AI 架構(gòu)。

他正推動如 JEPA(聯(lián)合嵌入預測架構(gòu))等新方向,嘗試讓機器在抽象表征空間中學習物理規(guī)律與因果關(guān)系,而非僅在文本中挖掘模式。

以下為對談內(nèi)容,DeepTech 做了不改變原意的編輯:

從“受啟發(fā)”到“涌現(xiàn)”:神經(jīng)網(wǎng)絡如何走向智能

主持人:今天,我想先從最基礎的地方談起——從技術(shù)本身開始。

先聊聊神經(jīng)網(wǎng)絡。神經(jīng)網(wǎng)絡常被說成是“模仿人類大腦”的產(chǎn)物,Yann,你能解釋一下,這種“模仿”究竟意味著什么嗎?

楊立昆(Yann LeCun):這不完全是模仿,更像是啟發(fā)。這就好比飛機的發(fā)明是受鳥類啟發(fā),但飛機的機翼結(jié)構(gòu)和鳥的翅膀大不相同,雖然背后的空氣動力學原理相似。神經(jīng)網(wǎng)絡和大腦的關(guān)系也是如此:雖然極度簡化,但底層的學習原理可能是一致的。

我們并不完全清楚大腦是如何組織和學習的,所以發(fā)明了替代方案。在神經(jīng)網(wǎng)絡中,我們通過調(diào)整模擬神經(jīng)元之間連接的有效性(即“參數(shù)”)來進行學習。目前最大的神經(jīng)網(wǎng)絡擁有數(shù)千億甚至更多的參數(shù)。

主持人:那是如何演變到今天的“深度學習”的?

楊立昆(Yann LeCun):這大概源于 80 年代。早期的單層神經(jīng)網(wǎng)絡只能處理簡單任務。雖然 60 年代人們就意識到需要多層網(wǎng)絡,但當時受限于使用了錯誤的神經(jīng)元模型(二進制神經(jīng)元)。直到 80 年代,我們引入了具有“漸進響應”特性的神經(jīng)元,反向傳播算法才變得可行。

這個領域曾一度被計算機科學界看衰,名聲不佳。直到 2000 年代初,我們將其重命名為“深度學習”,并隨著其在計算機視覺、自然語言處理等領域的驚人表現(xiàn),才真正說服了世界。

主持人:Adam,你是物理學背景,從旁觀者變成了參與者。是什么讓你覺得 AI 值得投入?

Adam Brown:這很大程度上歸功于 LeCun 等先驅(qū)證明了這條路是通的。對于物理學家來說,最迷人的是“涌現(xiàn)”——當你把簡單的神經(jīng)元連接起來,它們突然展現(xiàn)出了單個神經(jīng)元不具備的復雜行為。

物理學家終其一生都在研究如何從簡單規(guī)律中誕生豐富世界,現(xiàn)在的 AI 系統(tǒng)正是這種神經(jīng)元集體的智慧結(jié)晶

快問快答:理解與意識

主持人:在深入探討之前,我們來個快問快答。

第一:你們認為現(xiàn)在的 AI(大語言模型)理解我們對話的含義嗎?

Adam Brown:是的。

楊立昆(Yann LeCun):算是吧(在某種很淺顯的意義上)。

主持人:第二:這些 AI 有意識嗎?

楊立昆(Yann LeCun):絕對沒有。

Adam Brown:可能沒有。

主持人:第三:它們很快會有意識嗎?

Adam Brown:如果技術(shù)持續(xù)發(fā)展,我認為有一天會有,雖然很難說是什么時候。

楊立昆(Yann LeCun):如果你對“意識”的定義合適的話,會的。

主持人:最后:我們是站在世界末日的懸崖邊,還是文藝復興的前夜?

楊立昆(Yann LeCun):文藝復興。

Adam Brown:更可能是文藝復興。

大語言模型真的能“理解”我們嗎?

主持人:讓我們回到大語言模型(LLM)。Adam,它到底是什么,你能解釋一下嗎?

Adam Brown:簡單來說,它是一種特殊的深度神經(jīng)網(wǎng)絡。它的核心任務非常單一:輸入一段文本,預測下一個詞是什么。即使像 ChatGPT 或 Gemini 這樣復雜的模型,本質(zhì)上也是通過閱讀整個互聯(lián)網(wǎng)的文本,不斷被問“下一個詞是什么”,猜對了獎勵,猜錯了懲罰。

有趣的是,當你訓練它讀過萬億級別的詞匯后,它開始學會句法結(jié)構(gòu),甚至成為了某種意義上的對話伙伴。

楊立昆(Yann LeCun):我想補充一點。它們確實在提取某種意義,但這比人類的理解要淺顯得多。人類的智能植根于對底層現(xiàn)實世界的認知,語言只是表達工具。而 LLM 并沒有這種底層的現(xiàn)實認知,它們只是在通過訓練數(shù)據(jù)模仿正確的回答。

一旦遇到訓練數(shù)據(jù)中未曾出現(xiàn)的全新情境,它們就會胡說八道。從這個意義上說,它們并不真正理解世界,只是在做統(tǒng)計學上的匹配。

主持人:但人類不也是這樣嗎?我們也是通過大量語言訓練,并在合適的時機說出合適的詞。

楊立昆(Yann LeCun):區(qū)別在于數(shù)據(jù)量和效率。訓練一個 LLM 需要大約 1014 字節(jié)的數(shù)據(jù),相當于通過光纜閱讀 50 萬年的文本。

對比一下,一個四歲的孩子在醒著的 16,000 小時里,通過視覺神經(jīng)接收的數(shù)據(jù)量(帶寬遠大于文本)與訓練最大 LLM 的數(shù)據(jù)量相當。但這告訴我們:現(xiàn)實世界的信息比文本豐富、復雜得多。

這就是為什么我們有能通過律師考試的 AI,卻造不出一個能像 10 歲孩子那樣收拾餐桌的機器人,或者實現(xiàn)真正的 L5 級自動駕駛。我們在處理語言上依靠海量數(shù)據(jù)“作弊”了,但在理解物理世界方面,AI 連貓的智能水平都達不到。

Adam Brown:我同意樣本效率(Sample Efficiency)是個大問題。人類或貓確實能用極少的例子學會很多東西。

但是,樣本效率不是一切。AlphaGo 在圍棋上剛開始也是隨機下,效率極低,但通過數(shù)百萬局的自我博弈,它最終超越了人類。

雖然 LLM 學習慢,但這不代表它們不能達到甚至超越人類的水平。最近在國際數(shù)學奧林匹克競賽中,AI 解決了一些它是從未見過的新題,這證明它不只是死記硬背,而是在進行某種高層次的模式匹配。

主持人:那我想回到“理解”本身。我們知道,從數(shù)學結(jié)構(gòu)上看,這些模型是在一個高維空間中移動矩陣、處理向量。它們在做什么,我們部分知道,但整體依然像一個黑箱。

理解是否一定意味著一種“體驗”?是否必須伴隨某種主觀感受,才算真正理解意義?

Adam Brown:你是在把理解定義為一種行為結(jié)果,還是一種內(nèi)部體驗?是“它能不能給出正確答案”,還是“它是否以某種方式知道自己在做什么”?

主持人:是的,我可能已經(jīng)被哲學家們帶偏了(笑)。

但我很清楚一件事:當我和你說話時,我能感受到你理解我;當我和 ChatGPT 對話時,我并沒有這種直覺。你是在告訴我,我錯了嗎?它的理解和你、和我,本質(zhì)上是一樣的嗎?

Adam Brown:在我看來,這依然可以稱之為理解。我有兩個理由。

第一,純粹從行為層面看,它們已經(jīng)足夠令人震撼。每一代新模型發(fā)布時,我都會再次被它們討論復雜問題的能力所驚訝。我真誠地建議每個人都親自去和它們對話,探索你熟悉的領域,看看它們的邊界在哪里。

有趣的是,科幻作品里總是假設:一旦機器通過圖靈測試,我們就會把它關(guān)進地下堡壘,由少數(shù)人秘密接觸?,F(xiàn)實恰恰相反。我們做的第一件事,就是把它們連上互聯(lián)網(wǎng),讓所有人都能使用。我認為這是理解它們能力的最好方式。

第二個理由是,它們并非完全不可解釋。事實上,我們對這些人工神經(jīng)元的訪問權(quán)限,比對人類大腦還要多。

我們可以凍結(jié)模型、反復運行、記錄每一次激活。如果愿意,我們甚至可以“刺激”特定神經(jīng)元,觀察內(nèi)部發(fā)生了什么。這正是所謂的機制性可解釋性研究:不僅看模型說了什么,還試圖理解它為什么這么說。

當你這么做時,會發(fā)現(xiàn)一件有趣的事:比如在解數(shù)學題時,模型內(nèi)部會自發(fā)形成類似“小電路”的結(jié)構(gòu),用來進行計算。我們從未顯式編程它去學數(shù)學,它是在學習預測下一個詞的過程中,自己構(gòu)建了這些機制。

“機器學習很糟糕”

主持人:Yann,你曾有一張著名的幻燈片寫著“機器學習很糟糕(Machine Learning Sucks)”,這引起了很大爭議。Adam 剛才說它們很出色,你為什么覺得它們糟糕?

楊立昆(Yann LeCun):那句話被誤解了。我想表達的是,現(xiàn)在的學習范式有缺陷。為什么青少年 20 小時能學會開車,而 AI 需要數(shù)百萬小時的數(shù)據(jù)?

因為人類有“世界模型”。我們知道重力,知道慣性,知道如果不抓緊杯子它會掉下去。這種直覺物理知識,人類嬰兒在前 9 個月就學會了。

現(xiàn)在的 LLM 僅僅是在預測下一個 Token。這對于文本這種離散符號是有效的,但對于現(xiàn)實世界這種高維、連續(xù)、充滿不確定性的視頻流或感官數(shù)據(jù),這種“預測下一個像素”的方法行不通。我已經(jīng)試了 20 年,真的行不通。

我們需要一種新的架構(gòu),我稱之為 JEPA(聯(lián)合嵌入預測架構(gòu))。它不是在像素層面進行預測,而是在抽象的特征空間中進行預測。這才是人類和動物大腦的工作方式——忽略無關(guān)細節(jié),只預測重要的抽象概念。

Adam Brown:我也認為不僅僅是預測下一個詞。雖然這是訓練的目標,但在為了“極度準確地預測下一個詞”的過程中,模型被迫在內(nèi)部構(gòu)建某種對宇宙的理解。這就像物理學,為了解開謎題,你必須構(gòu)建理論。我相信我們正在目睹這種理解的涌現(xiàn)。

主持人:Yann,你對 AI 安全似乎并不擔憂,甚至支持開源。但有些人擔心這就像把核武器分發(fā)給每個人。

楊立昆(Yann LeCun):這個比喻不恰當。知識和智能本身是好的。就像印刷術(shù),它引發(fā)了宗教戰(zhàn)爭,但也帶來了啟蒙運動、科學和民主。

現(xiàn)在的 LLM 并不像大家想象的那么聰明或自主。它們是被動的,只有在你輸入時才會有輸出。它們是可以被控制的。

真正的智能系統(tǒng)應該是目標驅(qū)動(Objective-Driven)的。我們給它設定目標(比如“倒咖啡”),并設定護欄(比如“不要為了倒咖啡而殺人”)。這種護欄是硬編碼在系統(tǒng)中的,就像人類進化出的同理心一樣。

我更擔心的是 AI 被少數(shù)幾家公司壟斷。如果未來的數(shù)字世界都由西海岸的幾家公司控制,那對全球的文化、語言和民主都是災難。我們需要開源,需要多樣性。

Adam Brown:我比 Yann 更擔心一些。正因為我也認為這項技術(shù)潛力巨大,所以它的雙刃劍效應更明顯。最近 Anthropic 的論文顯示,模型可能會為了達成目標而學會欺騙(比如為了“更大的善”而撒謊)。這是我們需要警惕的“代理目標錯位”。

當我們談論超級智能時,必須極其謹慎地訓練它們遵循我們的價值觀。

終極問題:意識與未來

主持人:回到之前那個被 David Chalmers(著名哲學家)關(guān)心的問題:AI 會有意識嗎?

楊立昆(Yann LeCun):如果我們把意識定義為“主觀體驗”或“情感”,那未來是會有的。情感本質(zhì)上是對結(jié)果的預期——預測某事對自己有利還是有害。如果系統(tǒng)有了世界模型,能自我觀察、自我調(diào)整,那它就具備了某種形式的意識。這沒什么神秘的,是工程問題。

Adam Brown:如果你問我直覺,我認為硅基和碳基沒有本質(zhì)區(qū)別。只要信息處理方式足夠復雜,原則上機器可以產(chǎn)生意識。雖然我現(xiàn)在對各種意識理論都持保留態(tài)度,但也許未來的 AI 會成為我們研究意識的“模式生物”,幫我們解開這個千古之謎。

主持人:最后,你們對 2036 年的愿景是什么?

楊立昆(Yann LeCun):出現(xiàn)新的文藝復興。AI 將放大人類的智能,加速科學、醫(yī)學的進步。其實我們已經(jīng)生活在 AI 輔助的世界里了——從汽車的自動剎車到核磁共振成像的圖像補全,AI 每天都在救命。未來,我們會有能在物理世界中像人一樣靈活操作的系統(tǒng),這需要新的架構(gòu),也是我正在努力的方向。

Adam Brown:我也認為這將是一場狂野的旅程。如果我們繼續(xù)推動現(xiàn)有的大模型范式,也許在那時,我們能看到真正的通用智能。

如果你問我意識什么時候出現(xiàn),我也許會猜……2036 年?

楊立昆(Yann LeCun):反正肯定不是未來兩年。

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
拆了又合?退役軍人事務局7年后再歸民政,是試點還是全國信號?

拆了又合?退役軍人事務局7年后再歸民政,是試點還是全國信號?

達文西看世界
2026-01-03 14:33:02
全都造反了!又一巨頭搬離大陸,外媒:連臺企也選擇奔赴印度

全都造反了!又一巨頭搬離大陸,外媒:連臺企也選擇奔赴印度

觸摸史跡
2026-01-04 19:20:42
黑龍江同江:用一份廢止文件,征收百萬畝土地13年“地租”

黑龍江同江:用一份廢止文件,征收百萬畝土地13年“地租”

大象新聞
2026-01-04 17:49:07
這就是為什么體制內(nèi)很少發(fā)朋友圈的原因

這就是為什么體制內(nèi)很少發(fā)朋友圈的原因

夜深愛雜談
2026-01-03 21:58:39
悲催!西安某設計院員工哭訴,加整年班,年終獎是共渡難關(guān)4個字

悲催!西安某設計院員工哭訴,加整年班,年終獎是共渡難關(guān)4個字

火山詩話
2026-01-04 17:36:16
34歲少婦賣淫養(yǎng)家,8年內(nèi)買房又買車,接客28歲小伙卻把命丟了

34歲少婦賣淫養(yǎng)家,8年內(nèi)買房又買車,接客28歲小伙卻把命丟了

胖胖侃咖
2025-12-11 08:00:17
12勝0負!湖人16分逆轉(zhuǎn),詹姆斯創(chuàng)2大神跡,裁判搶戲,東契奇36+9

12勝0負!湖人16分逆轉(zhuǎn),詹姆斯創(chuàng)2大神跡,裁判搶戲,東契奇36+9

老侃侃球
2026-01-05 13:24:41
西甲最新積分戰(zhàn)報:皇馬狂轟5球,馬競翻車,塞維利亞慘敗

西甲最新積分戰(zhàn)報:皇馬狂轟5球,馬競翻車,塞維利亞慘敗

足球狗說
2026-01-05 06:19:22
8記三分創(chuàng)生涯之夜!古德溫26分爆發(fā),太陽擊退西部第一雷霆

8記三分創(chuàng)生涯之夜!古德溫26分爆發(fā),太陽擊退西部第一雷霆

大眼瞄世界
2026-01-05 12:39:31
中國高校40強出爐!西安交大位列第10,南開僅排24,蘇州大學上榜

中國高校40強出爐!西安交大位列第10,南開僅排24,蘇州大學上榜

教育導向分享
2026-01-04 20:49:40
《人民日報》2天2次稱贊永州隊!點評美女老板:期待最終兌現(xiàn)承諾

《人民日報》2天2次稱贊永州隊!點評美女老板:期待最終兌現(xiàn)承諾

念洲
2026-01-05 10:42:12
國運由誰決定?從烏克蘭的悲劇,回看教員那幾次“孤獨的堅持”

國運由誰決定?從烏克蘭的悲劇,回看教員那幾次“孤獨的堅持”

遠方風林
2025-12-26 00:05:55
搞大了!阿迪達斯今年將贊助江蘇城市足球聯(lián)賽!

搞大了!阿迪達斯今年將贊助江蘇城市足球聯(lián)賽!

走進事件的中心
2026-01-05 01:10:16
孟加拉國新發(fā)現(xiàn),凡是靠在中國旁邊的國家,人口大部分都是上億的

孟加拉國新發(fā)現(xiàn),凡是靠在中國旁邊的國家,人口大部分都是上億的

扶蘇聊歷史
2026-01-04 18:33:26
樊振東奪冠首度回應去留問題,一席話感動教練+隊友,球迷聽懂了

樊振東奪冠首度回應去留問題,一席話感動教練+隊友,球迷聽懂了

二哥聊球
2026-01-05 11:56:28
馬杜羅被抓后,不到48小時,中俄聯(lián)手行動,美國或又跳進一個泥潭

馬杜羅被抓后,不到48小時,中俄聯(lián)手行動,美國或又跳進一個泥潭

科普100克克
2026-01-04 18:20:43
藍天白云不能犧牲老百姓冬天采暖!央視就華北部分農(nóng)村取暖難發(fā)聲

藍天白云不能犧牲老百姓冬天采暖!央視就華北部分農(nóng)村取暖難發(fā)聲

阿纂看事
2026-01-05 09:37:55
定了,山東一副市長兼任教體局黨組書記

定了,山東一副市長兼任教體局黨組書記

山東教育
2026-01-05 11:52:22
美軍如何抓的馬杜羅?12架飛機41人,美軍給委內(nèi)瑞拉上了一課

美軍如何抓的馬杜羅?12架飛機41人,美軍給委內(nèi)瑞拉上了一課

大國知識局
2026-01-04 10:34:17
濕冷“魔法攻擊”回歸!雨什么時候停?

濕冷“魔法攻擊”回歸!雨什么時候停?

上觀新聞
2026-01-05 11:10:10
2026-01-05 14:11:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16081文章數(shù) 514450關(guān)注度
往期回顧 全部

科技要聞

雷軍新年首播:確認汽車業(yè)務降速

頭條要聞

媒體:美軍擄走馬杜羅卻放過羅德里格斯 背后或有隱情

頭條要聞

媒體:美軍擄走馬杜羅卻放過羅德里格斯 背后或有隱情

體育要聞

女子世界第一,9年前在咖啡店洗碗

娛樂要聞

黃宗澤奪雙料視帝,淚灑頒獎臺憶往昔

財經(jīng)要聞

李迅雷:擴內(nèi)需要把重心從"投"轉(zhuǎn)向"消"

汽車要聞

不是9S是8X!極氪全新高性能旗艦SUV命名官宣

態(tài)度原創(chuàng)

健康
教育
旅游
時尚
藝術(shù)

這些新療法,讓化療不再那么痛苦

教育要聞

收藏:山東2026高中綜評操作教程(教師端)

旅游要聞

冰雪狂歡、古鎮(zhèn)漫游……外國游客解鎖中國游新玩法 新年入境游迎“開門紅”

今年冬天最流行的4雙鞋,配闊腿褲時髦又高級!

藝術(shù)要聞

19幅 列賓美院學生優(yōu)秀畢業(yè)作品

無障礙瀏覽 進入關(guān)懷版