国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

只靠預(yù)測(cè)下一個(gè)詞,大模型也能“長(zhǎng)出概念”?| PNAS 揭示類人概念表征的涌現(xiàn)

0
分享至

PsyBrain 腦心前沿 | 公眾號(hào) PSY-Brain_Frontier

一鍵關(guān)注,點(diǎn)亮星標(biāo) ??

不錯(cuò)過每日前沿資訊

認(rèn)知神經(jīng)科學(xué)前沿文獻(xiàn)分享


基本信息:

Title:Revealing emergent human-like conceptual representations from language prediction

發(fā)表時(shí)間:2025.10.31

Journal:PNAS

影響因子:9.1

獲取原文:

  1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本



引言

我們?nèi)粘I钪须S時(shí)都在用“概念(concept)”思考:看到一只從未見過的狗,你仍然能立刻認(rèn)出“這是狗”;看到朋友圈發(fā)的落日照片,會(huì)自動(dòng)想到“太陽”“傍晚”“下班真好”;聽到別人說“這個(gè)人就是我們組的太陽”,你又能從“太陽”這個(gè)物理天體,瞬間切換到“溫暖、積極、帶來能量”的抽象含義。

概念就是我們心里對(duì)世界的“壓縮包”,把無窮多的具體經(jīng)驗(yàn),濃縮成一個(gè)可以反復(fù)調(diào)用的心理單元。


傳統(tǒng)認(rèn)知科學(xué)認(rèn)為,人類之所以能建立這樣穩(wěn)定、可泛化的概念,是因?yàn)槲覀冇?strong>豐富的物理經(jīng)驗(yàn)和社會(huì)經(jīng)驗(yàn):看得見、摸得著、互動(dòng)得了。

孩子通過看太陽升起落下、感受陽光溫度、在故事書里看到“太陽公公”,一點(diǎn)點(diǎn)學(xué)會(huì)什么是“太陽”。而且概念還不是孤立存在的,“太陽”可以類比“原子核”,“狗”既是“動(dòng)物(animal)”,又是“寵物(pet)”,概念之間構(gòu)成一張錯(cuò)綜復(fù)雜的網(wǎng)絡(luò),這些關(guān)系也是我們理解世界的關(guān)鍵。

但近幾年出現(xiàn)的大語言模型(large language model, LLM)打亂了很多人的直覺。它們只是在海量文本上做一件看似“機(jī)械”的事:預(yù)測(cè)下一個(gè)詞(next-token prediction)。沒有看過真實(shí)世界,沒有視覺、聽覺、觸覺輸入,卻在各種語言任務(wù)、考試題目、甚至類心理學(xué)測(cè)驗(yàn)上,表現(xiàn)得越來越像人。這就引出了一個(gè)尖銳的問題:

只靠預(yù)測(cè)下一個(gè)詞,LLM 里會(huì)不會(huì)也自發(fā)形成某種“概念”?這些“概念”到底有多像人類心里的概念?

圍繞這個(gè)問題,學(xué)界爭(zhēng)論非常激烈。

一派認(rèn)為 LLM 只是“隨機(jī)鸚鵡”(stochastic parrot):它只是學(xué)會(huì)了統(tǒng)計(jì)共現(xiàn),把詞按概率接下去,缺乏真正的理解(understanding)和概念(concept),更談不上與現(xiàn)實(shí)世界的聯(lián)系。

另一派則指出,僅僅看輸出現(xiàn)象,很難否認(rèn)它在很多任務(wù)上展現(xiàn)出的“概念化”能力,而且人類自己在使用概念時(shí),語言本身就是極其重要的線索,意義在很大程度上就體現(xiàn)在概念之間的關(guān)系(conceptual relations)里。

在更理論的層面,這場(chǎng)爭(zhēng)論還牽扯到老牌的哲學(xué)與認(rèn)知科學(xué)分歧:符號(hào)主義(symbolism) VS 連接主義(connectionism)。

符號(hào)主義強(qiáng)調(diào)概念是類似“符號(hào)”的離散單元,可以組合推理、構(gòu)成邏輯結(jié)構(gòu);

連接主義則把概念看作神經(jīng)網(wǎng)絡(luò)中分布式、漸進(jìn)的激活模式,更適合處理噪聲和經(jīng)驗(yàn)學(xué)習(xí)。

人類概念似乎同時(shí)具備兩方面的優(yōu)點(diǎn):既有可以清晰界定、可用語言定義的“概念內(nèi)涵”(例如“月亮是地球的天然衛(wèi)星”),又有連續(xù)、漸變的表征空間(例如“獵豹比貓快,但沒快到離譜”的“快慢等級(jí)”)。那 LLM 里是否也存在類似的結(jié)構(gòu)?

這篇發(fā)表在 PNAS 的工作,正面回應(yīng)了這些爭(zhēng)議。作者團(tuán)隊(duì)提出:

與其只看模型輸出,不如直接去“挖”模型內(nèi)部的概念表征(conceptual representation);關(guān)鍵是要設(shè)計(jì)一個(gè)任務(wù),讓模型在一個(gè)比較接近“人類用概念”的情境下工作,然后分析它此時(shí)形成的內(nèi)部向量結(jié)構(gòu)。

為此,他們把日常生活中常見的“反向詞典任務(wù)(reverse dictionary)”當(dāng)成了一個(gè)通用的“概念探針”。所謂反向詞典,就是給你一段文字描述,讓你猜是什么詞,比如:“地球唯一的天然衛(wèi)星,夜空中圓圓亮亮的那個(gè)東西”——你會(huì)回答“月亮”。

對(duì)人類來說,這個(gè)任務(wù)其實(shí)是在做兩件事:

  • 根據(jù)語言描述,在腦中構(gòu)造一個(gè)概念

  • 再從已有詞匯中找出最匹配這個(gè)概念的詞

作者認(rèn)為,如果我們讓 LLM 在類似情境下工作,并且在它“準(zhǔn)備給出那個(gè)詞”的瞬間,讀取它內(nèi)部某一層的向量,就可以把這向量視為模型對(duì)該概念的“心理表征”

論文中 圖 1(第 3 頁) 畫出了這一流程:模型先看到若干“描述 ? 詞(description ? word)”的示例作為上下文,再看到一個(gè)只給描述、不給詞的查詢句子,最后在箭頭位置輸出最可能的詞。“箭頭”處的隱藏狀態(tài)向量,就是作者提取的概念向量。

接下來作者做了幾件事:

考察 LLM 是否真的能從定義中穩(wěn)定“長(zhǎng)出”概念

他們利用 THINGS 數(shù)據(jù)庫中近 2000 個(gè)日常物體概念的定義描述,對(duì)開源大模型 LLaMA3-70B 等進(jìn)行大規(guī)模測(cè)試,發(fā)現(xiàn):只需少量示例(十幾個(gè))作為上下文,模型就能在反向詞典任務(wù)中達(dá)到接近 90% 的嚴(yán)格詞匯匹配準(zhǔn)確率。這說明,模型不是簡(jiǎn)單地“記字符串”,而是能把不同表述統(tǒng)一到同一個(gè)概念上。

看這些概念向量在不同上下文中是否仍保持一個(gè)“共享結(jié)構(gòu)”

作者反復(fù)更換示例組合、演示順序等“語境”,每次都抽取模型內(nèi)部的概念表征,并用表征相似性分析(representational similarity analysis, RSA)去看:不同語境下,同一批概念之間的“距離關(guān)系”是否穩(wěn)定。結(jié)果顯示,當(dāng)示例數(shù)量增加到 20 多個(gè)左右時(shí),不同語境下的表示空間高度相似,且這種收斂程度與模型在任務(wù)上的準(zhǔn)確率高度相關(guān)。這意味著,模型在語言預(yù)測(cè)訓(xùn)練下,自發(fā)形成了一個(gè)相對(duì)**上下文無關(guān)(context-independent)**的概念結(jié)構(gòu)。

把模型里的概念結(jié)構(gòu),拿去預(yù)測(cè)人類行為和腦活動(dòng)

在心理學(xué)層面,作者用這些概念向量去預(yù)測(cè)人類的語義相似性判斷、類別歸屬(比如“動(dòng)物”“食物”等)、以及“獵豹有多快”“鯨有多大”這類沿特定特征維度的等級(jí)評(píng)分。模型的表現(xiàn)整體上明顯優(yōu)于傳統(tǒng)靜態(tài)詞向量(如 FastText、GloVe),并在多數(shù)數(shù)據(jù)集上接近人類一致性的“上限”。

在神經(jīng)科學(xué)層面,他們利用 THINGS 數(shù)據(jù)集中的功能磁共振成像(functional magnetic resonance imaging, fMRI)數(shù)據(jù),用線性編碼模型預(yù)測(cè)人腦在看物體圖片時(shí)的腦區(qū)激活。結(jié)果顯示,LLM 概念向量能解釋的方差廣泛分布于視覺皮層及高階語義相關(guān)區(qū)域,尤其在側(cè)枕葉、梭狀回等“類別選擇性”區(qū)域表現(xiàn)突出。

當(dāng)然,這種類人相似性也并非完美。作者發(fā)現(xiàn),模型尤其在顏色、紋理等強(qiáng)感知維度上,與人類判斷存在顯著差距;在 fMRI 分析中,基于人類相似性數(shù)據(jù)訓(xùn)練的表征,在早期視覺皮層(如 V1)對(duì)腦活動(dòng)的解釋力仍明顯優(yōu)于 LLM 表征。換句話說,只靠語言預(yù)測(cè)長(zhǎng)出的概念,已經(jīng)能很好覆蓋高層語義結(jié)構(gòu),但對(duì)細(xì)膩的感知細(xì)節(jié)還不夠敏感。

總體來看,這篇工作給了一個(gè)相當(dāng)有力、但也相當(dāng)謹(jǐn)慎的結(jié)論:在完全沒有“真實(shí)世界”感知輸入、只做下一詞預(yù)測(cè)的前提下,大語言模型內(nèi)部會(huì)自發(fā)涌現(xiàn)出一個(gè)結(jié)構(gòu)化的、與人類相當(dāng)接近的概念空間。這個(gè)空間兼具“符號(hào)式”的清晰可定義性與“向量式”的連續(xù)性與可計(jì)算性,既能支撐類似人類的相似性判斷和分類,又在很大程度上映射到人腦中對(duì)概念的編碼方式。

這不僅為理解 LLM “到底懂不懂”提供了一個(gè)新的角度,也為未來把 LLM 當(dāng)作“可控、可觀察的心智模型”,去研究人類概念系統(tǒng)本身,打下了重要基礎(chǔ)。


核心圖表


Fig. 1. Illustration of the reverse dictionary task as a conceptual probe.


Fig. 2. Performance of LLaMA3-70B on the reverse dictionary task measured through exact match accuracy.


Fig. 3. LLMs converge toward a similar representational structure of concepts.


Fig. 4. Alignment between LLM-derived conceptual representations and psychological measures of similarity.


Fig. 5. Performance of conceptual representations derived from LLaMA3-70B in predicting context-dependent human ratings across 52 category–feature pairs.


Fig. 6. Comparison of LLM-derived conceptual representations and static word embeddings in predicting context-dependent human ratings.


Fig. 7. Prediction performance of LLM-derived conceptual representation (LLaMA3-70B) in voxel-wise encoding and comparisons with baseline models.


前沿交流|歡迎加入認(rèn)知神經(jīng)科學(xué)前沿交流群!


核心圖表、方法細(xì)節(jié)、統(tǒng)計(jì)結(jié)果與討論見原文及其拓展數(shù)據(jù)。

分享人:BQ

審核:PsyBrain 腦心前沿編輯部

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
老人被城管推翻后續(xù)!老人去世,其單位受牽連,警方通報(bào): 已刑拘

老人被城管推翻后續(xù)!老人去世,其單位受牽連,警方通報(bào): 已刑拘

社會(huì)日日鮮
2025-12-27 05:29:43
小米YU7車主TICC再發(fā)聲:因車禍截肢,與女友婚事作廢,大感遺憾

小米YU7車主TICC再發(fā)聲:因車禍截肢,與女友婚事作廢,大感遺憾

娜烏和西卡
2025-12-26 17:09:13
精準(zhǔn)斬首!泰國無人機(jī)斬首行動(dòng)震驚東南亞!洪森指揮鏈遭團(tuán)滅!

精準(zhǔn)斬首!泰國無人機(jī)斬首行動(dòng)震驚東南亞!洪森指揮鏈遭團(tuán)滅!

深度報(bào)
2025-12-24 22:47:16
75歲港星小36歲未婚妻被曝已婚,冬至與丈夫在老家吃飯,兒子16歲

75歲港星小36歲未婚妻被曝已婚,冬至與丈夫在老家吃飯,兒子16歲

觀察鑒娛
2025-12-27 10:00:22
知名熟食品牌致歉,10倍現(xiàn)金補(bǔ)償消費(fèi)者!很多人吃過

知名熟食品牌致歉,10倍現(xiàn)金補(bǔ)償消費(fèi)者!很多人吃過

中國經(jīng)濟(jì)網(wǎng)
2025-12-26 16:28:03
吃瓜!湖南某大院,亂成一鍋粥了!

吃瓜!湖南某大院,亂成一鍋粥了!

黯泉
2025-12-26 22:28:09
一年閉店近9萬家,平均壽命32個(gè)月,網(wǎng)紅面包賣不動(dòng)了

一年閉店近9萬家,平均壽命32個(gè)月,網(wǎng)紅面包賣不動(dòng)了

藍(lán)鯨新聞
2025-12-26 19:37:04
注意,開始拉物價(jià)了!

注意,開始拉物價(jià)了!

米筐投資
2025-12-27 07:04:52
食堂承包商舉報(bào)校領(lǐng)導(dǎo)兩年拿走300多萬現(xiàn)金,官方回應(yīng):已組成聯(lián)合調(diào)查組,盡快查清事實(shí),依規(guī)依紀(jì)依法處理

食堂承包商舉報(bào)校領(lǐng)導(dǎo)兩年拿走300多萬現(xiàn)金,官方回應(yīng):已組成聯(lián)合調(diào)查組,盡快查清事實(shí),依規(guī)依紀(jì)依法處理

新京報(bào)政事兒
2025-12-26 20:23:02
段永平說:我教兒子投資的第一件事是每天要去跑步

段永平說:我教兒子投資的第一件事是每天要去跑步

馬拉松跑步健身
2025-12-26 21:42:28
國運(yùn)由誰決定?從烏克蘭的悲劇,回看教員那幾次“孤獨(dú)的堅(jiān)持”

國運(yùn)由誰決定?從烏克蘭的悲劇,回看教員那幾次“孤獨(dú)的堅(jiān)持”

遠(yuǎn)方風(fēng)林
2025-12-26 00:05:55
換了車我才悟了:寧可多花點(diǎn)錢,汽車也要堅(jiān)持4不買!建議收藏!

換了車我才悟了:寧可多花點(diǎn)錢,汽車也要堅(jiān)持4不買!建議收藏!

藍(lán)色海邊
2025-12-27 07:14:15
2 年采購 323 億 GPU:被調(diào)查

2 年采購 323 億 GPU:被調(diào)查

云頭條
2025-12-26 23:37:14
聯(lián)盟倒數(shù)第一3人20+爆冷大勝猛龍 鶯歌29+6奎克利25分

聯(lián)盟倒數(shù)第一3人20+爆冷大勝猛龍 鶯歌29+6奎克利25分

醉臥浮生
2025-12-27 10:28:09
60:51票!臺(tái)島彈劾提案通過,賴清德時(shí)代或告終,盧秀燕一針見血

60:51票!臺(tái)島彈劾提案通過,賴清德時(shí)代或告終,盧秀燕一針見血

時(shí)時(shí)有聊
2025-12-26 16:52:03
1-0!鐵衛(wèi)處子球,曼聯(lián)復(fù)仇紐卡升英超第五,烏加特甩掉災(zāi)星帽子

1-0!鐵衛(wèi)處子球,曼聯(lián)復(fù)仇紐卡升英超第五,烏加特甩掉災(zāi)星帽子

釘釘陌上花開
2025-12-27 08:00:23
0-4!斯諾克爆出大冷:49歲世界冠軍一輪游!4強(qiáng)全部誕生附賽程

0-4!斯諾克爆出大冷:49歲世界冠軍一輪游!4強(qiáng)全部誕生附賽程

球場(chǎng)沒跑道
2025-12-27 08:46:17
紫牛熱點(diǎn)∣周大福售“牛馬”吊墜被指有“陰陽”之意!客服:只是寓意不怕困難、好運(yùn)“jia”倍

紫牛熱點(diǎn)∣周大福售“牛馬”吊墜被指有“陰陽”之意!客服:只是寓意不怕困難、好運(yùn)“jia”倍

揚(yáng)子晚報(bào)
2025-12-26 19:45:55
姜昆“美國唱紅歌”事件再度升級(jí),郭德綱和寧靜的話,一針見血

姜昆“美國唱紅歌”事件再度升級(jí),郭德綱和寧靜的話,一針見血

得得電影
2025-12-26 13:58:03
俄國防部前副部長(zhǎng)薩多文科上將在莫斯科突然去世,享年56歲

俄國防部前副部長(zhǎng)薩多文科上將在莫斯科突然去世,享年56歲

山河路口
2025-12-26 19:47:21
2025-12-27 11:04:49
PsyBrain腦心前沿
PsyBrain腦心前沿
追蹤腦科學(xué)新動(dòng)態(tài),聚焦認(rèn)知與神經(jīng)新研究
79文章數(shù) 6關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

女子洗澡浴室玻璃突然自爆致受傷 開發(fā)商:已超質(zhì)保期

頭條要聞

女子洗澡浴室玻璃突然自爆致受傷 開發(fā)商:已超質(zhì)保期

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

王傳君生病后近照變化大,面部浮腫

財(cái)經(jīng)要聞

注意,開始拉物價(jià)了!

汽車要聞

保時(shí)捷經(jīng)銷商連夜閉店,維權(quán)車主寒風(fēng)中瑟瑟發(fā)抖

態(tài)度原創(chuàng)

手機(jī)
本地
藝術(shù)
房產(chǎn)
軍事航空

手機(jī)要聞

小米17 Ultra今天開售!雷軍:史上最好看的小米影像旗艦

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

藝術(shù)要聞

毛主席致徐悲鴻信件曝光,書法風(fēng)格引關(guān)注。

房產(chǎn)要聞

炸裂,三亞360億超級(jí)清單發(fā)布,又一批重大配套要來了!

軍事要聞

英法德三國領(lǐng)導(dǎo)人通話 重申對(duì)烏支持

無障礙瀏覽 進(jìn)入關(guān)懷版