国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

北大最新NHB:神經(jīng)網(wǎng)絡與病灶模型聯(lián)手破解“語言-視覺”調節(jié)機制

0
分享至

PsyBrain 腦心前沿 | 公眾號 PSY-Brain_Frontier

一鍵關注,點亮星標 ??

不錯過每日前沿資訊

認知神經(jīng)科學前沿文獻分享


基本信息

Title:Combined evidence from artificial neural networks and human brain-lesion models reveals that language modulates vision in human perception

發(fā)表時間:2025.12.15

發(fā)表期刊:Nature Human Behaviour

影響因子:16.0

獲取原文:

  1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本



研究背景

“我們看到的藍色,是一樣的藍色嗎?”

這不僅僅是一個哲學思辨,更是認知科學中一個經(jīng)典的“雞生蛋,蛋生雞”問題:語言是否重塑了我們對世界的感知?


長久以來,傳統(tǒng)的視覺神經(jīng)科學觀點傾向于認為,視覺處理是一個主要由外界輸入驅動的“自下而上”的過程。我們的初級視覺皮層提取線條、顏色,然后傳遞到高級視覺皮層(如腹側枕顳皮層,VOTC)進行物體識別,最后才被打上語言的標簽。在這種視角下,語言似乎只是視覺感知的“后期注腳”。

然而,隨著深度學習的爆發(fā),尤其是像對比語言-圖像預訓練(Contrastive Language-Image Pretraining,CLIP)這樣結合了海量文本與圖像訓練的多模態(tài)大模型的出現(xiàn),事情變得有趣起來。研究發(fā)現(xiàn),這些“讀過書”的視覺模型,其內部表征竟然比純粹看圖訓練的模型(如ResNet或MoCo)更像人類的大腦。這是否暗示著,人類的視覺皮層在漫長的發(fā)育和學習中,其實早已被語言“滲透”了?

遺憾的是,AI模型畢竟是“黑盒”,無論它們與大腦多相似,都只能提供相關性證據(jù),無法證明因果性。我們無法確定,是因為模型學到了類似語言的高階語義關系,還是因為模型單純用了更多的數(shù)據(jù)?為了解開這個謎題,我們需要更直接的證據(jù),即來自人腦“損傷模型”的因果證據(jù)。

本研究巧妙地結合了最新的人工神經(jīng)網(wǎng)絡(ANNs)與珍貴的人腦損傷數(shù)據(jù)(Lesion data),試圖回答一個核心問題:切斷語言與視覺的神經(jīng)通路,會讓我們的視覺大腦“退化”回純視覺的狀態(tài)嗎?


Fig. 1 | Overview of the fMRI datasets, vision models and study 1 analysis schema.


研究核心總結

本研究通過跨學科的創(chuàng)新視角,揭示了語言系統(tǒng)對人類腹側枕顳皮層(VOTC)物體表征的動態(tài)調節(jié)作用。


Fig. 2 | Intercorrelations among vision model RDMs and their alignment with human behaviour.

多模態(tài)大模型更精準地預測了VOTC的神經(jīng)活動

研究團隊首先在四個涵蓋不同任務、不同人群(包括聽障人士)的fMRI數(shù)據(jù)集上,對比了三種不同訓練機制的深度神經(jīng)網(wǎng)絡模型對VOTC神經(jīng)活動的解釋力 :

  1. CLIP(句子級語言監(jiān)督):學習圖像與自然語言描述的對應關系。

  2. ResNet(詞匯級標簽監(jiān)督):學習圖像與離散類別標簽(Label)的對應。

  3. MoCo(無監(jiān)督/自監(jiān)督):僅從圖像自身的統(tǒng)計規(guī)律中學習,不涉及語言。

表征相似性分析(RSA)結果顯示,CLIP模型在解釋VOTC神經(jīng)表征方差方面,始終優(yōu)于ResNet和MoCo。這表明,包含豐富語義關系(Semantic Relations)的句子級語言信息,使機器視覺模型更接近人類的視覺皮層運作方式。此外,這種“CLIP優(yōu)勢效應”在群體水平上表現(xiàn)出明顯的左側偏側化(Left-lateralized)趨勢,這與人類語言網(wǎng)絡的偏側化特征高度一致。


Fig. 3 | Language effect in VOTC across datasets.

左側角回是語言調節(jié)視覺的關鍵樞紐

為了確立因果關系,研究考察了33位腦卒中患者。研究者量化了患者腦中連接VOTC與語言網(wǎng)絡各節(jié)點的白質纖維束(White Matter Tracts)的完整性。


Fig. 4 | Study 2 analysis workflow linking WM integrity and model–brain correspondence in patients with chronic stroke.

核心發(fā)現(xiàn)令人震驚:左側VOTC與左側角回(Left Angular Gyrus, AG)之間白質通路的完整性,直接決定了視覺皮層的表征模式。

  • 當這條通路完整時,VOTC的表征更接近CLIP模型(受語言深度影響)。

  • 當這條通路受損時,CLIP模型的解釋力顯著下降,而MoCo模型(純視覺自監(jiān)督)的解釋力反而顯著上升 。

這一“此消彼長”的現(xiàn)象揭示了極其深刻的機制:人類的視覺皮層并不總是處在單一的固化狀態(tài),而是處于“純視覺輸入”與“語言調節(jié)”的動態(tài)平衡中。左側角回作為跨模態(tài)語義整合的樞紐,通過白質纖維束將語言中的關系結構“注入”視覺皮層。一旦這種注入被阻斷,視覺皮層就會發(fā)生可塑性變化,退回到一種更依賴低級視覺統(tǒng)計特征(類似MoCo)的處理模式。


Fig. 5 | WM integrity of left VOTC–left AG tract predicts model–brain correspondence of CLIP and MoCo (n = 33 patients).

總而言之,該研究為“語言調節(jié)視覺”的理論爭議提供了強有力的神經(jīng)解剖學因果證據(jù)。它證明了語言對視覺的影響不是一種單純的自上而下的注意機制,而是深刻改變了視覺皮層對物體表征的幾何結構(Representational Geometry)。同時,這也驗證了利用腦損傷數(shù)據(jù)來評估和優(yōu)化AI模型的“生物合理性”是一個極具潛力的研究范式,并再次證明了AI for Science的光明前景。


Fig. 6 | Validation analyses using vision models trained on the identical dataset.


Abstract

Comparing information structures in between deep neural networks (DNNs) and the human brain has become a key method for exploring their similarities and differences. Recent research has shown better alignment of vision–language DNN models, such as contrastive language–image pretraining (CLIP), with the activity of the human ventral occipitotemporal cortex (VOTC) than earlier vision models, supporting the idea that language modulates human visual perception. However, interpreting the results from such comparisons is inherently limited owing to the ‘black box’ nature of DNNs. Here we combine model–brain fitness analyses with human brain lesion data to examine how disrupting the communication pathway between the visual and language systems causally affects the ability of vision–language DNNs to explain the activity of the VOTC to address this. Across four diverse datasets, CLIP consistently captured unique variance in VOTC neural representations, relative to both label-supervised (ResNet) and unsupervised (MoCo) models. This advantage tended to be left-lateralized at the group level, aligning with the human language network. Analyses of 33 patients who experienced a stroke revealed that reduced white matter integrity between the VOTC and the language region in the left angular gyrus was correlated with decreased CLIP–brain correspondence and increased MoCo–brain correspondence, indicating a dynamic influence of language processing on the activity of the VOTC. These findings support the integration of language modulation in neurocognitive models of human vision, reinforcing concepts from vision–language DNN models. The sensitivity of model–brain similarity to specific brain lesions demonstrates that leveraging the manipulation of the human brain is a promising framework for evaluating and developing brain-like computer models.


請打分

這篇剛剛登上Nature Human Behaviour的研究,是否實至名歸?我們邀請您作為“云審稿人”,一同品鑒。精讀全文后,歡迎在匿名投票中打分,并在評論區(qū)分享您的深度見解。

前沿交流|歡迎加入認知神經(jīng)科學前沿交流群!


解讀僅供參考,具體詳見原文及其數(shù)據(jù)

分享人:飯哥

審核:PsyBrain 腦心前沿編輯部

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
老人被城管推翻后續(xù)!老人去世,其單位受牽連,警方通報: 已刑拘

老人被城管推翻后續(xù)!老人去世,其單位受牽連,警方通報: 已刑拘

社會日日鮮
2025-12-27 05:29:43
小米YU7車主TICC再發(fā)聲:因車禍截肢,與女友婚事作廢,大感遺憾

小米YU7車主TICC再發(fā)聲:因車禍截肢,與女友婚事作廢,大感遺憾

娜烏和西卡
2025-12-26 17:09:13
精準斬首!泰國無人機斬首行動震驚東南亞!洪森指揮鏈遭團滅!

精準斬首!泰國無人機斬首行動震驚東南亞!洪森指揮鏈遭團滅!

深度報
2025-12-24 22:47:16
75歲港星小36歲未婚妻被曝已婚,冬至與丈夫在老家吃飯,兒子16歲

75歲港星小36歲未婚妻被曝已婚,冬至與丈夫在老家吃飯,兒子16歲

觀察鑒娛
2025-12-27 10:00:22
知名熟食品牌致歉,10倍現(xiàn)金補償消費者!很多人吃過

知名熟食品牌致歉,10倍現(xiàn)金補償消費者!很多人吃過

中國經(jīng)濟網(wǎng)
2025-12-26 16:28:03
吃瓜!湖南某大院,亂成一鍋粥了!

吃瓜!湖南某大院,亂成一鍋粥了!

黯泉
2025-12-26 22:28:09
一年閉店近9萬家,平均壽命32個月,網(wǎng)紅面包賣不動了

一年閉店近9萬家,平均壽命32個月,網(wǎng)紅面包賣不動了

藍鯨新聞
2025-12-26 19:37:04
注意,開始拉物價了!

注意,開始拉物價了!

米筐投資
2025-12-27 07:04:52
食堂承包商舉報校領導兩年拿走300多萬現(xiàn)金,官方回應:已組成聯(lián)合調查組,盡快查清事實,依規(guī)依紀依法處理

食堂承包商舉報校領導兩年拿走300多萬現(xiàn)金,官方回應:已組成聯(lián)合調查組,盡快查清事實,依規(guī)依紀依法處理

新京報政事兒
2025-12-26 20:23:02
段永平說:我教兒子投資的第一件事是每天要去跑步

段永平說:我教兒子投資的第一件事是每天要去跑步

馬拉松跑步健身
2025-12-26 21:42:28
國運由誰決定?從烏克蘭的悲劇,回看教員那幾次“孤獨的堅持”

國運由誰決定?從烏克蘭的悲劇,回看教員那幾次“孤獨的堅持”

遠方風林
2025-12-26 00:05:55
換了車我才悟了:寧可多花點錢,汽車也要堅持4不買!建議收藏!

換了車我才悟了:寧可多花點錢,汽車也要堅持4不買!建議收藏!

藍色海邊
2025-12-27 07:14:15
2 年采購 323 億 GPU:被調查

2 年采購 323 億 GPU:被調查

云頭條
2025-12-26 23:37:14
聯(lián)盟倒數(shù)第一3人20+爆冷大勝猛龍 鶯歌29+6奎克利25分

聯(lián)盟倒數(shù)第一3人20+爆冷大勝猛龍 鶯歌29+6奎克利25分

醉臥浮生
2025-12-27 10:28:09
60:51票!臺島彈劾提案通過,賴清德時代或告終,盧秀燕一針見血

60:51票!臺島彈劾提案通過,賴清德時代或告終,盧秀燕一針見血

時時有聊
2025-12-26 16:52:03
1-0!鐵衛(wèi)處子球,曼聯(lián)復仇紐卡升英超第五,烏加特甩掉災星帽子

1-0!鐵衛(wèi)處子球,曼聯(lián)復仇紐卡升英超第五,烏加特甩掉災星帽子

釘釘陌上花開
2025-12-27 08:00:23
0-4!斯諾克爆出大冷:49歲世界冠軍一輪游!4強全部誕生附賽程

0-4!斯諾克爆出大冷:49歲世界冠軍一輪游!4強全部誕生附賽程

球場沒跑道
2025-12-27 08:46:17
紫牛熱點∣周大福售“牛馬”吊墜被指有“陰陽”之意!客服:只是寓意不怕困難、好運“jia”倍

紫牛熱點∣周大福售“牛馬”吊墜被指有“陰陽”之意!客服:只是寓意不怕困難、好運“jia”倍

揚子晚報
2025-12-26 19:45:55
姜昆“美國唱紅歌”事件再度升級,郭德綱和寧靜的話,一針見血

姜昆“美國唱紅歌”事件再度升級,郭德綱和寧靜的話,一針見血

得得電影
2025-12-26 13:58:03
俄國防部前副部長薩多文科上將在莫斯科突然去世,享年56歲

俄國防部前副部長薩多文科上將在莫斯科突然去世,享年56歲

山河路口
2025-12-26 19:47:21
2025-12-27 11:04:49
PsyBrain腦心前沿
PsyBrain腦心前沿
追蹤腦科學新動態(tài),聚焦認知與神經(jīng)新研究
79文章數(shù) 6關注度
往期回顧 全部

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

頭條要聞

女子洗澡浴室玻璃突然自爆致受傷 開發(fā)商:已超質保期

頭條要聞

女子洗澡浴室玻璃突然自爆致受傷 開發(fā)商:已超質保期

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

王傳君生病后近照變化大,面部浮腫

財經(jīng)要聞

注意,開始拉物價了!

汽車要聞

保時捷經(jīng)銷商連夜閉店,維權車主寒風中瑟瑟發(fā)抖

態(tài)度原創(chuàng)

教育
手機
藝術
公開課
軍事航空

教育要聞

全球留學質量指數(shù)發(fā)布,中國競爭力顯現(xiàn)

手機要聞

小米17 Ultra今天開售!雷軍:史上最好看的小米影像旗艦

藝術要聞

毛主席致徐悲鴻信件曝光,書法風格引關注。

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

英法德三國領導人通話 重申對烏支持

無障礙瀏覽 進入關懷版