国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

大模型長(zhǎng)腦子了?研究發(fā)現(xiàn)LLM中層會(huì)自發(fā)模擬人腦進(jìn)化

0
分享至

編輯|Panda


生物智能與人工智能的演化路徑截然不同,但它們是否遵循某些共同的計(jì)算原理?

最近,來自帝國(guó)理工學(xué)院、華為諾亞方舟實(shí)驗(yàn)室等機(jī)構(gòu)的研究人員發(fā)表了一篇新論文。該研究指出,大型語言模型(LLM)在學(xué)習(xí)過程中會(huì)自發(fā)演化出一種協(xié)同核心(Synergistic Core)結(jié)構(gòu),有些類似于生物的大腦。



  • 論文標(biāo)題:A Brain-like Synergistic Core in LLMs Drives Behaviour and Learning
  • 論文地址:https://arxiv.org/abs/2601.06851



研究團(tuán)隊(duì)利用部分信息分解(Partial Information Decomposition, PID)框架,對(duì) Gemma、Llama、Qwen 和 DeepSeek 等模型進(jìn)行了深度剖析。

他們發(fā)現(xiàn),這些模型的中層表現(xiàn)出極強(qiáng)的協(xié)同處理能力,而底層和頂層則更偏向于冗余處理。

協(xié)同與冗余:LLM 的內(nèi)部架構(gòu)

研究團(tuán)隊(duì)將大型語言模型視為分布式信息處理系統(tǒng),其核心實(shí)驗(yàn)設(shè)計(jì)旨在量化模型內(nèi)部組件之間交互的本質(zhì)。為了實(shí)現(xiàn)這一目標(biāo),研究者選取了 Gemma 3、Llama 3、Qwen 3 8B 以及 DeepSeek V2 Lite Chat 等多種具有代表性的模型系列進(jìn)行對(duì)比分析。

實(shí)驗(yàn)方法與量化指標(biāo)

在實(shí)驗(yàn)過程中,研究者向模型輸入了涵蓋語法糾錯(cuò)、邏輯推理、常識(shí)問答等 6 個(gè)類別的認(rèn)知任務(wù)提示詞。

針對(duì)每一個(gè)提示詞,模型會(huì)生成一段 100 個(gè) Token 的回答,實(shí)驗(yàn)設(shè)備則同步記錄下每一層中所有注意力頭或?qū)<夷K的激活值。

具體而言,研究人員計(jì)算了這些輸出向量的 L2 范數(shù),以此作為該單元在特定時(shí)間步的激活強(qiáng)度數(shù)據(jù)。

基于這些時(shí)間序列數(shù)據(jù),研究團(tuán)隊(duì)?wèi)?yīng)用了整合信息分解(Integrated Information Decomposition, ID)框架。

這一框架能夠?qū)⒆⒁饬︻^對(duì)之間的交互分解為「持續(xù)性協(xié)同」和「持續(xù)性冗余」等不同原子項(xiàng)。

通過對(duì)所有注意力頭對(duì)的協(xié)同值和冗余值進(jìn)行排名并求差,研究者得到了一個(gè)關(guān)鍵指標(biāo):協(xié)同-冗余秩(Synergy-Redundancy Rank)。該指標(biāo)能夠清晰地標(biāo)示出模型組件在處理信息時(shí),究竟是傾向于進(jìn)行獨(dú)立的信號(hào)聚合,還是在進(jìn)行跨單元的深度集成。

跨模型的空間分布規(guī)律

實(shí)驗(yàn)數(shù)據(jù)揭示了一個(gè)在不同架構(gòu)模型中高度一致的空間組織規(guī)律。在歸一化后的模型層深圖中,協(xié)同分布呈現(xiàn)出顯著的「倒 U 型」曲線 :



  • 冗余外周(Redundant Periphery):模型的早期層(靠近輸入端)和末期層(靠近輸出端)表現(xiàn)出極低的協(xié)同秩,信息處理以冗余模式為主。在早期層,這反映了模型在進(jìn)行基本的解詞元化(Detokenization)和局部特征提??;而在末期層,則對(duì)應(yīng)著 Token 預(yù)測(cè)和輸出格式化的過程。
  • 協(xié)同核心(Synergistic Core):模型的中層則展現(xiàn)出極高的協(xié)同秩,形成了核心處理區(qū)。例如,在對(duì) Gemma 3 4B 的熱圖分析中,中間層的注意力頭之間表現(xiàn)出密集且強(qiáng)烈的協(xié)同交互,這正是模型進(jìn)行高級(jí)語義集成和抽象推理的區(qū)域。

架構(gòu)差異與一致性

值得注意的是,這種「協(xié)同核心」的涌現(xiàn)并不依賴于特定的技術(shù)實(shí)現(xiàn)。

在 DeepSeek V2 Lite 模型中,研究者即使是以「專家模塊」而非「注意力頭」作為分析單位,依然觀察到了相同的空間分布特征。

這種跨架構(gòu)的收斂性表明,協(xié)同處理可能是實(shí)現(xiàn)高級(jí)智能的一種計(jì)算必然,而非單純的工程巧合。

這種組織模式與人腦的生理結(jié)構(gòu)形成了精確的映射:人腦的感官和運(yùn)動(dòng)區(qū)域同樣表現(xiàn)出高冗余性,而負(fù)責(zé)復(fù)雜認(rèn)知功能的聯(lián)合皮層則處于高協(xié)同的「全局工作空間」中心。

智能的涌現(xiàn):學(xué)習(xí)驅(qū)動(dòng)而非架構(gòu)使然

一個(gè)關(guān)鍵的問題在于:這種結(jié)構(gòu)是 Transformer 架構(gòu)自帶的,還是通過學(xué)習(xí)習(xí)得的?

研究人員通過分析 Pythia 1B 模型的訓(xùn)練過程發(fā)現(xiàn),在隨機(jī)初始化的網(wǎng)絡(luò)中,這種「倒 U 型」的協(xié)同分布并不存在。隨著訓(xùn)練步數(shù)的增加,這種組織架構(gòu)才逐漸穩(wěn)定形成。



這意味著,協(xié)同核心是大模型獲得能力的標(biāo)志性產(chǎn)物。

在拓?fù)湫再|(zhì)上,協(xié)同核心具有極高的「全局效率」,有利于信息的快速集成;而冗余外周則表現(xiàn)出更強(qiáng)的「模塊化」,適用于專門化處理。這種特征再次與人類大腦的網(wǎng)絡(luò)架構(gòu)形成了精確的平行關(guān)系。

協(xié)同核心的功能驗(yàn)證

為了驗(yàn)證協(xié)同核心是否真的驅(qū)動(dòng)了模型行為,研究團(tuán)隊(duì)進(jìn)行了兩類干預(yù)實(shí)驗(yàn):消融實(shí)驗(yàn)和微調(diào)實(shí)驗(yàn)。

消融實(shí)驗(yàn):研究發(fā)現(xiàn),消融那些高協(xié)同性的節(jié)點(diǎn),會(huì)導(dǎo)致模型出現(xiàn)災(zāi)難性的性能下降和行為背離,其影響遠(yuǎn)超隨機(jī)消融或消融冗余節(jié)點(diǎn)。這證明協(xié)同核心是模型智能的核心驅(qū)動(dòng)力。



微調(diào)實(shí)驗(yàn):在強(qiáng)化學(xué)習(xí)微調(diào)(RL FT)場(chǎng)景下,僅針對(duì)協(xié)同核心進(jìn)行訓(xùn)練,獲得的性能提升顯著優(yōu)于針對(duì)冗余核心或隨機(jī)子集的訓(xùn)練。有趣的是,在監(jiān)督微調(diào)(SFT)中這種差異并不明顯。研究者認(rèn)為,這反映了 RL 促進(jìn)通用化而 SFT 更多傾向于記憶的特性。



結(jié)語

這項(xiàng)研究為大模型的可解釋性開辟了新路徑。它表明,我們可以從「自上而下」的信息論視角來理解模型,而不僅僅是「自下而上」地尋找特定的電路。

對(duì)于 AI 領(lǐng)域,識(shí)別協(xié)同核心有助于設(shè)計(jì)更高效的壓縮算法,或者通過更有針對(duì)性的參數(shù)更新來加速訓(xùn)練。對(duì)于神經(jīng)科學(xué),這提供了一種計(jì)算上的驗(yàn)證,預(yù)示著協(xié)同回路在強(qiáng)化學(xué)習(xí)和知識(shí)遷移中可能扮演著至關(guān)重要的角色。

大模型雖然基于硅基芯片和反向傳播算法,但在追求智能的過程中,它們似乎不約而同地走向了與生物大腦相似的組織模式。這種智能演化的趨同性,或許正是我們揭開通用智能奧秘的關(guān)鍵線索。

更多詳情請(qǐng)參閱原論文。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
獨(dú)木難支!東契奇空砍27+5+12 場(chǎng)均33.4分穩(wěn)居得分王寶座

獨(dú)木難支!東契奇空砍27+5+12 場(chǎng)均33.4分穩(wěn)居得分王寶座

大眼瞄世界
2026-01-15 00:32:43
痛心!74歲“棋圣”聶衛(wèi)平去世,原因是直腸癌,三婚娶小23歲嬌妻

痛心!74歲“棋圣”聶衛(wèi)平去世,原因是直腸癌,三婚娶小23歲嬌妻

180視角
2026-01-15 09:32:04
劉強(qiáng)東沒想到,離過年不到2月,章澤天走上了和田樸珺一樣的路

劉強(qiáng)東沒想到,離過年不到2月,章澤天走上了和田樸珺一樣的路

查爾菲的筆記
2026-01-14 21:39:35
14年后,再看“京城四少”的現(xiàn)狀,才明白娶一個(gè)好老婆有多重要

14年后,再看“京城四少”的現(xiàn)狀,才明白娶一個(gè)好老婆有多重要

豐譚筆錄
2026-01-13 07:20:11
女子醉酒后見前男友和閨蜜同在廁所難以接受,墜樓致截癱起訴多方索賠 判了

女子醉酒后見前男友和閨蜜同在廁所難以接受,墜樓致截癱起訴多方索賠 判了

紅星新聞
2026-01-14 14:32:07
李亞鵬回應(yīng)欠2600萬:醫(yī)院牌子被房東強(qiáng)拆,500萬漲到1100萬太貴

李亞鵬回應(yīng)欠2600萬:醫(yī)院牌子被房東強(qiáng)拆,500萬漲到1100萬太貴

李健政觀察
2026-01-14 16:36:37
“每賣一輛問界,13.6萬流向華為”,賽力斯最新披露來了

“每賣一輛問界,13.6萬流向華為”,賽力斯最新披露來了

智能車參考
2026-01-14 17:14:37
特朗普稱澤連斯基阻礙和平協(xié)議

特朗普稱澤連斯基阻礙和平協(xié)議

界面新聞
2026-01-15 09:33:30
連勝3場(chǎng)!吳易昺直落兩盤橫掃過關(guān),時(shí)隔3年重返澳網(wǎng)正賽

連勝3場(chǎng)!吳易昺直落兩盤橫掃過關(guān),時(shí)隔3年重返澳網(wǎng)正賽

全景體育V
2026-01-15 11:15:30
47歲賀嬌龍搶救細(xì)節(jié)太催淚,生前曾一語成讖,和丈夫常分隔兩地

47歲賀嬌龍搶救細(xì)節(jié)太催淚,生前曾一語成讖,和丈夫常分隔兩地

古希臘掌管松餅的神
2026-01-15 11:14:09
痛心!賀嬌龍意外墜馬,頭部重傷不幸離世 生前曾談及為何堅(jiān)持騎馬拍視頻

痛心!賀嬌龍意外墜馬,頭部重傷不幸離世 生前曾談及為何堅(jiān)持騎馬拍視頻

紅星新聞
2026-01-15 01:12:10
迫于歐美的壓力,伊朗政府宣布暫停處決

迫于歐美的壓力,伊朗政府宣布暫停處決

一種觀點(diǎn)
2026-01-15 08:56:47
追覓員工怒懟CEO俞浩,其他員工紛紛截屏

追覓員工怒懟CEO俞浩,其他員工紛紛截屏

超角度
2026-01-15 12:30:36
伊朗處于最高戰(zhàn)備狀態(tài)!未排除動(dòng)武可能,特朗普:將“觀望”局勢(shì)發(fā)展!歐洲多國(guó)敦促其公民離開伊朗

伊朗處于最高戰(zhàn)備狀態(tài)!未排除動(dòng)武可能,特朗普:將“觀望”局勢(shì)發(fā)展!歐洲多國(guó)敦促其公民離開伊朗

每日經(jīng)濟(jì)新聞
2026-01-15 06:30:06
賀嬌龍離世!其大量騎馬不正確的踩馬鐙方式流出,或是悲劇的起因

賀嬌龍離世!其大量騎馬不正確的踩馬鐙方式流出,或是悲劇的起因

火山詩話
2026-01-15 05:41:36
碎三觀!重慶一男子和妻妹發(fā)生不當(dāng)關(guān)系轉(zhuǎn)賬380萬,妻子默許了…

碎三觀!重慶一男子和妻妹發(fā)生不當(dāng)關(guān)系轉(zhuǎn)賬380萬,妻子默許了…

火山詩話
2026-01-14 09:25:46
女演員佟麗婭連續(xù)三年收到蘇翊鳴贈(zèng)送的滑板,承諾“今年一定站上雪道”,兩人因《智取威虎山》結(jié)緣

女演員佟麗婭連續(xù)三年收到蘇翊鳴贈(zèng)送的滑板,承諾“今年一定站上雪道”,兩人因《智取威虎山》結(jié)緣

極目新聞
2026-01-15 11:22:20
2-3!1.5億巨頭失單刀,皇馬爆出驚天大冷,被西乙保級(jí)隊(duì)淘汰

2-3!1.5億巨頭失單刀,皇馬爆出驚天大冷,被西乙保級(jí)隊(duì)淘汰

我的護(hù)球最獨(dú)特
2026-01-15 06:13:13
專機(jī)已抵京,卡尼對(duì)臺(tái)叫停一件事,大陸發(fā)布照會(huì),民進(jìn)黨連犯4錯(cuò)

專機(jī)已抵京,卡尼對(duì)臺(tái)叫停一件事,大陸發(fā)布照會(huì),民進(jìn)黨連犯4錯(cuò)

時(shí)時(shí)有聊
2026-01-14 19:33:23
23歲女孩被逼迫嫁給39歲男子喝農(nóng)藥住進(jìn)ICU?當(dāng)?shù)貗D聯(lián)回應(yīng)

23歲女孩被逼迫嫁給39歲男子喝農(nóng)藥住進(jìn)ICU?當(dāng)?shù)貗D聯(lián)回應(yīng)

大風(fēng)新聞
2026-01-15 12:21:06
2026-01-15 14:19:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12121文章數(shù) 142536關(guān)注度
往期回顧 全部

科技要聞

千問接入淘寶支付寶,大模型開卷辦事能力

頭條要聞

銀幣半年暴漲20倍 杭州有人一口氣花30萬買15公斤銀磚

頭條要聞

銀幣半年暴漲20倍 杭州有人一口氣花30萬買15公斤銀磚

體育要聞

你是個(gè)好球員,我們就拿你交易吧

娛樂要聞

傳奇棋圣聶衛(wèi)平離世,網(wǎng)友集體悼念

財(cái)經(jīng)要聞

“瘋狂的白銀”,還能走多遠(yuǎn)?

汽車要聞

今年推出超40款新車,BBA要把失去的奪回來

態(tài)度原創(chuàng)

家居
房產(chǎn)
健康
藝術(shù)
游戲

家居要聞

自在自宅 個(gè)性自由

房產(chǎn)要聞

熱銷17億后!天正·三亞灣壹號(hào),被爆違建!

血常規(guī)3項(xiàng)異常,是身體警報(bào)!

藝術(shù)要聞

歷代書家集字春聯(lián)大集合

《輻射》經(jīng)典旁白原聲:初代參演報(bào)酬僅40美元

無障礙瀏覽 進(jìn)入關(guān)懷版