国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

ACL 2025 | 以知識(shí)回路視角揭秘大語(yǔ)言模型的新知識(shí)習(xí)得機(jī)理

0
分享至

本研究系統(tǒng)追蹤了大規(guī)模語(yǔ)言模型在持續(xù)預(yù)訓(xùn)練階段知識(shí)回路的動(dòng)態(tài)演化,由宏觀表現(xiàn)到微觀拓?fù)渑c組件逐層解析,揭示出若干關(guān)鍵規(guī)律。我們認(rèn)為,大語(yǔ)言模型并非不可解釋的黑箱,而是由海量知識(shí)回路構(gòu)成的精密系統(tǒng);深入理解這些回路的演化機(jī)制,或?yàn)闃?gòu)建更可控、更高效且更安全的人工智能奠定理論與技術(shù)基礎(chǔ)。


論文題目: How Do LLMs Acquire New Knowledge? A Knowledge Circuits Perspective on Continual Pre-Training 論文鏈接: https://arxiv.org/abs/2502.11196v2 代碼鏈接: https://github.com/zjunlp/DynamicKnowledgeCircuits
一、引言

當(dāng)今大語(yǔ)言模型正進(jìn)化得越來(lái)越聰明,展現(xiàn)出強(qiáng)大的“百科全書(shū)”能力,但你是否好奇它們是如何習(xí)得這些知識(shí)的?特別是當(dāng)世界不斷變化,新知識(shí)層出不窮,模型如何“更新”自己的認(rèn)知?究竟是“死記硬背”還是會(huì)在內(nèi)部重新組織結(jié)構(gòu)?

為了探索這些問(wèn)題,本文從“知識(shí)回路”的視角切入,通過(guò)追蹤分析模型內(nèi)部的計(jì)算子圖的動(dòng)態(tài)演化,系統(tǒng)揭示了大語(yǔ)言模型在持續(xù)預(yù)訓(xùn)練期間如何結(jié)構(gòu)性地整合、存儲(chǔ)和優(yōu)化新知識(shí)。


二、核心方法

本文首先構(gòu)建了一個(gè)可控的合成知識(shí)數(shù)據(jù)集,由虛構(gòu)人物及其出生地、大學(xué)、公司等信息構(gòu)成,覆蓋高、中、低頻率知識(shí),并確保這些知識(shí)在模型的預(yù)訓(xùn)練階段不存在,屬于新知識(shí)的范疇,并同時(shí)涵蓋相關(guān)新知識(shí)和全新知識(shí)兩種類型。隨后對(duì)decoder-only 架構(gòu)的 GPT-2、TinyLLaMA、Phi-1.5 等系列模型在合成構(gòu)建的新知識(shí)語(yǔ)料庫(kù)上進(jìn)行了持續(xù)預(yù)訓(xùn)練。

傳統(tǒng)的分析手段往往將大語(yǔ)言模型中的知識(shí)視為分散的“知識(shí)神經(jīng)元”或“記憶塊”,而本文從新穎的“知識(shí)回路”視角來(lái)進(jìn)行研究。什么是知識(shí)回路?它是模型內(nèi)部一個(gè)稀疏的計(jì)算子圖,由模型完整計(jì)算圖中少部分關(guān)鍵節(jié)點(diǎn)和邊組成,專門(mén)負(fù)責(zé)存儲(chǔ)和處理某一類特定知識(shí)。本文使用現(xiàn)有的回路發(fā)現(xiàn)方法EAP-IG,為模型中的每一條邊分配一個(gè)重要性分?jǐn)?shù),通過(guò)保留分?jǐn)?shù)絕對(duì)值最高的若干(約7%~15%)邊來(lái)識(shí)別回路。通過(guò)在持續(xù)預(yù)訓(xùn)練期間不同的訓(xùn)練檢查點(diǎn)上運(yùn)行 EAP-IG 方法可以識(shí)別不同階段的知識(shí)回路,進(jìn)一步可以分析它們的演化規(guī)律。本文的分析將由表及里從三個(gè)層面展開(kāi):

  • 性能表現(xiàn):知識(shí)回路獨(dú)立重現(xiàn)模型行為的表現(xiàn)如何變化?

  • 拓?fù)浣Y(jié)構(gòu):知識(shí)回路的拓?fù)浣Y(jié)構(gòu)如何變化?

  • 功能組件:組成知識(shí)回路的結(jié)點(diǎn)與邊如何變化?

三、核心發(fā)現(xiàn)知識(shí)回路表現(xiàn)分析


通過(guò)分析知識(shí)回路在持續(xù)預(yù)訓(xùn)練期間的性能變化,本文發(fā)現(xiàn)模型對(duì)于新知識(shí)的習(xí)得遵從知識(shí)相關(guān)性原則(Knowledge Relevance Principle),即模型更容易學(xué)習(xí)與已有知識(shí)相關(guān)的新知識(shí)(如已知實(shí)體新的屬性),而對(duì)完全陌生的知識(shí)更難吸收,表明說(shuō)大語(yǔ)言模型更擅長(zhǎng)在已有認(rèn)知框架內(nèi)進(jìn)行擴(kuò)展。更擅長(zhǎng)在已有認(rèn)知框架內(nèi)進(jìn)行擴(kuò)展。

知識(shí)回路拓?fù)浞治?/strong>


在知識(shí)回路的拓?fù)浣Y(jié)構(gòu)層面,本文首先檢查每個(gè)中間檢查點(diǎn)上的知識(shí)回路與最終回路之間的相似度,通過(guò)回路中的邊構(gòu)成的集合的交集除以并集所得的比例來(lái)衡量。實(shí)驗(yàn)發(fā)現(xiàn),在所有的模型上,回路的相似度都呈現(xiàn)出一個(gè)穩(wěn)定的上升趨勢(shì),表明隨著知識(shí)習(xí)得的進(jìn)行,知識(shí)回路與最終回路越來(lái)越相似,檢查點(diǎn)之間不存在很大幅度的調(diào)整。

根據(jù)觀察到的趨勢(shì),本文進(jìn)一步提出了假設(shè):在模型的知識(shí)習(xí)得過(guò)程中,知識(shí)回路會(huì)逐步獲取特定的知識(shí),回路會(huì)越來(lái)越高效和精確,其中一小部分關(guān)鍵節(jié)點(diǎn)和邊緣會(huì)變得越來(lái)越重要,影響也越來(lái)越大。為了驗(yàn)證這一假設(shè),本文借鑒信息論設(shè)計(jì)了回路熵指標(biāo),并探索知識(shí)回路演化過(guò)程中的熵變化。實(shí)驗(yàn)發(fā)現(xiàn),在持續(xù)預(yù)訓(xùn)練期間,知識(shí)回路的熵呈現(xiàn)穩(wěn)定下降趨勢(shì),表明知識(shí)回路的拓?fù)浣Y(jié)構(gòu)變得越來(lái)越集中,特定邊的重要性在不斷增加。

同時(shí)實(shí)驗(yàn)還發(fā)現(xiàn),回路相似度的上升趨勢(shì)和回路熵的下降趨勢(shì)在訓(xùn)練達(dá)到某一步之后明顯放緩,本文將這一有趣現(xiàn)象總結(jié)為知識(shí)回路的雙階段演化(Biphasic Circuit Evolution),即知識(shí)回路的演化先經(jīng)歷形成階段,快速鎖定基礎(chǔ)結(jié)構(gòu),關(guān)鍵邊和節(jié)點(diǎn)逐漸凸顯,回路結(jié)構(gòu)變化大;再進(jìn)入優(yōu)化階段,結(jié)構(gòu)趨于穩(wěn)定,在已有結(jié)構(gòu)上不斷提升表現(xiàn),性能繼續(xù)增長(zhǎng)直至收斂。

知識(shí)回路組件分析



在知識(shí)回路的組件層級(jí),本文主要關(guān)注回路中的關(guān)鍵結(jié)點(diǎn)即注意力頭的行為變化。實(shí)驗(yàn)發(fā)現(xiàn),位于知識(shí)回路的中到深層的注意力頭先學(xué)會(huì)從模型參數(shù)中提取特定的知識(shí),而位于知識(shí)回路較淺層的注意力頭在訓(xùn)練期間持續(xù)豐富特定知識(shí)的表征。

四、總結(jié)

本文通過(guò)對(duì)大語(yǔ)言模型在持續(xù)預(yù)訓(xùn)練過(guò)程中的知識(shí)回路的動(dòng)態(tài)變化進(jìn)行追蹤,由表及里地對(duì)知識(shí)回路的表現(xiàn)、拓?fù)浜徒M件進(jìn)行了全面分析,揭示了幾個(gè)關(guān)鍵發(fā)現(xiàn)。我們相信大語(yǔ)言模型并非黑盒,而是由無(wú)數(shù)知識(shí)回路組成的精密系統(tǒng),理解這些回路的演化規(guī)律,也許是邁向更可控、更高效、更安全人工智能的關(guān)鍵步驟。

作者:歐翌昕 來(lái)源:知識(shí)引擎實(shí)驗(yàn)室-ZJU

llustration From IconScout By IconScout Store

-The End-

本周上新!

掃碼觀看!

“AI技術(shù)流”原創(chuàng)投稿計(jì)劃

TechBeat是由將門(mén)創(chuàng)投建立的AI學(xué)習(xí)社區(qū)(www.techbeat.net)。社區(qū)上線700+期talk視頻,3000+篇技術(shù)干貨文章,方向覆蓋CV/NLP/ML/Robotis等;每月定期舉辦頂會(huì)及其他線上交流活動(dòng),不定期舉辦技術(shù)人線下聚會(huì)交流活動(dòng)。我們正在努力成為AI人才喜愛(ài)的高質(zhì)量、知識(shí)型交流平臺(tái),希望為AI人才打造更專業(yè)的服務(wù)和體驗(yàn),加速并陪伴其成長(zhǎng)。

投稿內(nèi)容

// 最新技術(shù)解讀/系統(tǒng)性知識(shí)分享 //

// 前沿資訊解說(shuō)/心得經(jīng)歷講述 //

投稿須知

稿件需要為原創(chuàng)文章,并標(biāo)明作者信息。

我們會(huì)選擇部分在深度技術(shù)解析及科研心得方向,對(duì)用戶啟發(fā)更大的文章,做原創(chuàng)性內(nèi)容獎(jiǎng)勵(lì)

投稿方式

發(fā)送郵件到

michellechang@thejiangmen.com

或添加工作人員微信(michelle333_)投稿,溝通投稿詳情

關(guān)于我“門(mén)”

將門(mén)是一家以專注于數(shù)智核心科技領(lǐng)域新型創(chuàng)投機(jī)構(gòu),也是北京市標(biāo)桿型孵化器。 公司致力于通過(guò)連接技術(shù)與商業(yè),發(fā)掘和培育具有全球影響力的科技創(chuàng)新企業(yè),推動(dòng)企業(yè)創(chuàng)新發(fā)展與產(chǎn)業(yè)升級(jí)。

將門(mén)成立于2015年底,創(chuàng)始團(tuán)隊(duì)由微軟創(chuàng)投在中國(guó)的創(chuàng)始團(tuán)隊(duì)原班人馬構(gòu)建而成,曾為微軟優(yōu)選和深度孵化了126家創(chuàng)新的技術(shù)型創(chuàng)業(yè)公司。

如果您是技術(shù)領(lǐng)域的初創(chuàng)企業(yè),不僅想獲得投資,還希望獲得一系列持續(xù)性、有價(jià)值的投后服務(wù),歡迎發(fā)送或者推薦項(xiàng)目給我“門(mén)”:

bp@thejiangmen.com


點(diǎn)擊右上角,把文章分享到朋友圈

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
北京銀行要甩的雷,可不止富力地產(chǎn)這一顆

北京銀行要甩的雷,可不止富力地產(chǎn)這一顆

源媒匯
2026-03-13 14:28:25
美專家猛然發(fā)現(xiàn):中國(guó)早就準(zhǔn)備好,一旦沖突,先廢掉美軍最強(qiáng)戰(zhàn)力

美專家猛然發(fā)現(xiàn):中國(guó)早就準(zhǔn)備好,一旦沖突,先廢掉美軍最強(qiáng)戰(zhàn)力

涵豆說(shuō)娛
2026-03-10 12:09:41
上海新規(guī)!非機(jī)動(dòng)車(chē)、行人罰單逾期每日加罰3%,今起實(shí)施!視頻詳解

上海新規(guī)!非機(jī)動(dòng)車(chē)、行人罰單逾期每日加罰3%,今起實(shí)施!視頻詳解

上觀新聞
2026-03-13 13:36:05
混社會(huì)的人出來(lái)之后變得怎樣了 看網(wǎng)友講述 發(fā)現(xiàn)真的好慘

混社會(huì)的人出來(lái)之后變得怎樣了 看網(wǎng)友講述 發(fā)現(xiàn)真的好慘

侃神評(píng)故事
2026-03-12 15:25:05
歐冠1/4決賽對(duì)陣預(yù)測(cè):皇任大戰(zhàn) 巴黎連戰(zhàn)紅藍(lán)軍 薩競(jìng)+槍耀

歐冠1/4決賽對(duì)陣預(yù)測(cè):皇任大戰(zhàn) 巴黎連戰(zhàn)紅藍(lán)軍 薩競(jìng)+槍耀

智道足球
2026-03-13 13:22:17
重慶冠軍賽:只贏一場(chǎng)就直通!張本美和3:0大獲全勝,迎中日對(duì)決

重慶冠軍賽:只贏一場(chǎng)就直通!張本美和3:0大獲全勝,迎中日對(duì)決

銜春信
2026-03-13 16:38:59
G聯(lián)賽:楊瀚森背靠背16+13+2+1帽 難阻混音遭快船雙殺

G聯(lián)賽:楊瀚森背靠背16+13+2+1帽 難阻混音遭快船雙殺

醉臥浮生
2026-03-13 12:33:30
13:2,聯(lián)合國(guó)安理會(huì)通過(guò)譴責(zé)伊朗決議,伊代表當(dāng)眾大喊:不公平

13:2,聯(lián)合國(guó)安理會(huì)通過(guò)譴責(zé)伊朗決議,伊代表當(dāng)眾大喊:不公平

混沌錄
2026-03-13 16:50:07
詹姆斯:東里持球我就努力搶板、接球,為球隊(duì)我愿做任何犧牲

詹姆斯:東里持球我就努力搶板、接球,為球隊(duì)我愿做任何犧牲

懂球帝
2026-03-13 14:28:30
萊萬(wàn)談瓜迪奧拉:備戰(zhàn)一周的戰(zhàn)術(shù),比賽當(dāng)天卻被要求全盤(pán)推翻

萊萬(wàn)談瓜迪奧拉:備戰(zhàn)一周的戰(zhàn)術(shù),比賽當(dāng)天卻被要求全盤(pán)推翻

懂球帝
2026-03-13 13:45:04
中方回應(yīng)特朗普計(jì)劃訪華

中方回應(yīng)特朗普計(jì)劃訪華

第一財(cái)經(jīng)資訊
2026-03-12 15:48:23
iPhone 18 Pro Max被曝機(jī)身尺寸變化不大 厚度達(dá)8.8mm

iPhone 18 Pro Max被曝機(jī)身尺寸變化不大 厚度達(dá)8.8mm

CNMO科技
2026-03-12 09:30:35
“全世界都看到了美軍的表現(xiàn),中國(guó)大有可為”

“全世界都看到了美軍的表現(xiàn),中國(guó)大有可為”

觀察者網(wǎng)
2026-03-12 22:37:22
生育大局已定:不出意外的話,2026年起中國(guó)人口將迎來(lái)3大變化

生育大局已定:不出意外的話,2026年起中國(guó)人口將迎來(lái)3大變化

大魚(yú)簡(jiǎn)科
2026-03-13 10:29:12
68歲廖偉雄首談破產(chǎn)原因,幫朋友擔(dān)保暴雷,直言有他就無(wú)周星馳

68歲廖偉雄首談破產(chǎn)原因,幫朋友擔(dān)保暴雷,直言有他就無(wú)周星馳

裕豐娛間說(shuō)
2026-03-12 08:51:54
這羞答答的抿嘴,沒(méi)有男人能拒絕??!

這羞答答的抿嘴,沒(méi)有男人能拒絕??!

貴圈真亂
2026-03-13 12:41:35
油價(jià)最新調(diào)整通知 !

油價(jià)最新調(diào)整通知 !

時(shí)間財(cái)經(jīng)
2026-03-12 15:20:55
爆冷晉級(jí)16強(qiáng)卻收壞消息!溫瑞博下輪死磕隊(duì)友!高情商回應(yīng)擊敗世界第二

爆冷晉級(jí)16強(qiáng)卻收壞消息!溫瑞博下輪死磕隊(duì)友!高情商回應(yīng)擊敗世界第二

好乒乓
2026-03-13 12:24:14
春節(jié)返回家中的第一件事,就是買(mǎi)它來(lái)煲湯,喝完舒服多了

春節(jié)返回家中的第一件事,就是買(mǎi)它來(lái)煲湯,喝完舒服多了

江江食研社
2026-03-12 15:30:07
國(guó)家下狠手了!體制內(nèi)大地震,少爺、公主們的“天”,要塌了

國(guó)家下狠手了!體制內(nèi)大地震,少爺、公主們的“天”,要塌了

霹靂炮
2026-01-19 22:24:13
2026-03-13 17:43:00
將門(mén)創(chuàng)投 incentive-icons
將門(mén)創(chuàng)投
加速及投資技術(shù)驅(qū)動(dòng)型初創(chuàng)企業(yè)
2310文章數(shù) 596關(guān)注度
往期回顧 全部

科技要聞

龍蝦熱卷到AI硬件 “無(wú)腦”硬件或被淘汰

頭條要聞

媒體:若穆杰塔巴公開(kāi)露面顯得虛弱 會(huì)嚴(yán)重打擊政權(quán)士氣

頭條要聞

媒體:若穆杰塔巴公開(kāi)露面顯得虛弱 會(huì)嚴(yán)重打擊政權(quán)士氣

體育要聞

叕戰(zhàn)奧運(yùn),張雨霏要做回“小將”

娛樂(lè)要聞

小S復(fù)工錄制 感謝賈永婕陪大S走到最后

財(cái)經(jīng)要聞

2月M2同增9% 前兩個(gè)月存款增加9.26萬(wàn)億

汽車(chē)要聞

大眾汽車(chē)與小鵬首款聯(lián)合開(kāi)發(fā)車(chē)型與眾08正式量產(chǎn)

態(tài)度原創(chuàng)

家居
旅游
手機(jī)
時(shí)尚
游戲

家居要聞

藝術(shù)之家 法式優(yōu)雅

旅游要聞

江蘇無(wú)錫:在宜興山水間,邂逅“飛鳥(niǎo)之約”

手機(jī)要聞

vivo X300 Ultra揚(yáng)聲器大升級(jí) 韓伯嘯:全鏈路無(wú)短板

直播|| 最近超愛(ài)的兩只包,好用到天天背

《控制:共振》確認(rèn)支持 NVIDIA DLSS 4.5 與路徑追蹤技 術(shù) ,次世代畫(huà)面表現(xiàn)再升級(jí)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版