国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

突破萬(wàn)次連續(xù)編輯極限!中科院提出首個(gè)理論保穩(wěn)的知識(shí)保留方法

0
分享至


新智元報(bào)道

編輯:LRST

【新智元導(dǎo)讀】LyapLock首次讓大模型在上萬(wàn)次知識(shí)更新中穩(wěn)住舊記憶、精準(zhǔn)學(xué)新知。它用「虛擬隊(duì)列」實(shí)時(shí)監(jiān)控遺忘風(fēng)險(xiǎn),動(dòng)態(tài)平衡新舊知識(shí),理論保證長(zhǎng)期不崩盤(pán),編輯效果比主流方法提升11.89%,還能賦能現(xiàn)有模型,讓AI真正學(xué)會(huì)「持續(xù)成長(zhǎng)」。

大型語(yǔ)言模型通常包含事實(shí)上不正確或過(guò)時(shí)的知識(shí),這催生了用于實(shí)現(xiàn)精確知識(shí)更新的模型編輯方法。然而,由于缺乏適當(dāng)?shù)拈L(zhǎng)期知識(shí)保留機(jī)制,當(dāng)前主流的「先定位后編輯」方法在連續(xù)編輯過(guò)程中表現(xiàn)出漸進(jìn)式的性能下降。

為了解決這個(gè)問(wèn)題,中科院信工所的研究人員提出了LyapLock,將連續(xù)編輯建模為一個(gè)受約束的隨機(jī)規(guī)劃問(wèn)題。鑒于累積保留誤差約束以及逐漸揭示的編輯任務(wù)所帶來(lái)的挑戰(zhàn)。


論文鏈接: https://arxiv.org/pdf/2505.15702

LyapLock整合了排隊(duì)論和李雅普諾夫(Lyapunov)優(yōu)化,將長(zhǎng)期的約束規(guī)劃分解為易于處理的逐步子問(wèn)題,從而實(shí)現(xiàn)高效求解。

這是第一個(gè)具備嚴(yán)格理論保證的模型編輯框架,在滿(mǎn)足長(zhǎng)期知識(shí)保留約束的同時(shí),實(shí)現(xiàn)了漸近最優(yōu)的編輯性能。

實(shí)驗(yàn)結(jié)果表明,該框架將連續(xù)編輯的能力擴(kuò)展到了10,000次以上,在穩(wěn)定模型通用能力的同時(shí),其平均編輯效果比當(dāng)前最先進(jìn)(SOTA)的基線(xiàn)方法提升了11.89%。此外,該框架還可以被用來(lái)增強(qiáng)現(xiàn)有基線(xiàn)方法的性能。

研究背景

目前主流的「先定位后編輯(Locate-then-edit)」范式(比如大名鼎鼎的ROME和MEMIT)在單次知識(shí)更新上極其精準(zhǔn)。為了讓它們適應(yīng)連續(xù)編輯,近期的研究(如RECT、AlphaEdit)嘗試在參數(shù)搜索時(shí)加入正則化或零空間投影等啟發(fā)式約束 。

痛點(diǎn)在于:這些方法本質(zhì)上都是短視的。

  • 它們大都只專(zhuān)注于眼前的單步增量?jī)?yōu)化,缺乏一個(gè)嚴(yán)謹(jǐn)?shù)睦碚摽蚣軄?lái)管控連續(xù)編輯在長(zhǎng)期帶來(lái)的累積效應(yīng) 。

  • 每次編輯似乎只破壞了一點(diǎn)點(diǎn)原有知識(shí),但一萬(wàn)次編輯之后,累積的保留損失(Preservation Loss)會(huì)呈現(xiàn)單調(diào)上漲的失控態(tài)勢(shì) 。

  • 實(shí)驗(yàn)殘酷地證明了這一點(diǎn):在連續(xù)編輯10,000個(gè)樣本后,所有主流基線(xiàn)方法在下游任務(wù)上的性能幾乎全部掉到了零點(diǎn)(圖1)。


圖1:基線(xiàn)方法Preservation Loss爆炸和下游任務(wù)F1歸零的折線(xiàn)圖

研究方法

既然頭痛醫(yī)頭腳痛醫(yī)腳不行,那就必須從全局視角重新定義問(wèn)題。

LyapLock 沒(méi)有繼續(xù)在單步損失函數(shù)上縫縫補(bǔ)補(bǔ),而是直接把連續(xù)編輯建模成了一個(gè)帶長(zhǎng)期約束的隨機(jī)規(guī)劃問(wèn)題(圖2)


圖2:傳統(tǒng)的單步雙目標(biāo)優(yōu)化與 LyapLock 約束長(zhǎng)期優(yōu)化的核心區(qū)別公式對(duì)比圖

用「剝洋蔥」的方式來(lái)說(shuō),直覺(jué)(Intuition)是這樣的:

  • 引入虛擬隊(duì)列(Virtual Queues)充當(dāng)「蓄水池」:設(shè)計(jì)了一個(gè)虛擬隊(duì)列 ,用來(lái)實(shí)時(shí)監(jiān)控累積的記憶遺忘情況 。如果編輯某條知識(shí)導(dǎo)致原有知識(shí)破壞過(guò)大,超出了設(shè)定的紅線(xiàn)閾值 ,這個(gè)隊(duì)列的水位就會(huì)上漲 。

  • 動(dòng)態(tài)博弈的李雅普諾夫優(yōu)化(Lyapunov Optimization):這是控制論中的經(jīng)典方法 。當(dāng)隊(duì)列水位 升高時(shí),系統(tǒng)會(huì)自動(dòng)拉響警報(bào),增加損失函數(shù)中「知識(shí)保留(Preservation Loss)」的懲罰權(quán)重 。此時(shí),模型的首要任務(wù)變成了「保護(hù)老知識(shí)」。

  • 張弛有度:而當(dāng)水位下降(即近期編輯對(duì)老知識(shí)破壞不大,處于安全區(qū))時(shí),權(quán)重減小,系統(tǒng)又會(huì)把計(jì)算資源傾斜給「學(xué)習(xí)新知識(shí)(Editing Loss)」 。

通過(guò)這種方式,研究人員在理論上證明了:只要虛擬隊(duì)列保持強(qiáng)穩(wěn)定,模型在無(wú)限次連續(xù)編輯中的平均保留損失就一定會(huì)被死死鎖在紅線(xiàn)之內(nèi) 。

詳細(xì)結(jié)果

用真實(shí)的實(shí)驗(yàn)數(shù)據(jù)來(lái)說(shuō)話(huà),在LLaMA-3(8B)、GPT-J(6B) 等多個(gè)模型上進(jìn)行了極限測(cè)試 。

破萬(wàn)次編輯,通用能力不崩盤(pán)

在連續(xù)編輯10,000次后,所有的基線(xiàn)方法(ROME, MEMIT, PRUNE, RECT, AlphaEdit)在 GLUE 六大下游任務(wù)上全軍覆沒(méi),性能暴跌至0%。而LyapLock穩(wěn)如泰山,甚至當(dāng)把壓力測(cè)試?yán)叩?strong>20,000次編輯時(shí),模型依然保持著極佳的通用語(yǔ)言能力。同時(shí),在其他基線(xiàn)方法的Preservation Loss類(lèi)似指數(shù)上升的同時(shí),LyapLock方法將其限制在了一定的閾值內(nèi)(圖3,圖4)。


圖3:GLUE下游任務(wù)抗跌對(duì)比


圖4:Preservation Loss穩(wěn)定在閾值內(nèi)的對(duì)比圖

知識(shí)更新性能霸榜

不僅老知識(shí)護(hù)得好,新知識(shí)也學(xué)得精。相比于第二強(qiáng)的基線(xiàn)AlphaEdit,LyapLock的平均編輯效力(Efficacy)硬生生拔高了11.89%。在LLaMA3-Counterfact場(chǎng)景下,泛化能力更是拉開(kāi)了19.71%的巨大差距 。


圖5:主實(shí)驗(yàn)結(jié)果

即插即用的外掛神器

LyapLock的理論框架不僅能單打獨(dú)斗,還能向下兼容!把它和MEMIT、PRUNE等現(xiàn)有方法結(jié)合,能夠直接讓它們的編輯性能提升9.76%,下游任務(wù)表現(xiàn)更是暴漲41.11%


圖6:結(jié)合 LyapLock 后基線(xiàn)方法性能提升的雷達(dá)圖

總結(jié)與展望

LyapLock第一次利用Lyapunov優(yōu)化為連續(xù)編輯套上了一層帶理論保證的「鎖」。它證明了,只要控制好長(zhǎng)期損失的累積,LLM完全有潛力像人類(lèi)一樣,在漫長(zhǎng)的生命周期中持續(xù)學(xué)習(xí)和修正認(rèn)知,而不至于「學(xué)了新知識(shí),忘了自己是誰(shuí)」 。

當(dāng)然,目前的工作也還有進(jìn)步空間。

比如評(píng)測(cè)主要集中在自然語(yǔ)言理解(NLU)任務(wù)上,未來(lái)在代碼生成、復(fù)雜數(shù)學(xué)推理等領(lǐng)域,這種連續(xù)編輯的鎖還能不能鎖得這么穩(wěn)?更大的十萬(wàn)、百萬(wàn)級(jí)編輯量極限又在哪里?這些都非常值得社區(qū)繼續(xù)深挖 。

參考資料:

https://arxiv.org/pdf/2505.15702

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
女籃大勝馬里4利好!楊舒予+張子宇征服眾人,李月汝王思雨太好用

女籃大勝馬里4利好!楊舒予+張子宇征服眾人,李月汝王思雨太好用

籃球資訊達(dá)人
2026-03-11 21:28:31
伊朗新任最高領(lǐng)袖穆杰塔巴·哈梅內(nèi)伊,到底怎么樣了?

伊朗新任最高領(lǐng)袖穆杰塔巴·哈梅內(nèi)伊,到底怎么樣了?

映象觀察
2026-03-11 17:44:38
被李彥宏定調(diào)為“All in AI”的百度,跌掉了1000億

被李彥宏定調(diào)為“All in AI”的百度,跌掉了1000億

奇點(diǎn)湃
2026-03-09 13:36:40
特朗普人還沒(méi)到,先改訪華規(guī)格,中方已接到通知,美國(guó)要彎道超車(chē)

特朗普人還沒(méi)到,先改訪華規(guī)格,中方已接到通知,美國(guó)要彎道超車(chē)

面包夾知識(shí)
2026-03-11 20:16:29
史上最狠的一首罵人詩(shī),短短四句,不帶臟字,但卻罵了十幾萬(wàn)男兒

史上最狠的一首罵人詩(shī),短短四句,不帶臟字,但卻罵了十幾萬(wàn)男兒

銘記歷史呀
2026-03-11 18:17:40
傳北京盈科律所現(xiàn)40億資金窟窿,主任曾融資100億搞氫能汽車(chē)

傳北京盈科律所現(xiàn)40億資金窟窿,主任曾融資100億搞氫能汽車(chē)

深藍(lán)財(cái)經(jīng)
2026-03-11 14:47:48
家長(zhǎng)拒交550班費(fèi)續(xù):孩子被調(diào)最后一排,老師聽(tīng)到自己女兒名怕了

家長(zhǎng)拒交550班費(fèi)續(xù):孩子被調(diào)最后一排,老師聽(tīng)到自己女兒名怕了

奇思妙想草葉君
2026-03-11 13:29:37
毒梟留下的河馬,成災(zāi)了

毒梟留下的河馬,成災(zāi)了

中國(guó)新聞周刊
2026-03-11 10:45:05
字母哥談阿德巴約83分:以后沒(méi)人會(huì)記得罰球多少,重要的是他拿到了

字母哥談阿德巴約83分:以后沒(méi)人會(huì)記得罰球多少,重要的是他拿到了

懂球帝
2026-03-11 13:37:05
行程有變,特朗普訪華規(guī)格縮水,中方對(duì)美說(shuō)不,美國(guó)先遣隊(duì)已離京

行程有變,特朗普訪華規(guī)格縮水,中方對(duì)美說(shuō)不,美國(guó)先遣隊(duì)已離京

安珈使者啊
2026-03-11 12:01:33
內(nèi)娛這波塌房,連粉絲都看不下去了

內(nèi)娛這波塌房,連粉絲都看不下去了

獨(dú)立魚(yú)
2026-03-10 21:34:26
揚(yáng)州女司機(jī)被打后續(xù)!交警已介入,知情者發(fā)聲,曝一巴掌賠了3萬(wàn)

揚(yáng)州女司機(jī)被打后續(xù)!交警已介入,知情者發(fā)聲,曝一巴掌賠了3萬(wàn)

180視角
2026-03-11 20:52:59
一男子高速開(kāi)啟智駕后呼呼大睡了一百多公里:致多車(chē)連環(huán)追尾

一男子高速開(kāi)啟智駕后呼呼大睡了一百多公里:致多車(chē)連環(huán)追尾

快科技
2026-03-11 11:29:07
克里斯17罰17中,山東男籃9分險(xiǎn)勝 珀塞爾37+6 新外援首秀需適應(yīng)

克里斯17罰17中,山東男籃9分險(xiǎn)勝 珀塞爾37+6 新外援首秀需適應(yīng)

替補(bǔ)席看球
2026-03-11 21:51:48
A股:2.5億股民,今晚可能要興奮得睡不著覺(jué)了,你知道為什么嗎?

A股:2.5億股民,今晚可能要興奮得睡不著覺(jué)了,你知道為什么嗎?

夜深?lèi)?ài)雜談
2026-03-11 18:55:08
美以嚴(yán)重破壞了伊朗體制,伊朗陷入內(nèi)亂只是時(shí)間問(wèn)題

美以嚴(yán)重破壞了伊朗體制,伊朗陷入內(nèi)亂只是時(shí)間問(wèn)題

修明札記
2026-03-11 15:59:09
看哭了!大量伊朗人正在“逆行”回國(guó) 土伊邊境兩小時(shí)就有4波人返回伊朗

看哭了!大量伊朗人正在“逆行”回國(guó) 土伊邊境兩小時(shí)就有4波人返回伊朗

閃電新聞
2026-03-11 14:25:52
購(gòu)房時(shí)白紙黑字寫(xiě)“無(wú)死亡”,4年后得知屋內(nèi)曾有老人離世 買(mǎi)家憑 “安心承諾” 要求鏈家回購(gòu)被拒

購(gòu)房時(shí)白紙黑字寫(xiě)“無(wú)死亡”,4年后得知屋內(nèi)曾有老人離世 買(mǎi)家憑 “安心承諾” 要求鏈家回購(gòu)被拒

信網(wǎng)
2026-03-11 17:45:18
3波冷空氣!廣東將迎大到暴雨!深圳氣溫跳水...

3波冷空氣!廣東將迎大到暴雨!深圳氣溫跳水...

深圳好玩
2026-03-11 12:30:39
徹底瘋狂!伊朗正集體自殺,總統(tǒng)求和衛(wèi)隊(duì)開(kāi)戰(zhàn),美以躲在背后狂笑

徹底瘋狂!伊朗正集體自殺,總統(tǒng)求和衛(wèi)隊(duì)開(kāi)戰(zhàn),美以躲在背后狂笑

環(huán)球格局觀
2026-03-11 13:40:12
2026-03-11 22:47:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14696文章數(shù) 66682關(guān)注度
往期回顧 全部

科技要聞

騰訊"養(yǎng)蝦"暴漲后,百度急得在門(mén)口"裝蝦"

頭條要聞

聯(lián)合國(guó)16位專(zhuān)家呼吁日本道歉 外交部回應(yīng)

頭條要聞

聯(lián)合國(guó)16位專(zhuān)家呼吁日本道歉 外交部回應(yīng)

體育要聞

郭艾倫重傷,CBA下半賽季還能期待些什么

娛樂(lè)要聞

蔡少芬曬全家福照,兩女兒成最大亮點(diǎn)

財(cái)經(jīng)要聞

喚醒10萬(wàn)億存量資金 公積金改革大潮來(lái)了

汽車(chē)要聞

蓮花糾偏, 馮擎峰的“收”與“守”

態(tài)度原創(chuàng)

房產(chǎn)
游戲
家居
數(shù)碼
公開(kāi)課

房產(chǎn)要聞

最低殺到7800元/㎡!海口2026第一波房?jī)r(jià)大調(diào)整來(lái)了!

《守望先鋒》尼爾聯(lián)動(dòng)被批宣傳詐騙:屁股又削了!

家居要聞

中式風(fēng)格 人間朝與暮

數(shù)碼要聞

分析師“自我辟謠” 第二代MacBook Neo取消換裝觸控屏計(jì)劃

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版