国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI向人腦「黃金標(biāo)準(zhǔn)」又近一步,谷歌發(fā)布嵌套學(xué)習(xí),賦予大模型持續(xù)學(xué)習(xí)的能力

0
分享至


剛剛,谷歌發(fā)布了一項(xiàng)名為“嵌套學(xué)習(xí)”(Nested Learning)的全新機(jī)器學(xué)習(xí)范式,它將模型視為嵌套優(yōu)化問題,從而增強(qiáng)對長上下文的處理能力。基于嵌套學(xué)習(xí)的概念驗(yàn)證模型 Hope 在語言建模方面展現(xiàn)出更優(yōu)異的性能,谷歌的野心是緩解乃至徹底解決LLM遺忘問題,實(shí)現(xiàn)類似人腦的持續(xù)學(xué)習(xí)能力

相關(guān)論文《Nested Learning: The Illusion of Deep Learning Architectures》已在NeurIPS 2025上發(fā)表


在過去十年,機(jī)器學(xué)習(xí)取得了巨大進(jìn)步,但LLM的成功之下,一些根本性挑戰(zhàn)依然存在,尤其是在持續(xù)學(xué)習(xí)方面。

人腦是持續(xù)學(xué)習(xí)的黃金標(biāo)準(zhǔn),其通過神經(jīng)可塑性不斷調(diào)整自身結(jié)構(gòu)以適應(yīng)新體驗(yàn)。相比之下,當(dāng)前LLM的知識局限于其輸入窗口的即時上下文或預(yù)訓(xùn)練期間學(xué)到的靜態(tài)信息。

最直接的解決方法——用新數(shù)據(jù)持續(xù)更新模型參數(shù),往往會導(dǎo)致“災(zāi)難性遺忘”(Catastrophic Forgetting, CF)。傳統(tǒng)上,研究人員通過調(diào)整架構(gòu)或優(yōu)化規(guī)則來對抗CF,但長期以來,模型架構(gòu)與優(yōu)化算法被視為兩個獨(dú)立部分,阻礙了真正統(tǒng)一高效的學(xué)習(xí)系統(tǒng)誕生。

谷歌提出的“嵌套學(xué)習(xí)”則打破了這一壁壘。

什么是嵌套學(xué)習(xí)?

嵌套學(xué)習(xí)范式提出,一個復(fù)雜的ML模型并非單一的連續(xù)過程,而是一個由相互關(guān)聯(lián)、多層次的學(xué)習(xí)問題組成的系統(tǒng),這些問題被嵌套或并行地同時優(yōu)化。

該理論認(rèn)為,模型架構(gòu)和訓(xùn)練規(guī)則(即優(yōu)化算法)本質(zhì)上是同一概念,它們只是處于不同“層級”的優(yōu)化問題,每個層級都有其自身的信息流(“上下文流”)和更新速率

通過識別這種內(nèi)在結(jié)構(gòu),“嵌套學(xué)習(xí)”為設(shè)計更強(qiáng)大的AI提供了一個全新的、此前不可見的維度,允許構(gòu)建具有更深計算深度的學(xué)習(xí)組件,從而最終解決災(zāi)難性遺忘等問題。

為了闡釋這一范式,研究人員以“聯(lián)想記憶”(associative memory)為例。

他們指出,訓(xùn)練過程本身(尤其是反向傳播)就可以被建模為一個聯(lián)想記憶。模型學(xué)習(xí)將給定數(shù)據(jù)點(diǎn)映射到其局部誤差值,該誤差值衡量了數(shù)據(jù)點(diǎn)的“意外”程度。同樣,像Transformer中的注意力機(jī)制等關(guān)鍵架構(gòu)組件,也可以被形式化為學(xué)習(xí)序列中Token之間映射關(guān)系的簡單聯(lián)想記憶模塊。

通過為每個組件定義一個“更新頻率”,即權(quán)重調(diào)整的頻率,這些相互關(guān)聯(lián)的優(yōu)化問題就可以被排列成不同的“層級”。這個有序集合構(gòu)成了嵌套學(xué)習(xí)范式的心臟。

研究人員表示,人腦中統(tǒng)一且可復(fù)用的結(jié)構(gòu)以及多時間尺度的更新,是人類持續(xù)學(xué)習(xí)的關(guān)鍵。嵌套學(xué)習(xí)允許模型的每個組件進(jìn)行多時間尺度更新,并證明了Transformer等知名架構(gòu)實(shí)際上是具有不同更新頻率的線性層。

嵌套學(xué)習(xí)的應(yīng)用

基于“嵌套學(xué)習(xí)”的視角,可以直接獲得改進(jìn)現(xiàn)有算法和架構(gòu)的原則性方法:

1. 深度優(yōu)化器 (Deep optimizers)

由于嵌套學(xué)習(xí)將優(yōu)化器(如動量優(yōu)化器)也視為聯(lián)想記憶模塊,因此可以將聯(lián)想記憶的原理應(yīng)用于優(yōu)化器設(shè)計。研究人員觀察到,許多標(biāo)準(zhǔn)優(yōu)化器依賴于簡單的點(diǎn)積相似度,其更新并未考慮不同數(shù)據(jù)樣本之間的關(guān)聯(lián)。通過將優(yōu)化器的底層目標(biāo)更改為更標(biāo)準(zhǔn)的損失度量,例如L2回歸損失,他們?yōu)閯恿康群诵母拍钔茖?dǎo)出了新的公式,使其對不完美數(shù)據(jù)更具魯棒性。

2. 連續(xù)譜記憶系統(tǒng) (Continuum memory systems, CMS)

在標(biāo)準(zhǔn)Transformer中,序列模型充當(dāng)短期記憶,保存即時上下文;前饋網(wǎng)絡(luò)則充當(dāng)長期記憶,存儲預(yù)訓(xùn)練知識。嵌套學(xué)習(xí)將這一概念擴(kuò)展為一個“連續(xù)譜記憶系統(tǒng)”,其中記憶被視為由一系列模塊組成的光譜,每個模塊都以特定的不同頻率進(jìn)行更新,為持續(xù)學(xué)習(xí)創(chuàng)造了更豐富、更有效的記憶系統(tǒng)。

Hope:一個自修改的驗(yàn)證架構(gòu)

作為概念驗(yàn)證,研究團(tuán)隊(duì)利用嵌套學(xué)習(xí)原理設(shè)計了一款名為“Hope”的自修改架構(gòu)。

Hope是Titans架構(gòu)的一個變體。Titans架構(gòu)是一種長期記憶模塊,能根據(jù)記憶的“意外”程度確定其優(yōu)先級,但它只有兩個參數(shù)更新層級。

而Hope是一個自修改的循環(huán)架構(gòu),它能夠利用無限層級的上下文學(xué)習(xí),并通過CMS模塊增強(qiáng),以擴(kuò)展到更大的上下文窗口。它本質(zhì)上可以通過一個自引用過程來優(yōu)化自身的記憶,從而創(chuàng)造出一個具有無限循環(huán)學(xué)習(xí)層級的架構(gòu)。

實(shí)驗(yàn)結(jié)果

在語言建模、長上下文推理、持續(xù)學(xué)習(xí)和知識整合等一系列任務(wù)上的實(shí)驗(yàn)證明了嵌套學(xué)習(xí)、連續(xù)譜記憶系統(tǒng)和自修改Titans架構(gòu)的有效性。

通用性能:在一系列公開的語言建模和常識推理任務(wù)上,Hope架構(gòu)展現(xiàn)出比現(xiàn)代循環(huán)模型(如Titans、Samba)和標(biāo)準(zhǔn)Transformer更低的困惑度和更高的準(zhǔn)確率


長上下文處理:在“大海撈針”(Needle-In-Haystack, NIAH)下游任務(wù)中,Hope展示了卓越的記憶管理能力,證明了CMS是處理擴(kuò)展信息序列的一種更高效的方式,其性能在不同難度的任務(wù)上均優(yōu)于Titans、TTT和Mamba2


結(jié)論

谷歌研究團(tuán)隊(duì)認(rèn)為,“嵌套學(xué)習(xí)”范式代表了對深度學(xué)習(xí)理解的一次飛躍。通過將架構(gòu)和優(yōu)化視為一個統(tǒng)一、連貫的嵌套優(yōu)化問題系統(tǒng),它為模型設(shè)計解鎖了一個新的維度

像Hope這樣的模型證明,采用原則性方法統(tǒng)一這些元素,可以帶來表達(dá)能力更強(qiáng)、功能更強(qiáng)大、效率更高的學(xué)習(xí)算法。

團(tuán)隊(duì)相信,“嵌套學(xué)習(xí)”為彌合當(dāng)前LLM的遺忘特性與人腦卓越的持續(xù)學(xué)習(xí)能力之間的鴻溝,提供了一個堅實(shí)的基礎(chǔ),并期待研究社區(qū)能共同探索這一新維度,以構(gòu)建下一代自我完善的AI

參考:

https://research.google/blog/introducing-nested-learning-a-new-ml-paradigm-for-continual-learning/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
世界排名更新!霍金斯超肖國棟躍居第九,趙心童中國最高準(zhǔn)神第一

世界排名更新!霍金斯超肖國棟躍居第九,趙心童中國最高準(zhǔn)神第一

世界體壇觀察家
2026-03-02 05:36:09
電影院抓小三后續(xù)!為求刺激上演燈下黑?孩子也不是丈夫親生的

電影院抓小三后續(xù)!為求刺激上演燈下黑?孩子也不是丈夫親生的

社會醬
2026-03-01 20:43:29
臺關(guān)注我軍機(jī)活動“斷崖式銳減”動因

臺關(guān)注我軍機(jī)活動“斷崖式銳減”動因

沃德輿情觀察
2026-02-28 23:26:00
隨著霍金斯9-5奪冠,威爾士公開賽獎金出爐:小司機(jī)180萬 趙心童8

隨著霍金斯9-5奪冠,威爾士公開賽獎金出爐:小司機(jī)180萬 趙心童8

越嶺尋蹤
2026-03-02 05:56:56
當(dāng)不成總統(tǒng)了?27座美軍基地被炸,美國爆發(fā)抗議,特朗普或被彈劾

當(dāng)不成總統(tǒng)了?27座美軍基地被炸,美國爆發(fā)抗議,特朗普或被彈劾

林子說事
2026-03-02 01:20:39
首日戰(zhàn)況:美以三板斧襲擊伊朗斬首戰(zhàn)果顯著,哈梅內(nèi)伊及親屬遇難

首日戰(zhàn)況:美以三板斧襲擊伊朗斬首戰(zhàn)果顯著,哈梅內(nèi)伊及親屬遇難

裝甲鏟史官
2026-03-01 10:32:21
終于有人管管美國了!美國遇到大麻煩,美國:中美兩國需要攜手

終于有人管管美國了!美國遇到大麻煩,美國:中美兩國需要攜手

福建平子
2026-01-28 10:52:25
我在東莞跑摩托載客,接了個足浴店女孩,沒想到她改變了我的生活

我在東莞跑摩托載客,接了個足浴店女孩,沒想到她改變了我的生活

賢東故事會
2026-03-01 20:00:07
劉濤這大胯真帶勁

劉濤這大胯真帶勁

可樂談情感
2026-03-01 17:36:55
風(fēng)向突變!上海迎來國家級規(guī)劃,這4片要徹底起飛

風(fēng)向突變!上海迎來國家級規(guī)劃,這4片要徹底起飛

王姐懶人家常菜
2026-03-02 01:17:38
以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

八斗小先生
2025-12-26 09:33:27
中東局勢升級 金價重回1600元 專家提醒:建議投資者逢高少量減持

中東局勢升級 金價重回1600元 專家提醒:建議投資者逢高少量減持

封面新聞
2026-03-01 22:14:05
伊朗反擊,不設(shè)紅線!以色列怎么也沒想到,自己才是最大冤大頭

伊朗反擊,不設(shè)紅線!以色列怎么也沒想到,自己才是最大冤大頭

肖茲探秘說
2026-03-01 23:30:08
好慘!香港知名演員新片激情戲被刪光,豐滿身材難現(xiàn)大銀幕

好慘!香港知名演員新片激情戲被刪光,豐滿身材難現(xiàn)大銀幕

眼底星碎
2026-03-01 11:31:34
法國和浙江同為6000萬人口,2025年法國創(chuàng)3萬億美元GDP,浙江呢?

法國和浙江同為6000萬人口,2025年法國創(chuàng)3萬億美元GDP,浙江呢?

八斗小先生
2026-02-28 18:56:17
美國不殺現(xiàn)總統(tǒng),卻殺前總統(tǒng)內(nèi)賈德,現(xiàn)總統(tǒng)就是美以最大的內(nèi)鬼!

美國不殺現(xiàn)總統(tǒng),卻殺前總統(tǒng)內(nèi)賈德,現(xiàn)總統(tǒng)就是美以最大的內(nèi)鬼!

我心縱橫天地間
2026-03-01 22:20:42
足壇一夜動態(tài):阿森納2-1切爾西!曼聯(lián)2-1逆轉(zhuǎn) 尤文3-3絕平羅馬

足壇一夜動態(tài):阿森納2-1切爾西!曼聯(lián)2-1逆轉(zhuǎn) 尤文3-3絕平羅馬

念洲
2026-03-02 06:26:42
你干過哪些陰暗齷齪的事?網(wǎng)友:最后一個真的好炸裂好真實(shí)

你干過哪些陰暗齷齪的事?網(wǎng)友:最后一個真的好炸裂好真實(shí)

帶你感受人間冷暖
2026-02-17 01:00:24
劉詩詩吳奇隆突然官宣!女方罕見發(fā)聲:一切早已注定...

劉詩詩吳奇隆突然官宣!女方罕見發(fā)聲:一切早已注定...

草莓解說體育
2026-03-01 15:10:45
一人睡遍整個娛樂圈?司曉迪打響了2026年第一炮

一人睡遍整個娛樂圈?司曉迪打響了2026年第一炮

閱毒君
2026-01-05 07:05:06
2026-03-02 07:43:00
AI寒武紀(jì) incentive-icons
AI寒武紀(jì)
專注于人工智能,科技領(lǐng)域
1034文章數(shù) 396關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

美軍動用新型武器:山寨伊朗的

頭條要聞

美軍動用新型武器:山寨伊朗的

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來襲

財經(jīng)要聞

中東局勢升級 如何影響A股、黃金和原油

汽車要聞

理想汽車2月交付26421輛 歷史累計交付超159萬輛

態(tài)度原創(chuàng)

時尚
手機(jī)
房產(chǎn)
家居
旅游

今年春天最流行的4件衛(wèi)衣,照著穿就很好看

手機(jī)要聞

全球首款機(jī)器人手機(jī)!榮耀Robot Phone亮相MWC:今年就量產(chǎn)發(fā)布

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

家居要聞

素色肌理 品意式格調(diào)

旅游要聞

唐風(fēng)演出、手作體驗(yàn) 沉浸式花燈游變身文旅消費(fèi)新熱點(diǎn)

無障礙瀏覽 進(jìn)入關(guān)懷版