国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI 智能體“失憶”了嗎?

0
分享至

長上下文AI的記憶問題一直是產(chǎn)品設(shè)計(jì)的痛點(diǎn),LightMem論文帶來革命性解法:模仿人類睡眠機(jī)制的三層記憶架構(gòu),將Token消耗驟降38倍的同時(shí)提升QA準(zhǔn)確率。這不僅破解了實(shí)時(shí)性與成本的悖論,更揭示了異步記憶體驗(yàn)與端云協(xié)同的新產(chǎn)品邏輯。


在構(gòu)建Long-context(長上下文)或多輪對話Agent時(shí),產(chǎn)品經(jīng)理和開發(fā)者最頭疼的問題往往不是模型“不夠聰明”,而是模型“記不住”或者“記得太貴”。

現(xiàn)有的記憶系統(tǒng)(MemorySystems)雖然讓LLM擺脫了無狀態(tài)的限制,但在高頻交互中,它們往往變成了拖慢響應(yīng)速度、消耗巨額Token的“吞金獸”。

近期新出爐的論文《LightMem:LightweightandEfficientMemory-AugmentedGeneration》,來聊聊智能體記憶設(shè)計(jì)的現(xiàn)狀、瓶頸,以及一種模仿人類“睡眠整合機(jī)制”的新架構(gòu)。


01當(dāng)前智能體記憶的“三座大山”

盡管RAG(檢索增強(qiáng)生成)和向量數(shù)據(jù)庫已經(jīng)普及,但在處理動態(tài)、復(fù)雜的長期交互時(shí),現(xiàn)有的記憶系統(tǒng)仍面臨三大痛點(diǎn):

信息冗余與噪聲

在長對話中,用戶和模型都會產(chǎn)生大量廢話(寒暄、重復(fù)確認(rèn))。現(xiàn)有的系統(tǒng)通常不管三七二十一,將原始數(shù)據(jù)直接塞進(jìn)處理流程。

后果:只有少部分信息對決策有用,大量噪聲不僅浪費(fèi)Token,甚至?xí)驗(yàn)楦蓴_信息太多降低模型的推理能力。

語義割裂

目前的記憶構(gòu)建通常是基于固定的“窗口”或逐輪處理的()。這忽略了對話中跨輪次的語義聯(lián)系。

后果:記憶片段是破碎的。當(dāng)模型試圖回顧歷史時(shí),往往只能檢索到只言片語,丟失了關(guān)鍵的上下文細(xì)節(jié)。

在線更新的延遲

這是最影響用戶體驗(yàn)的一點(diǎn)。目前的系統(tǒng)大多采用“讀寫同步”——即在用戶等待回復(fù)的那幾秒鐘里,系統(tǒng)還要忙著更新記憶庫、刪除舊數(shù)據(jù)()。

后果:隨著記憶庫變大,推理延遲直線上升。用戶感覺AI反應(yīng)越來越慢。

02LightMem解法:像人腦一樣的分層處理

LightMem的核心邏輯是:不要讓所有信息都進(jìn)入長期記憶,也不要時(shí)刻都在整理記憶。它模仿人類的記憶模型(Atkinson-Shiffrin模型),把記憶分成了三層:

第一層:感官記憶(SensoryMemory)——“過濾器”

人類的眼睛和耳朵每秒接收無數(shù)信息,但我們只會注意重要的部分。

LightMem引入了一個輕量級的小模型(或者基于熵的壓縮器),在信息進(jìn)入系統(tǒng)前先做兩件事:

去噪:把那些“嗯、啊、好的”這種低信息量的Token直接扔掉。

話題切分:不是按字?jǐn)?shù)切,而是按“話題”切。比如用戶聊完“寫代碼”轉(zhuǎn)頭聊“去旅游”,系統(tǒng)能識別出這是兩個話題,分別打包。

收益:垃圾進(jìn),垃圾出。這一步直接把“垃圾”擋在門外,Token消耗立減。

第二層:短期記憶(Short-TermMemory)——“緩沖區(qū)”

信息經(jīng)過過濾后,先放在短期記憶里暫存。

重點(diǎn)來了:它不會每輪對話都去觸發(fā)總結(jié)。只有當(dāng)這個話題聊透了,或者緩沖區(qū)滿了,系統(tǒng)才會把這一坨相關(guān)的對話打包,生成一個高質(zhì)量的“記憶膠囊”。

收益:大幅減少了調(diào)用LLM做總結(jié)的次數(shù),省錢又省時(shí)。

第三層:長期記憶(Long-TermMemory)——“夜間模式”

這是LightMem最天才的設(shè)計(jì):“睡眠更新機(jī)制”(Sleep-timeUpdate)。

白天(在線對話時(shí)):當(dāng)需要存新記憶時(shí),只做“軟更新”(SoftUpdate)。就像你忙的時(shí)候隨手貼一張便利貼,只管記下來,不花時(shí)間去整理歸檔。這樣用戶感覺不到延遲。

晚上(離線空閑時(shí)):當(dāng)用戶不聊天了,系統(tǒng)進(jìn)入“睡眠模式”。這時(shí)候,它才開始在后臺慢慢整理便利貼,把重復(fù)的合并,把沖突的修正,把碎片知識連成網(wǎng)。

收益:徹底解耦了推理和記憶維護(hù)。用戶端響應(yīng)毫秒級,后臺維護(hù)異步進(jìn)行。


LightMem架構(gòu)

LightMem由三個模塊組成:a)高效感知記憶模塊,b)主題感知STM模塊,以及c)在睡眠時(shí)間更新LTM模塊。

03效果有多炸裂?用數(shù)據(jù)說話

別光聽概念,看看論文里的實(shí)測數(shù)據(jù)(對比GPT-4o和Qwen):

更聰明了:相比最強(qiáng)基線(如A-MEM,Mem0),QA準(zhǔn)確率提提升了7.7%到29.3%。

Token省瘋了:總Token消耗量減少了20倍到38倍!原來花100塊錢的Token,現(xiàn)在只要3塊錢。

API調(diào)用少了:它是批量處理的,API調(diào)用次數(shù)減少了30倍到55倍。

純在線推理成本:如果只看在線測試階段,Token減少高達(dá)106倍,API調(diào)用減少159倍。

這不僅僅是“優(yōu)化”,這是數(shù)量級的跨越。


論文評測集效果對比

04產(chǎn)品反思

作為AI產(chǎn)品經(jīng)理,LightMem給我們的啟示遠(yuǎn)不止技術(shù)架構(gòu):

重新定義“實(shí)時(shí)性”

我們真的需要AI實(shí)時(shí)整理好所有記憶嗎?LightMem證明了:不需要。

我們在做產(chǎn)品時(shí),完全可以設(shè)計(jì)“異步記憶”體驗(yàn)。比如,你的AI伴侶可以說:“今天聊得好開心,我晚上回味一下?!钡诙焖兊酶懔?。這種擬人化的“睡眠”設(shè)定,既掩蓋了技術(shù)邊界,又增加了情感厚度。

商業(yè)模式的轉(zhuǎn)折點(diǎn)

之前做長程記憶Agent,最大的痛點(diǎn)是“越聊越貴”。隨著對話歷史增加,成本是線性甚至指數(shù)級增長的。

LightMem把成本降低了38倍,意味著“伴隨用戶一生的AI”在商業(yè)成本上終于變得可行了。個性化AI(PersonalAI)的時(shí)代可能真的要來了。

“大小模型”的黃金搭檔

LightMem的架構(gòu)再次印證了一個趨勢:端云協(xié)同。

端側(cè)用小模型做“感官過濾”(去噪、切分話題)。

云端用大模型做“深度思考”和“記憶整合”。

這比把所有壓力都給GPT要聰明得多。

AI不僅需要更強(qiáng)的大腦,更需要更聰明的記憶機(jī)制。

LightMem告訴我們:有時(shí)候,學(xué)會“遺忘”和“休息”,學(xué)會“斷舍離”,是為了更好地“記住”。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
舊將拉菲尼亞退役,巴薩官方:感謝你曾捍衛(wèi)紅藍(lán)

舊將拉菲尼亞退役,巴薩官方:感謝你曾捍衛(wèi)紅藍(lán)

懂球帝
2025-12-23 01:09:18
蘋果突然發(fā)布iOS26.3,省電效果太強(qiáng)了,信號完美

蘋果突然發(fā)布iOS26.3,省電效果太強(qiáng)了,信號完美

庫克啥都聊
2025-12-22 16:33:06
聲稱拿下庫皮揚(yáng)斯克的俄軍司令庫佐夫列夫被曝消失!或已身亡

聲稱拿下庫皮揚(yáng)斯克的俄軍司令庫佐夫列夫被曝消失!或已身亡

項(xiàng)鵬飛
2025-12-21 20:34:23
李凱文的抗日表演賽

李凱文的抗日表演賽

非典型佛教徒
2025-12-22 00:43:01
發(fā)現(xiàn)沒有,今年有個奇怪現(xiàn)象:有兒子的家庭,突然“拽”起來了!

發(fā)現(xiàn)沒有,今年有個奇怪現(xiàn)象:有兒子的家庭,突然“拽”起來了!

小影的娛樂
2025-12-22 11:13:51
倪萍被官方徹查,代言坑老品牌8年撈金上億,央視一姐晚節(jié)盡毀

倪萍被官方徹查,代言坑老品牌8年撈金上億,央視一姐晚節(jié)盡毀

一盅情懷
2025-12-20 17:57:26
優(yōu)質(zhì)“蛋白質(zhì)”排行榜!牛奶倒數(shù)第一,蝦肉才排第5,建議了解

優(yōu)質(zhì)“蛋白質(zhì)”排行榜!牛奶倒數(shù)第一,蝦肉才排第5,建議了解

岐黃傳人孫大夫
2025-12-20 10:00:03
整治違規(guī)吃喝又來了

整治違規(guī)吃喝又來了

主簿君札記
2025-12-22 17:23:41
續(xù)航最高92公里 一周充次電!九號發(fā)布Fz系列新國標(biāo)電動車發(fā)布:2999元起

續(xù)航最高92公里 一周充次電!九號發(fā)布Fz系列新國標(biāo)電動車發(fā)布:2999元起

快科技
2025-12-22 20:08:09
湖南省委軍民融合辦分管日常工作的副主任劉中杰赴衡陽履新

湖南省委軍民融合辦分管日常工作的副主任劉中杰赴衡陽履新

澎湃新聞
2025-12-22 12:30:27
60歲蔣雯麗心酸現(xiàn)狀,定居英國,又瘦又老,一代女神成了"笑話"

60歲蔣雯麗心酸現(xiàn)狀,定居英國,又瘦又老,一代女神成了"笑話"

小熊侃史
2025-11-27 18:59:29
迪士尼《阿凡達(dá):火與燼》北美首映票房慘淡,僅收8800萬美元

迪士尼《阿凡達(dá):火與燼》北美首映票房慘淡,僅收8800萬美元

新浪財(cái)經(jīng)
2025-12-22 06:22:00
原來她早已離世!死訊被“隱瞞”一個月,留下40億遺產(chǎn)讓獨(dú)子繼承

原來她早已離世!死訊被“隱瞞”一個月,留下40億遺產(chǎn)讓獨(dú)子繼承

蒂蒂茱家
2025-12-22 13:42:59
片約不斷,演啥毀啥,央視《老舅》這倆戲混子,趁早收手吧

片約不斷,演啥毀啥,央視《老舅》這倆戲混子,趁早收手吧

查爾菲的筆記
2025-12-18 16:03:46
79歲李保田現(xiàn)狀:定居山東衰老明顯,兒子李彧長得像父親“翻版”

79歲李保田現(xiàn)狀:定居山東衰老明顯,兒子李彧長得像父親“翻版”

小熊侃史
2025-12-20 10:56:45
封關(guān)后,海南炸鍋了。有房子的外地人、當(dāng)?shù)赝林紭烽_了花!

封關(guān)后,海南炸鍋了。有房子的外地人、當(dāng)?shù)赝林紭烽_了花!

石辰搞笑日常
2025-12-03 08:50:12
忍耐24小時(shí)后,蔣萬安終于下令,臺北全城警戒,賴清德又胡作非為

忍耐24小時(shí)后,蔣萬安終于下令,臺北全城警戒,賴清德又胡作非為

現(xiàn)代小青青慕慕
2025-12-21 19:27:23
徹底決裂!周定洋發(fā)文告別徐正源,疑對成都蓉城不滿,續(xù)約沒戲了

徹底決裂!周定洋發(fā)文告別徐正源,疑對成都蓉城不滿,續(xù)約沒戲了

羅掌柜體育
2025-12-22 12:13:19
阿斯:巴黎想與恩里克達(dá)成終身合作協(xié)議,成績已然說明了一切

阿斯:巴黎想與恩里克達(dá)成終身合作協(xié)議,成績已然說明了一切

懂球帝
2025-12-22 16:03:15
不愧是諾蘭!這部斥巨資打造的美劇,終于回歸

不愧是諾蘭!這部斥巨資打造的美劇,終于回歸

來看美劇
2025-12-22 20:04:15
2025-12-23 05:00:49
呼呼歷史論
呼呼歷史論
分享有趣的歷史
246文章數(shù) 15847關(guān)注度
往期回顧 全部

科技要聞

商湯聯(lián)創(chuàng)親自下場 痛批主流機(jī)器人技術(shù)大錯

頭條要聞

高市早苗政府創(chuàng)下一項(xiàng)27年來最差紀(jì)錄

頭條要聞

高市早苗政府創(chuàng)下一項(xiàng)27年來最差紀(jì)錄

體育要聞

戴琳,中國足球的反向代言人

娛樂要聞

張柏芝不再隱瞞,三胎生父早有答案?

財(cái)經(jīng)要聞

央行信用新政:為失信者提供"糾錯"通道

汽車要聞

可享88元抵2000元等多重權(quán)益 昊鉑A800開啟盲訂

態(tài)度原創(chuàng)

教育
游戲
健康
手機(jī)
公開課

教育要聞

高二英語成績120分左右,看英文原版小說是大坑,和提分南轅北轍

德瑪西亞杯:Viper完美首秀,BLG零封LNG

這些新療法,讓化療不再那么痛苦

手機(jī)要聞

三星Galaxy S26或2月發(fā),明年還有闊折疊

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版