国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從經(jīng)歷到知識:UIUC、清華PlugMem如何重構(gòu)Agent記憶

0
分享至


新智元報道

編輯:LRST

【新智元導(dǎo)讀】現(xiàn)在的AI agent往往把長交互歷史直接存起來,但很難高效復(fù)用。最樸素的方法直接從「原始記憶」里檢索,但常常把模型淹沒在冗長、低價值的上下文里。PlugMem把經(jīng)驗轉(zhuǎn)化為結(jié)構(gòu)化、可復(fù)用的知識,并提出一個任務(wù)無關(guān)(task-agnostic)的統(tǒng)一記憶模塊,在多種Agent基準(zhǔn)上提升性能,同時消耗更少。

隨著AI agent承擔(dān)越來越復(fù)雜的任務(wù)——長對話、多步推理、交互式網(wǎng)頁導(dǎo)航等——它們必須記住并復(fù)用過去的經(jīng)驗。

但多數(shù)現(xiàn)有記憶系統(tǒng)更像「日志文件」:不斷累積原始交互軌跡,需要時再從中取出一些文本片段。時間一長,記憶會無限增長、噪聲增多,并迅速擠占agent的上下文窗口。

于是出現(xiàn)一個悖論:AI agent擁有前所未有的「記憶量」,卻依然難以有效使用。然而,對決策真正重要的內(nèi)容,往往不是完整的交互記錄,而是從記錄中沉淀出的知識。

比如做商品推薦時,agent需要記住用戶偏好,而不是反復(fù)閱讀長對話;在新網(wǎng)站購物時,agent需要的是「如何搜索、篩選、下單」的通用策略,而不是重放自己看過的每一個頁面。

AI agent記憶問題的核心挑戰(zhàn)并非「存更多」,而是以能突出決策相關(guān)信息的方式組織記憶。

UIUC、清華大學(xué)最新提出的AI agent的記憶方法PlugMem:一個任務(wù)無關(guān)、即插即用的記憶模塊,用來把智能體的原始經(jīng)驗轉(zhuǎn)化為可復(fù)用知識。PlugMem不把記憶當(dāng)作扁平文本來檢索,而是借鑒認知科學(xué),將經(jīng)驗結(jié)構(gòu)化為以知識為中心的表示。


論文鏈接:https://arxiv.org/abs/2603.03296

代碼鏈接:https://github.com/TIMAN-group/PlugMem

認知科學(xué)通常區(qū)分三類記憶:對事件的回憶、對事實的知識、以及對技能/策略的掌握。事件提供背景,但有效決策依賴從事件中抽象出的事實與技能。這一視角啟發(fā)我們重新思考 AI agent 的記憶設(shè)計。

PlugMem將對話、文檔、網(wǎng)頁軌跡等異構(gòu)交互記錄,轉(zhuǎn)化為結(jié)構(gòu)化的知識單元:更緊湊、更可復(fù)用,并且與決策直接對齊。

PlugMem包含三個核心組件:

  1. Structuring(結(jié)構(gòu)化) 將原始情景經(jīng)驗標(biāo)準(zhǔn)化,并提取為兩類知識:命題式知識(facts)與處方式知識(skills、可復(fù)用技能/策略)。這些知識單元被組織為結(jié)構(gòu)化的記憶圖。

  2. Retrieval(檢索) 不再檢索冗長文本塊,而是檢索與當(dāng)前任務(wù)語義對齊的知識單元。高層概念與意圖(concepts / intents)作為「路由信號」,幫助快速定位最相關(guān)的內(nèi)容。

  3. Reasoning(推理/壓縮) 把檢索到的知識進一步壓縮為簡潔、可直接用于當(dāng)前任務(wù)的指引,再交給AI agent使用,從而更高效地利用上下文。


PlugMem將異構(gòu)智能體經(jīng)驗組織為知識中心的記憶圖,實現(xiàn)結(jié)構(gòu)化檢索與推理。

PlugMem與傳統(tǒng)GraphRAG系統(tǒng)的關(guān)鍵差別在于「記憶訪問單元」。傳統(tǒng)方法通常索引文本chunk或?qū)嶓w;PlugMem以知識單元(命題與處方)作為基本構(gòu)件。這樣的設(shè)計減少冗余、提升信息密度,并提高檢索精度。

一個能跨任務(wù)遷移的記憶模塊

很多記憶系統(tǒng)往往為特定基準(zhǔn)精心定制:例如對話記憶、知識密集問答、網(wǎng)頁智能體等。這類任務(wù)特定記憶模塊在單一場景里可能表現(xiàn)很好,但換任務(wù)往往要重新設(shè)計。

PlugMem選擇了另一種方法:作為一個即插即用的通用記憶骨架,可以直接接到不同AI agent上,無需針對任務(wù)做專門修改。文中用同一個模塊、保持實現(xiàn)不變,在三個異構(gòu)基準(zhǔn)上評測:長程對話式問答、基于維基百科的多跳知識檢索、交互式網(wǎng)頁決策任務(wù)。

結(jié)果顯示:PlugMem在三種設(shè)置下都穩(wěn)定提升了任務(wù)表現(xiàn),超過了通用檢索方法與多種任務(wù)特定記憶設(shè)計。更重要的是,這些提升是在向AI agent上下文注入顯著更少記憶智元(token)的前提下實現(xiàn)的。

用「效用」衡量記憶

而不是用「大小」

只看任務(wù)準(zhǔn)確率并不能反映記憶系統(tǒng)的關(guān)鍵能力:記憶模塊必須在「決策效用」和「上下文成本」之間權(quán)衡。

因此PlugMem工作中提出一個信息論指標(biāo),用來度量記憶系統(tǒng)每消耗一個智元(token),能帶來多少「決策相關(guān)的信息增益」。直觀地說:記憶模塊產(chǎn)生的記憶智元(token)能讓AI agent對正確行動更有把握多少?接著再按記憶長度做歸一化。

在效用–成本空間里,PlugMem穩(wěn)定處于更有優(yōu)勢的位置:更低智元(token)成本下獲得更高的決策效用。


在多種基準(zhǔn)上,PlugMem在更小的記憶預(yù)算下提供更高的決策相關(guān)效用。

這些結(jié)果支持一個結(jié)論:把經(jīng)驗轉(zhuǎn)化為知識,比直接檢索原始日志更緊湊、更有信息量。

超過任務(wù)特定設(shè)計

乍看之下,一個任務(wù)無關(guān)的記憶模塊能超過為某個基準(zhǔn)量身定制的方法似乎有些反直覺。PlugMem的結(jié)果表明,決定性因素往往不是特定benchmark的啟發(fā)式技巧,而是對「決策相關(guān)知識抽取」的有效檢索。

沒有檢索,記憶只是靜態(tài)存儲;沒有結(jié)構(gòu)化知識,檢索就缺乏精度。PlugMem將以下三件事拆開并協(xié)同:結(jié)構(gòu)化決定「可被檢索的內(nèi)容是什么」,檢索決定「記憶是否真的能幫助決策」,推理/壓縮確保「以更低成本被AI智能體利用」。

PlugMem也不試圖取代任務(wù)特定技巧。它更像一個通用記憶底座,上層依然可以疊加任務(wù)適配。實驗也顯示:在PlugMem之上再加入任務(wù)特定啟發(fā)式探索方法,往往還能進一步提升效果,二者具有互補性。

走向智能體的「可復(fù)用知識基礎(chǔ)設(shè)施」

當(dāng)AI agent邁向更長程的自主能力,記憶需要從被動存儲走向成為主動的知識基礎(chǔ)設(shè)施:agents應(yīng)當(dāng)積累可遷移的事實與策略,讓知識跨任務(wù)、跨環(huán)境復(fù)用,緩解AI agents冷啟動問題,并支持更強的泛化。

PlugMem是朝這個方向邁出的一步。它以認知科學(xué)為設(shè)計啟發(fā),將「知識」作為復(fù)用的基本單位,展示了任務(wù)無關(guān)記憶在效率與能力上同時可行。

更廣義地看,這項工作提示了一個視角轉(zhuǎn)變:與其追求檢索更多上下文,不如追求把經(jīng)驗表示成天然可復(fù)用的形式。隨著智能體能力擴展,可擴展、可遷移的記憶系統(tǒng)將成為基礎(chǔ)設(shè)施;知識中心的記憶很可能是下一代智能體的重要基石。

參考資料:

https://arxiv.org/abs/2603.03296


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
逃亡沙特不久,馬步芳強取親侄女為妻,蔣介石:他讓我顏面盡失

逃亡沙特不久,馬步芳強取親侄女為妻,蔣介石:他讓我顏面盡失

史筆似塵鉤
2026-03-17 20:35:07
汪小菲馬筱梅基因太絕!家中“小炸毛”萌翻全網(wǎng)這顏值太招人疼!

汪小菲馬筱梅基因太絕!家中“小炸毛”萌翻全網(wǎng)這顏值太招人疼!

孤酒老巷QA
2026-03-24 05:34:17
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
張雪峰早就防著這一天了:為女兒注冊40枚商標(biāo),防親戚父愛太沉重

張雪峰早就防著這一天了:為女兒注冊40枚商標(biāo),防親戚父愛太沉重

墨染時光
2026-03-26 07:50:31
美國懵了,能摧毀伊朗電力的石墨炸彈,竟讓中國兩座城市聯(lián)手廢了

美國懵了,能摧毀伊朗電力的石墨炸彈,竟讓中國兩座城市聯(lián)手廢了

瑛派兒老黃
2026-03-25 23:46:07
史前大洪水掩蓋什么真相?所有文明都曾記錄,是人類共同的記憶?

史前大洪水掩蓋什么真相?所有文明都曾記錄,是人類共同的記憶?

歷史甄有趣
2026-03-20 15:40:07
基辛格坦言:如果爆發(fā)核戰(zhàn)爭,中國可能只有5個地方可以躲避危險

基辛格坦言:如果爆發(fā)核戰(zhàn)爭,中國可能只有5個地方可以躲避危險

鶴羽說個事
2026-03-25 22:21:29
向鵬林詩棟退出世界杯

向鵬林詩棟退出世界杯

乒乓11分
2026-03-26 09:48:25
如果美國解體,猶太財閥的巨資何處安放下一個宿主,答案超乎想象

如果美國解體,猶太財閥的巨資何處安放下一個宿主,答案超乎想象

芳芳歷史燴
2026-03-25 22:24:25
現(xiàn)實中的大齡剩女最后妥協(xié)了嗎?網(wǎng)友爆笑評論,真是一言難盡。

現(xiàn)實中的大齡剩女最后妥協(xié)了嗎?網(wǎng)友爆笑評論,真是一言難盡。

侃神評故事
2026-03-25 11:30:09
油價反轉(zhuǎn)!95號汽油破9元后迎下調(diào),4月7日調(diào)價最新預(yù)測

油價反轉(zhuǎn)!95號汽油破9元后迎下調(diào),4月7日調(diào)價最新預(yù)測

復(fù)轉(zhuǎn)這些年
2026-03-26 09:40:14
小米公布實情,大家都被雷軍騙了

小米公布實情,大家都被雷軍騙了

鳴金網(wǎng)
2026-03-26 09:08:36
特朗普希望破滅了,但是福特號航母上4500名美軍士兵卻徹底安全了

特朗普希望破滅了,但是福特號航母上4500名美軍士兵卻徹底安全了

安安說
2026-03-26 11:41:14
英媒:以色列是特朗普的戰(zhàn)爭伙伴而非和平伙伴

英媒:以色列是特朗普的戰(zhàn)爭伙伴而非和平伙伴

參考消息
2026-03-25 18:54:05
蔡正元即將入獄,國臺辦做出回應(yīng),內(nèi)容不尋常,已看透他的真面目

蔡正元即將入獄,國臺辦做出回應(yīng),內(nèi)容不尋常,已看透他的真面目

牛鍋巴小釩
2026-03-26 17:09:02
演員因商演獲贈股權(quán)卷入債務(wù)糾紛,賬戶上30萬元被法院凍結(jié)

演員因商演獲贈股權(quán)卷入債務(wù)糾紛,賬戶上30萬元被法院凍結(jié)

半島晨報
2026-03-26 17:15:03
庫里可以接著休息了!東部只剩理論!

庫里可以接著休息了!東部只剩理論!

籃球大圖
2026-03-26 11:25:14
A股:今天收3889.08,尾盤已明確,做好準(zhǔn)備,明天周五,要變盤了

A股:今天收3889.08,尾盤已明確,做好準(zhǔn)備,明天周五,要變盤了

虎哥閑聊
2026-03-26 15:09:13
心眼壞的人,最愛問這3件事,別傻乎乎全說!

心眼壞的人,最愛問這3件事,別傻乎乎全說!

唯晨說
2026-03-25 13:12:14
國產(chǎn)螺絲刀在海外躥紅,在TikTok狂賣2800萬

國產(chǎn)螺絲刀在海外躥紅,在TikTok狂賣2800萬

跨境派Pro
2026-03-23 14:16:59
2026-03-26 19:35:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14821文章數(shù) 66721關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

原正部級劉慧被開除黨籍:結(jié)交政治騙子 匿名誣告他人

頭條要聞

原正部級劉慧被開除黨籍:結(jié)交政治騙子 匿名誣告他人

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會喪事從簡

財經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

教育
時尚
藝術(shù)
房產(chǎn)
本地

教育要聞

2026高考撿漏指南:西安藏著4所“就業(yè)王炸”院校,考生閉眼沖

皮衣+裙,高級到炸

藝術(shù)要聞

哪一座橋不是風(fēng)景?

房產(chǎn)要聞

突發(fā),三亞又有大批征遷補償方案出爐!

本地新聞

救命,這只醬板鴨已經(jīng)在我手機復(fù)仇了一萬遍

無障礙瀏覽 進入關(guān)懷版