国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

高效智能體幕后推手是誰?一篇綜述帶你從記憶×工具學習×規(guī)劃看透

0
分享至



隨著大模型能力的躍遷,業(yè)界關注點正在從 “模型能不能做” 快速轉向 “智能體能不能落地”。過去一年可以看到大量工作在提升智能體的有效性(effectiveness):如何讓它更聰明、更穩(wěn)、更會用工具、更能完成復雜任務。

但在真實應用里,另一個更 “硬” 的問題常常決定能否上線:高效性(efficiency)。智能體即便表現(xiàn)很好,如果每次都要消耗大量算力、時間與調用成本,也很難在生產環(huán)境大規(guī)模部署。

基于這一視角,論文整理并撰寫了一篇面向 “高效智能體” 的綜述,系統(tǒng)梳理當前主要方法,并從三個最關鍵的機制出發(fā)組織全文框架:記憶 — 工具學習 — 規(guī)劃。論文從設計范式出發(fā)對代表性方法進行歸納總結,聚焦那些以效率為目標或能夠提升效率的核心設計與實現(xiàn)路徑,從而更清晰地呈現(xiàn)智能體在真實落地場景中的成本 — 性能權衡。



  • 論文地址:https://arxiv.org/abs/2601.14192
  • GitHub 地址:https://github.com/yxf203/Awesome-Efficient-Agents



一、智能體記憶:

讓 “會記” 更省、更準、更可擴展



智能體要做長任務,離不開記憶。但把歷史一股腦塞進提示詞,會帶來 token 暴漲和智能體處理長上下文能力下降。因此,高效記憶系統(tǒng)的關鍵在于把 “長歷史” 加工成 “可用、可檢索、可復用” 的信息資產。

論文按記憶生命周期梳理三步:構建 — 管理 — 訪問。

  • 記憶構建:通過概括、壓縮與結構化把 “長對話” 轉成 “可用記憶”。一類是留在推理鏈路的工作記憶,文本式直觀但吃上下文,隱式式更像緩存,可減少重復編碼;另一類是外置為可檢索系統(tǒng)的外部記憶,先將信息壓成小單元再按需召回,包括條目式、圖式與分層式。此外論文也提到要警惕過度壓縮帶來的信息損失,即需要考慮如何在降成本與保真之間取得平衡。
  • 記憶管理:防止 “存爆炸”,也避免 “取太慢”。規(guī)則式快但可能誤刪重要內容,大模型式更聰明但更貴,混合式則按層級或場景組合兩者策略,在效果與成本之間取得折中。
  • 記憶訪問:選什么 + 怎么用。訪問分記憶選擇與記憶整合,通過檢索或訓練等方式挑選記憶,再用壓縮過濾或隱式注入減少 token 與重復編碼。

另外,多智能體記憶也成為新趨勢。相較于只靠通信,近年更多工作開始引入 “記憶” 這一概念來支撐規(guī)?;瘏f(xié)作,論文將其概括為:共享記憶 / 本地記憶 / 混合記憶三類。

二、工具學習:

讓 “會用工具” 更少調用、更少等待、更少走彎路



工具讓智能體從 “會說” 變成 “能做”,但成本也最容易在工具鏈路里失控。論文按三條主線梳理提效思路:工具選擇 — 工具調用 — 工具融合推理。

  • 工具選擇:目標是 “更快選對、少塞進 prompt”。相關方法包括外部檢索器、多標簽分類,以及將工具映射為特殊 token 等思路,核心都是在大量工具中更快、更準地選出最需要的那幾個。
  • 工具調用:核心是 “少等、少調、少走彎路”。典型路線包括邊生成邊調用、并行化調用,以及利用成本感知調用與測試時高效擴展來削減冗余調用;進一步還可通過面向效率的后訓練把 “短軌跡、少調用” 寫進策略本身。
  • 工具融合推理:讓模型學會 “該不該用、何時用、用幾次”。代表性方向包括選擇性調用,引導智能體只在必要時才發(fā)起工具調用;以及成本約束策略優(yōu)化,在保證效果的同時對冗余交互與過長軌跡施加懲罰,從而學到更短、更省的工具使用策略。

三、智能體規(guī)劃:

在 “深度” 與 “寬度” 上同時省下來



規(guī)劃決定智能體如何在多步決策空間里行動。效率問題要么來自單體推理 “想太深、搜太貴”,要么來自多體協(xié)作 “聊太多、通信太重”。因此論文從兩條線展開:單智能體規(guī)劃與多智能體協(xié)作規(guī)劃。



四、基準與評測(Benchmark):

沒有 “可比的尺”,就談不上 “可落地的效率”

在談記憶、工具學習與規(guī)劃的提效方案之前,先要把 “尺子” 定清楚:高效到底怎么量?

論文強調,效率必須建立在有效性之上。省了資源卻顯著掉性能,不算高效。因此論文采用的定義是:在給定預算下取得更好的效果,或在相近效果下消耗更少資源。

基于這一視角,論文先梳理了以有效性為主的 benchmark,并進一步匯總了與效率相關的評測內容:一方面,整理了在 benchmark 中顯式納入效率信號(成本、延遲、調用次數(shù)等)的評測設置;另一方面,總結了智能體方法中常用的效率指標,用于刻畫 “省在哪兒、省多少”。

五、挑戰(zhàn)與展望

論文同時也提出了目前的一些挑戰(zhàn)與展望:

1)統(tǒng)一評測框架:指標口徑統(tǒng)一,模塊開銷邊界清楚,才能真正讓各個智能體方法可比可復現(xiàn)。

2)智能體的隱式推理(Latent Reasoning):大模型側的隱式推理正在升溫,但面向智能體的研究仍相對稀缺。由于智能體鏈路更長、更復雜,還要處理工具調用、規(guī)劃與記憶等環(huán)節(jié),如何把中間推理 “做在隱式空間里”、在不掉效果的前提下降低成本,既是挑戰(zhàn),也是機會。

3)面向部署設計:在多智能體場景下,需要把部署成本納入考量,核心問題是投入產出比。也就是說,增加智能體帶來的收益,是否足以覆蓋新增的開銷。

4)多模態(tài)效率:多模態(tài)智能體發(fā)展很快,但效率研究仍相對欠缺。文本智能體的一些提效思路可以借鑒,但是直接遷移卻并不容易,因為多模態(tài)智能體的感知輸入、行為空間與任務結構更復雜、交互成本更高。因此,如何在多模態(tài)場景下系統(tǒng)地兼顧效果與成本,仍是亟待解決的關鍵問題。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中國三大長壽食物,魚只能排到第三,第一名很多人想不到!

中國三大長壽食物,魚只能排到第三,第一名很多人想不到!

江江食研社
2026-02-12 12:30:10
世界第一女巨人來自中國安徽,穿78碼的鞋子,一頓飯吃六碗炒面

世界第一女巨人來自中國安徽,穿78碼的鞋子,一頓飯吃六碗炒面

流史歲月
2026-02-25 14:05:05
單拳指天+興奮蹦跳!申裕斌3-1世界第4 韓媒:加入乒超后連創(chuàng)佳績

單拳指天+興奮蹦跳!申裕斌3-1世界第4 韓媒:加入乒超后連創(chuàng)佳績

顏小白的籃球夢
2026-03-13 08:34:15
游客夜爬華山偶遇“神獸” 相關部門:俗稱“四不像”

游客夜爬華山偶遇“神獸” 相關部門:俗稱“四不像”

閃電新聞
2026-03-13 13:14:55
特朗普吹噓伊朗“即將投降”, 佩斯科夫稱美俄利益暫時一致

特朗普吹噓伊朗“即將投降”, 佩斯科夫稱美俄利益暫時一致

山河路口
2026-03-13 20:09:06
庫爾德人沒反,阿塞拜疆人沒反,胡齊斯坦省的阿拉伯人率先反了

庫爾德人沒反,阿塞拜疆人沒反,胡齊斯坦省的阿拉伯人率先反了

高博新視野
2026-03-12 08:10:13
出大事了,以軍調轉槍口空襲俄設施,普京立即表態(tài),中東要變天了

出大事了,以軍調轉槍口空襲俄設施,普京立即表態(tài),中東要變天了

井普椿的獨白
2026-03-13 21:11:35
3月12日專訪曝光,鄭麗文拋出3個訪陸時間點,或將跑7座城市

3月12日專訪曝光,鄭麗文拋出3個訪陸時間點,或將跑7座城市

策前論
2026-03-13 12:19:40
《妻子浪漫旅行2026》錄制消息屬實,秦昊父母在列

《妻子浪漫旅行2026》錄制消息屬實,秦昊父母在列

春日在捕月
2026-03-13 12:28:55
全紅嬋出席上?;顒?!穿搭被吐槽,身寬體胖成H型身材,一臉福相

全紅嬋出席上?;顒?!穿搭被吐槽,身寬體胖成H型身材,一臉福相

攬星河的筆記
2026-03-12 17:09:08
全國人大代表張全收:建議允許60歲以上農民工繼續(xù)務工

全國人大代表張全收:建議允許60歲以上農民工繼續(xù)務工

閃電新聞
2026-03-12 12:17:07
東北老人坐兩天火車來杭州找孫女,警方查明后發(fā)現(xiàn)他搞錯地方了!

東北老人坐兩天火車來杭州找孫女,警方查明后發(fā)現(xiàn)他搞錯地方了!

一盅情懷
2026-03-13 16:24:28
奔馳全新一代GLS外觀大升級,巨型燈組加中網要cos擎天柱?

奔馳全新一代GLS外觀大升級,巨型燈組加中網要cos擎天柱?

凡兮說
2026-03-13 15:09:33
4輪不勝后!廣東隊做出重大決定,放棄張皓嘉,杜鋒面臨下課!

4輪不勝后!廣東隊做出重大決定,放棄張皓嘉,杜鋒面臨下課!

緋雨兒
2026-03-13 14:14:52
歐陽明高:慎重起見,固態(tài)電池車這兩年最好別賣

歐陽明高:慎重起見,固態(tài)電池車這兩年最好別賣

第一財經資訊
2026-03-13 21:10:32
熱刺換帥地震!比圖多爾強十倍,水平直追瓜迪奧拉的大神要來了

熱刺換帥地震!比圖多爾強十倍,水平直追瓜迪奧拉的大神要來了

奶蓋熊本熊
2026-03-13 02:52:38
女排張常寧身高193,一身休閑裝照片,看起來眉眼清秀,十分明亮

女排張常寧身高193,一身休閑裝照片,看起來眉眼清秀,十分明亮

草莓解說體育
2026-03-13 17:56:09
財政壓力的下半場:退休人員占比近四成,才是硬賬

財政壓力的下半場:退休人員占比近四成,才是硬賬

超先聲
2026-01-09 16:45:39
華為養(yǎng)了十年的狼,帶著一群崽子把家偷了

華為養(yǎng)了十年的狼,帶著一群崽子把家偷了

老鷹哥
2026-03-13 11:31:52
在美國人眼里,打仗最不要命的5個國家:俄羅斯排第三,第一是誰?

在美國人眼里,打仗最不要命的5個國家:俄羅斯排第三,第一是誰?

譚老師地理大課堂
2026-03-12 21:10:56
2026-03-13 21:56:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12497文章數(shù) 142583關注度
往期回顧 全部

科技要聞

龍蝦熱卷到AI硬件 “無腦”硬件或被淘汰

頭條要聞

特朗普鼓動油輪"大膽"過霍爾木茲海峽:伊朗沒有海軍

頭條要聞

特朗普鼓動油輪"大膽"過霍爾木茲海峽:伊朗沒有海軍

體育要聞

叕戰(zhàn)奧運,張雨霏要做回“小將”

娛樂要聞

小S復工錄制 感謝賈永婕陪大S走到最后

財經要聞

中小銀行定存利率落入“1”時代

汽車要聞

置換補貼價8.68萬 五菱繽果S 525km旗艦款上市

態(tài)度原創(chuàng)

本地
時尚
房產
游戲
公開課

本地新聞

坐標北京,過敏季反向遷徒

今日熱點:王鶴潤方向王玉雯道歉;正午陽光辟謠《瑯琊榜3》陣容信息……

房產要聞

不容易啊!??诮K于又要賣地了!

《Exodus》《術士》分別于2027上半年和下半年發(fā)售

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版