国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

RouteMoA:無(wú)需預(yù)推理的動(dòng)態(tài)路由,實(shí)現(xiàn)高效多智能體混合

0
分享至



本篇論文已被 ACL 2026 接收,主要作者來(lái)自上海交通大學(xué)自動(dòng)化與感知學(xué)院 IWIN 中心團(tuán)隊(duì)。團(tuán)隊(duì)負(fù)責(zé)人為關(guān)新平教授,指導(dǎo)老師為陳彩蓮教授和樂(lè)心怡教授,合作作者還包括南洋理工大學(xué)陶大程教授。其他作者來(lái)自騰訊、上海人工智能實(shí)驗(yàn)室、香港中文大學(xué)等機(jī)構(gòu)。第一作者王驥澤為上海交通大學(xué)博士生,研究方向?yàn)榇竽P椭悄荏w。

近年來(lái),大語(yǔ)言模型的發(fā)展,正在從 “單模型能力提升” 走向 “多模型協(xié)作”。這是一個(gè)很自然的方向:既然不同模型各有所長(zhǎng),有的擅長(zhǎng)數(shù)學(xué),有的擅長(zhǎng)代碼,有的更懂醫(yī)學(xué),那為什么不讓它們協(xié)同起來(lái),共同解決更復(fù)雜的問(wèn)題?

Mixture-of-Agents(MoA)正是在這樣的背景下提出的。它通過(guò)讓多個(gè)模型并行生成、逐層交互、反復(fù)融合,往往能夠得到比單一模型更強(qiáng)的結(jié)果。問(wèn)題也很明顯:性能提升的同時(shí),成本和延遲也隨之迅速上升。

在標(biāo)準(zhǔn) MoA 中,每一輪通常都要調(diào)用多個(gè)模型,再基于它們的輸出進(jìn)行篩選和融合。但究竟該讓哪些模型參與、哪些模型可以跳過(guò),往往缺乏明確的選擇機(jī)制。模型越多、層數(shù)越深,整體開(kāi)銷(xiāo)就越高,在大規(guī)模模型池場(chǎng)景下,系統(tǒng)效率和可擴(kuò)展性都會(huì)面臨很大挑戰(zhàn)。

也正因如此,研究者開(kāi)始嘗試讓 MoA 變稀疏。例如,一些方法如 Sparse MoA 會(huì)先讓模型池中的所有模型生成回答,再通過(guò)額外的評(píng)審模型進(jìn)行打分和篩選,只保留一部分模型進(jìn)入后續(xù)協(xié)作。這樣雖然減少了后續(xù)融合的負(fù)擔(dān),但本質(zhì)上仍然繞不開(kāi)一個(gè)問(wèn)題:為了決定該選誰(shuí),系統(tǒng)還是得先讓所有模型都推理一遍。

于是,這篇工作的核心問(wèn)題就變得非常直接:我們真的需要先讓所有模型都回答一遍,才能決定該選誰(shuí)嗎?



  • 論文標(biāo)題:RouteMoA: Dynamic Routing without Pre-Inference Boosts Efficient Mixture-of-Agents
  • 論文鏈接:https://arxiv.org/abs/2601.18130
  • 代碼鏈接:https://github.com/Jize-W/RouteMoA

一句話總結(jié):RouteMoA 的核心思想是,通過(guò)在推理前進(jìn)行模型能力預(yù)測(cè),避免對(duì)所有模型進(jìn)行無(wú)效推理。





現(xiàn)有方法的問(wèn)題:

效率瓶頸不在融合,而在全量推理

當(dāng)前 MoA 系列方法的一個(gè)共同假設(shè)是:要判斷哪個(gè)模型更好,必須先看到它的輸出。因此,無(wú)論是經(jīng)典 MoA,還是引入 judge 的 Sparse MoA,本質(zhì)上都繞不開(kāi)一個(gè)步驟:所有模型先推理 -> 再篩選 -> 再融合。

這帶來(lái)兩個(gè)問(wèn)題:

第一,計(jì)算成本無(wú)法下降。即使最后只用少數(shù)模型,前面已經(jīng)為所有模型付出了推理代價(jià)。

第二,難以擴(kuò)展到大模型池。當(dāng)模型數(shù)量增加時(shí),全量推理會(huì)迅速變得不可承受,甚至超出上下文限制。

也就是說(shuō),瓶頸并不在 “如何選”,而在 “選之前已經(jīng)太貴了”。

RouteMoA:

把 “選模型” 前移到推理之前



RouteMoA 的關(guān)鍵創(chuàng)新,是把模型選擇從 “后驗(yàn)判斷” 變成 “先驗(yàn)預(yù)測(cè) + 輕量修正”。

整個(gè)流程可以分為三個(gè)步驟:

1. 先驗(yàn)篩選:不推理,也能判斷誰(shuí)更可能做對(duì)

RouteMoA 引入了一個(gè)輕量級(jí) scorer,只根據(jù)用戶(hù) query,就預(yù)測(cè)每個(gè)模型的潛在表現(xiàn)。這個(gè)過(guò)程不需要調(diào)用大模型推理,只做一個(gè)粗粒度打分,把模型池縮小到一個(gè)潛力子集。本質(zhì)上,這是在做一件過(guò)去被忽略的事情:用 query 本身的信息,提前判斷模型能力匹配度。

2. 后驗(yàn)修正:用已有輸出做低成本評(píng)審

初篩不可避免會(huì)有誤差,因此 RouteMoA 引入了 mixture-of-judges:

  • self-assessment:模型對(duì)自己的答案打分
  • cross-assessment:高質(zhì)量模型評(píng)估其他模型

關(guān)鍵在于:這些評(píng)估只基于已經(jīng)生成的輸出,不引入額外推理調(diào)用。也就是說(shuō),系統(tǒng)通過(guò)已有信息進(jìn)行糾錯(cuò),而不是再算一輪。

3. 綜合排序:性能、成本、延遲一起優(yōu)化

最終,RouteMoA 在模型選擇時(shí)不僅僅考慮性能,而是同時(shí)考慮:

  • 輸出質(zhì)量
  • token 成本
  • 推理延遲

從而在實(shí)際系統(tǒng)中實(shí)現(xiàn)一個(gè)更接近工程最優(yōu)的決策,而不是單純追求 accuracy。

實(shí)驗(yàn)結(jié)果:

少花 90% 的錢(qián),反而更強(qiáng)

在包含 15 個(gè)模型的大規(guī)模模型池實(shí)驗(yàn)中,RouteMoA 的結(jié)果非常直觀:

  • 成本降低 89.8%
  • 延遲降低 63.6%
  • 同時(shí)整體準(zhǔn)確率相對(duì) MoA 和 SMoA 有所提升

這說(shuō)明一件事:減少無(wú)效計(jì)算,不僅不會(huì)傷害性能,反而會(huì)讓系統(tǒng)更專(zhuān)注于對(duì)的模型。



一個(gè)關(guān)鍵洞察:

多模型系統(tǒng)的本質(zhì)是稀疏的

論文中一個(gè)非常重要的觀察是:在絕大多數(shù) query 上,真正關(guān)鍵的模型只占少數(shù)。只要初始階段能把這些模型保留下來(lái),后續(xù)協(xié)作就足以放大正確答案。實(shí)驗(yàn)中,scorer 在 Top-3 內(nèi)命中正確模型的概率接近 98%,這意味著:系統(tǒng)并不需要看所有答案,只需要?jiǎng)e漏掉對(duì)的模型。

進(jìn)一步分析:

失敗不在選錯(cuò)模型,而在融合階段



一個(gè)很有意思的發(fā)現(xiàn)是,在失敗案例中:

  • 超過(guò) 50% 的錯(cuò)誤來(lái)自最終答案融合(aggregation drift)
  • 而真正因?yàn)檫x錯(cuò)模型的比例要低得多

可見(jiàn),多模型系統(tǒng)的瓶頸正在發(fā)生轉(zhuǎn)移:從 “選誰(shuí)來(lái)回答”,轉(zhuǎn)向 “如何整合多個(gè)答案”。

總結(jié):多模型時(shí)代,調(diào)度很重要

RouteMoA 的意義,并不只是一個(gè)更高效的 MoA 變體,而是提供了一種新的范式:

  • 不再默認(rèn)所有模型都要參與
  • 而是先判斷誰(shuí)值得參與
  • 再用協(xié)作機(jī)制校正和放大正確答案

換句話說(shuō),隨著多模型協(xié)作的興起,系統(tǒng)層的調(diào)度與協(xié)同,正變得與模型能力同樣重要。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
以色列前總理貝內(nèi)特:伊朗實(shí)質(zhì)上已經(jīng)向該地區(qū)再次宣戰(zhàn)

以色列前總理貝內(nèi)特:伊朗實(shí)質(zhì)上已經(jīng)向該地區(qū)再次宣戰(zhàn)

一種觀點(diǎn)
2026-05-05 19:24:58
1-2出局 35歲悲情巨星遺憾揮別!闖蕩17年 歐冠0冠 西甲0冠

1-2出局 35歲悲情巨星遺憾揮別!闖蕩17年 歐冠0冠 西甲0冠

葉青足球世界
2026-05-06 07:54:58
偉偉道來(lái) | 伊朗的反應(yīng)為何如此激烈

偉偉道來(lái) | 伊朗的反應(yīng)為何如此激烈

經(jīng)濟(jì)觀察報(bào)
2026-05-06 11:40:46
吳宜澤透露拿到獎(jiǎng)金后準(zhǔn)備在英國(guó)買(mǎi)房,50萬(wàn)英鎊獎(jiǎng)金需交稅超23萬(wàn)鎊,實(shí)際到手約26.5萬(wàn)鎊

吳宜澤透露拿到獎(jiǎng)金后準(zhǔn)備在英國(guó)買(mǎi)房,50萬(wàn)英鎊獎(jiǎng)金需交稅超23萬(wàn)鎊,實(shí)際到手約26.5萬(wàn)鎊

大風(fēng)新聞
2026-05-06 11:53:02
定了!斯諾克巨星邀請(qǐng)賽5月9日開(kāi)桿,吳宜澤領(lǐng)銜,6世界冠軍出戰(zhàn)

定了!斯諾克巨星邀請(qǐng)賽5月9日開(kāi)桿,吳宜澤領(lǐng)銜,6世界冠軍出戰(zhàn)

劉姚堯的文字城堡
2026-05-06 08:31:36
女性跑步:暴露這個(gè)隱私,是性感嗎?

女性跑步:暴露這個(gè)隱私,是性感嗎?

馬拉松跑步健身
2026-05-05 19:18:07
吳宜澤社媒回復(fù)趙心童、丁俊暉:一起加油,永遠(yuǎn)的大哥

吳宜澤社媒回復(fù)趙心童、丁俊暉:一起加油,永遠(yuǎn)的大哥

懂球帝
2026-05-05 19:39:09
在中國(guó)人民公安大學(xué),穿了四年警服,畢業(yè)五年后,我們宿舍四個(gè)人,沒(méi)一個(gè)在出現(xiàn)場(chǎng)

在中國(guó)人民公安大學(xué),穿了四年警服,畢業(yè)五年后,我們宿舍四個(gè)人,沒(méi)一個(gè)在出現(xiàn)場(chǎng)

侃故事的阿慶
2026-05-06 09:21:32
被延長(zhǎng)的搶救時(shí)間,被卡住的工傷認(rèn)定

被延長(zhǎng)的搶救時(shí)間,被卡住的工傷認(rèn)定

新京報(bào)
2026-05-06 11:03:07
51歲女子包養(yǎng)24歲男孩,嫌男孩不行被殺,2014年男孩說(shuō)她索取無(wú)度

51歲女子包養(yǎng)24歲男孩,嫌男孩不行被殺,2014年男孩說(shuō)她索取無(wú)度

漢史趣聞
2026-05-05 11:40:36
世錦賽慶功宴!新科冠軍吳宜澤休閑裝亮相 網(wǎng)友:艾倫不來(lái),誰(shuí)敢動(dòng)筷子

世錦賽慶功宴!新科冠軍吳宜澤休閑裝亮相 網(wǎng)友:艾倫不來(lái),誰(shuí)敢動(dòng)筷子

畫(huà)夕
2026-05-05 14:38:17
廣州第一爛尾樓 兩千家庭半生遺憾!

廣州第一爛尾樓 兩千家庭半生遺憾!

說(shuō)故事的阿襲
2026-05-05 20:20:30
8.84億的美國(guó)工廠說(shuō)關(guān)就關(guān)?曹德旺:美國(guó)不講理,我就不陪玩了

8.84億的美國(guó)工廠說(shuō)關(guān)就關(guān)?曹德旺:美國(guó)不講理,我就不陪玩了

番外行
2026-05-06 10:29:59
伯納烏大地震!皇馬放話出售姆巴佩,天價(jià)報(bào)價(jià)就接

伯納烏大地震!皇馬放話出售姆巴佩,天價(jià)報(bào)價(jià)就接

奶蓋熊本熊
2026-05-06 00:00:36
《陳翔六點(diǎn)半》人走茶涼,賺不到錢(qián)球球退出,根本原因早就注定了

《陳翔六點(diǎn)半》人走茶涼,賺不到錢(qián)球球退出,根本原因早就注定了

汪巗的創(chuàng)業(yè)之路
2026-05-06 12:26:17
47歲高圓圓在公園被抓拍,麒麟臂、涼拖鞋,活脫脫一個(gè)買(mǎi)菜大姐

47歲高圓圓在公園被抓拍,麒麟臂、涼拖鞋,活脫脫一個(gè)買(mǎi)菜大姐

胖松松與瘦二毛
2026-05-06 12:40:53
張亮兒子17歲當(dāng)?shù)耍。?>
    </a>
        <h3>
      <a href=八卦瘋叔
2026-05-06 11:04:32
連線四川華鎣女游客玩秋千身亡目擊者:其撞到瀑布凸出處大石

連線四川華鎣女游客玩秋千身亡目擊者:其撞到瀑布凸出處大石

南方都市報(bào)
2026-05-06 12:38:05
中美同時(shí)向全球下達(dá)禁令,各國(guó)都傻眼了!美媒:中國(guó)此舉史無(wú)前例

中美同時(shí)向全球下達(dá)禁令,各國(guó)都傻眼了!美媒:中國(guó)此舉史無(wú)前例

福建睿平
2026-05-06 08:56:38
男子和妻子的弟媳纏綿,怕妻子聽(tīng)到聲音,2017年弟媳竟被他捂死了

男子和妻子的弟媳纏綿,怕妻子聽(tīng)到聲音,2017年弟媳竟被他捂死了

漢史趣聞
2026-05-05 11:36:31
2026-05-06 14:55:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專(zhuān)業(yè)的人工智能媒體
12925文章數(shù) 142643關(guān)注度
往期回顧 全部

科技要聞

“馬斯克不懂AI”:OpenAI當(dāng)庭戳老底

頭條要聞

男子購(gòu)百萬(wàn)保險(xiǎn)被邀免費(fèi)游老撾 花數(shù)十萬(wàn)買(mǎi)"熊膽"心虛

頭條要聞

男子購(gòu)百萬(wàn)保險(xiǎn)被邀免費(fèi)游老撾 花數(shù)十萬(wàn)買(mǎi)"熊膽"心虛

體育要聞

活塞1比0騎士:坎寧安不再是一個(gè)人了

娛樂(lè)要聞

神仙友誼!楊紫連續(xù)10年為張一山慶生

財(cái)經(jīng)要聞

人形機(jī)器人七小龍:誰(shuí)真能賣(mài) 誰(shuí)在講故事?

汽車(chē)要聞

領(lǐng)克10/領(lǐng)克10+ 無(wú)論能源形式 領(lǐng)克都要快樂(lè)

態(tài)度原創(chuàng)

家居
教育
親子
本地
軍事航空

家居要聞

大膽前衛(wèi) 時(shí)尚大宅

教育要聞

六條邏輯主線替代四個(gè)大概念,反映了怎樣的理念? | 高中課標(biāo)修訂解讀⑥

親子要聞

52歲王小騫做夢(mèng)也沒(méi)想到,患上矮小癥的女兒,如今竟然迎來(lái)了逆襲

本地新聞

用青花瓷的方式,打開(kāi)西溪濕地

軍事要聞

實(shí)施不到48小時(shí) 特朗普緊急喊停"霍爾木茲自由計(jì)劃"

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版