国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

國產(chǎn)AI路由系統(tǒng)開源逆襲!僅用19%成本達到Gemini-2.5-Pro同性能

0
分享至

Avengers-Pro團隊 投稿
量子位 | 公眾號 QbitAI

頂級大模型性能確實很強,但對于預算不高的用戶來說就是:

你很好但我不配。

雖然大模型的優(yōu)越表現(xiàn)令人矚目,但動輒高昂的使用成本也讓不少用戶望而卻步。

為平衡性能與成本,上海人工智能實驗室科研團隊基于前期技術積累,開源推出了Avengers-Pro多模型調(diào)度路由方案。



該方案集成了8個行業(yè)領先的大模型,并在Human Last Exam、GPQA-diamond、ARC-AGI等6個挑戰(zhàn)性數(shù)據(jù)集上取得了優(yōu)秀成績:

  1. 性能新高:Avengers-Pro的最高性能超越GPT-5-medium 7%,超越Gemini-2.5-Pro 19%。
  2. 極致性價比:Avengers-Pro能以降低27%成本的方式,達到與GPT-5-medium同等的頂級性能;更能以僅19%的成本,獲得Gemini-2.5-Pro同等的性能水平。
  3. 帕累托最優(yōu):相比單個模型,Avengers-Pro在任何給定成本水平下都能實現(xiàn)最高準確率;反之,針對任何指定的準確率目標,也能將成本降至最低,實現(xiàn)了性能-成本平衡的帕累托最優(yōu)解。



來看看是如何做到的。

比GPT-5更強,更便宜

研究背景:大模型的智能調(diào)度路由

如何平衡大模型的性能表現(xiàn)和推理成本是大模型領域的關鍵問題。

在已經(jīng)被優(yōu)化到極致的大模型系統(tǒng)的基礎上進一步提升性價比的挑戰(zhàn)性不言而喻。

為解決這一問題,大模型智能調(diào)度路由應運而生。其核心思想是將不同任務分配給最適合的大模型,以提升模型回復質(zhì)量,同時避免”大炮打蚊子“而產(chǎn)生的資源浪費。

OpenAI在最新推出的GPT-5中,首次在商業(yè)模型中引入的多模型調(diào)度路由機制:

在推理階段,系統(tǒng)會根據(jù)任務特性和用戶需求,動態(tài)切換低成本低性能模型與高成本強推理模型,實現(xiàn)性能與成本的靈活平衡。

這表明GPT-5會通過一個實時的路由器(Router)來動態(tài)決策,可以在保證絕大多數(shù)問題得到高效解答的同時,將復雜、困難的推理任務交給能力更強的模型處理,從而在系統(tǒng)層面實現(xiàn)性能與陳本的最佳平衡。

Avengers-Pro多模型調(diào)度路由方案則是對GPT-5多模型調(diào)度路由機制的進一步拓展。

Avengers-Pro: 兼顧性能與成本,推動降本增效

Avengers-Pro實現(xiàn)了對不同性能與成本的大模型進行統(tǒng)一集成與調(diào)度路由,為性能與成本的權衡提供了一站式解決方案,有效推動了大模型的降本增效。

其核心機制是通過對用戶請求進行嵌入(embedding)和聚類(clustering)分析,動態(tài)匹配并分配最適合的模型來處理不同任務

只需依靠少量用戶請求-答案標簽數(shù)據(jù),Avengers-Pro框架主要包括以下三個核心步驟:

  1. 嵌入 (Embedding): 首先,該框架使用文本嵌入模型將用戶請求轉(zhuǎn)換成高維向量,捕捉其深層語義信息。
  2. 聚類 (Clustering): 接著,該框架將這些語義向量進行聚類,將相似的問題或任務歸為一個團簇。這使得系統(tǒng)能夠理解不同類型任務的共性,例如“物理知識問答”、“網(wǎng)頁制作代碼生成”等。
  3. 評分(Scoring): 該框架會預先在每個聚類所得到的團簇(即每類任務)上評估模型池中所有模型的性能和成本?;谝粋€可調(diào)節(jié)的性能-成本權衡參數(shù)α,系統(tǒng)為每個模型在個團簇上計算一個性能-成本綜合評分。

推理時,Avengers-Pro框架會首先將其歸類到最相關的聚類中,并結(jié)合各模型在該聚類上的性能-成本綜合評分,將請求動態(tài)分配給得分最高的模型。

通過調(diào)整參數(shù)α(范圍在0到1之間),系統(tǒng)可以在追求極致性能(α=1)與極致性價比(α=0)之間靈活切換,滿足不同應用場景下對性能與成本的多樣化需求。

實驗表現(xiàn):Avengers-Pro比GPT-5更強,更便宜

在實驗中,Avengers-Pro集成了來自4個廠家的8個業(yè)界頂尖模型:

  1. OpenAI:GPT-5-chat, GPT-5-medium;
  2. Anthropic:Claude-4.1-opus, Claude-4-sonnet;
  3. Google:Gemini-2.5-pro, Gemini-2.5-flash;
  4. 阿里: Qwen3-235B-A22B-thinking-2507, Qwen3-235B-A22B-2507。

評測場景由6個極具挑戰(zhàn)性的數(shù)據(jù)集組成: GPQA-Diamond, Human’s Last Exam, ARC-AGI, SimpleQA, LiveCodeBench, τ2-bench,覆蓋了代碼生成、科學推理、智能體應用等。

Avengers-Pro的整體性能優(yōu)于任意單一模型。當權衡系數(shù)傾向于追求性能時,Avengers-Pro的平均正確率為0.66。

相比之下,模型池中最強的單一模型GPT-5-medium的平均正確率為0.62。也就是說,Avengers-Pro即使與當前性能最強的單模型對比,仍然實現(xiàn)了7%的性能提升。

Avengers-Pro實現(xiàn)了性能-成本平衡,形成了帕累托前沿。通過靈活調(diào)整性能-成本權衡系數(shù),當Avengers-Pro與GPT-5-medium性能持平時,能夠節(jié)省高達27%的成本。

如果僅需達到GPT-5-medium 90%的性能,成本更是可降至僅37%。

而在追求與Gemini-2.5-Pro相當?shù)男阅軙r,Avengers-Pro甚至只需19%的超低成本即可實現(xiàn)。

并且,Avengers-Pro在任何給定的成本水平上,都能提供最高的準確率;反之,對于任何給定的準確率目標,都能將成本控制在最低。



性能-成本權衡系數(shù)的影響:

對性能-成本平衡系數(shù)的分析顯示,隨著系數(shù)從0逐漸提升到1(追求性能),模型的性能和成本均逐步上升。



模型選擇:

在不同的性能-成本權衡系數(shù)下,Avengers-Pro能夠根據(jù)不同模型的性能成本靈活進行任務分配。

當系數(shù)更傾向于成本時,Qwen族的模型由于其較低的成本會被更多選擇。

而當系數(shù)更傾向于性能時,GPT-5-medium這一性能相對較強的模型會被更多選擇。

在集成了多個大模型后,調(diào)度路由能實現(xiàn)大模型的降本增效:在性能上超越了模型池中最強的單一模型,并且在保證相同性能的情況下,能顯著降低成本。

此外,面對不同的性能與成本權衡需求,可針對不同任務,靈活自動選擇最合適的模型,全面滿足多樣化的應用場景。

Avergers-Pro證明了在當前大模型生態(tài)下,智能調(diào)度路由方案的突出表現(xiàn)和巨大潛力。

智能路由理念也將在未來大模型應用中帶來更多突破與驚喜。

論文地址:https://arxiv.org/abs/2508.12631
GitHub地址:https://github.com/ZhangYiqun018/AvengersPro

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
外交部部長助理劉彬同烏克蘭第一副外長基斯利察舉行中烏外交部政治磋商

外交部部長助理劉彬同烏克蘭第一副外長基斯利察舉行中烏外交部政治磋商

界面新聞
2025-12-18 23:28:57
南京博物院盜賣文物,捐贈后人追查十年遭打碼“證據(jù)”糊弄,失蹤五件國寶還有多少黑幕

南京博物院盜賣文物,捐贈后人追查十年遭打碼“證據(jù)”糊弄,失蹤五件國寶還有多少黑幕

爆角追蹤
2025-12-18 15:36:33
一夜兩場大??!奪冠熱門慘遭3連敗,沈梓捷傷情出爐,北控遭重創(chuàng)

一夜兩場大??!奪冠熱門慘遭3連敗,沈梓捷傷情出爐,北控遭重創(chuàng)

老吳說體育
2025-12-19 00:23:19
炸裂!攜程簽約柬埔寨引發(fā)注銷潮,洪森疑似威脅曝光園區(qū)股東名單

炸裂!攜程簽約柬埔寨引發(fā)注銷潮,洪森疑似威脅曝光園區(qū)股東名單

胡嚴亂語
2025-12-17 20:37:21
南博盜賣國寶級文物!失蹤5件寶藏黑幕重重!新書記能否理舊賬?

南博盜賣國寶級文物!失蹤5件寶藏黑幕重重!新書記能否理舊賬?

大江看潮
2025-12-18 21:39:11
西藥見效快!中國三大運營商為美國解決詐騙電話,攔截率達99%

西藥見效快!中國三大運營商為美國解決詐騙電話,攔截率達99%

垛垛糖
2025-12-18 12:16:13
國企也開始爆雷了!

國企也開始爆雷了!

微微熱評
2025-12-19 00:35:12
國務院安委會辦公室對21個市級政府開展安全生產(chǎn)約談

國務院安委會辦公室對21個市級政府開展安全生產(chǎn)約談

界面新聞
2025-12-18 14:41:59
拿捏新加坡的手段來了,這次真的要給新加坡上強度了。

拿捏新加坡的手段來了,這次真的要給新加坡上強度了。

百態(tài)人間
2025-12-12 16:02:11
江蘇文旅廳調(diào)查南博藏品現(xiàn)身拍賣事件,龐萊臣后人不認可偽作說法

江蘇文旅廳調(diào)查南博藏品現(xiàn)身拍賣事件,龐萊臣后人不認可偽作說法

極目新聞
2025-12-18 14:34:14
杭州剛提新車就撞人后續(xù):疑似被撞銷售不幸身亡,涉事司機麻煩了

杭州剛提新車就撞人后續(xù):疑似被撞銷售不幸身亡,涉事司機麻煩了

漢史趣聞
2025-12-18 11:38:12
南京不少市民反映導航失靈?高德回應:信號干擾源導致定位異常

南京不少市民反映導航失靈?高德回應:信號干擾源導致定位異常

極目新聞
2025-12-18 15:26:27
30歲健美冠軍王昆意外猝死,深扒死因發(fā)現(xiàn),他生前有3個致命習慣

30歲健美冠軍王昆意外猝死,深扒死因發(fā)現(xiàn),他生前有3個致命習慣

法老不說教
2025-12-18 19:20:30
國防部:與柬泰邊境沖突無關,不要主觀臆測

國防部:與柬泰邊境沖突無關,不要主觀臆測

觀察者網(wǎng)
2025-12-18 19:24:05
確認:涉刑案!上海市中心,一西裝男子突然當街下跪:“對不起,我給你跪下了……”

確認:涉刑案!上海市中心,一西裝男子突然當街下跪:“對不起,我給你跪下了……”

環(huán)球網(wǎng)資訊
2025-12-18 19:49:16
公開婚紗照!知名女星宣布將于明年辦婚禮

公開婚紗照!知名女星宣布將于明年辦婚禮

深圳晚報
2025-12-18 16:49:19
國家統(tǒng)計局原局長邱曉華:很多人按揭買的房子,房子的價格已經(jīng)比首付還要低!它給人帶來的心理沖擊是很大的

國家統(tǒng)計局原局長邱曉華:很多人按揭買的房子,房子的價格已經(jīng)比首付還要低!它給人帶來的心理沖擊是很大的

和訊網(wǎng)
2025-12-18 17:46:52
海南封關之后當?shù)鼐W(wǎng)友吐槽物價變貴,油條7塊菠菜32一斤

海南封關之后當?shù)鼐W(wǎng)友吐槽物價變貴,油條7塊菠菜32一斤

映射生活的身影
2025-12-18 22:03:06
海南封關后,西門子能源燃機總裝基地開建

海南封關后,西門子能源燃機總裝基地開建

IT之家
2025-12-18 20:53:09
海南封關,越南是真急了!范明正:明年開始越南要建6-8個自貿(mào)區(qū)

海南封關,越南是真急了!范明正:明年開始越南要建6-8個自貿(mào)區(qū)

青青子衿
2025-12-19 00:43:44
2025-12-19 07:23:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11877文章數(shù) 176339關注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

特朗普命令2028年登月 在月球部署核反應堆

頭條要聞

特朗普命令2028年登月 在月球部署核反應堆

體育要聞

紐約尼克斯,板正的球隊

娛樂要聞

絲芭放大招了!實名舉報鞠婧祎經(jīng)濟犯罪

財經(jīng)要聞

尹艷林:呼吁加快2.5億新市民落戶進程

汽車要聞

在零下30℃的考場里 凡爾賽C5 X和508L拿到了"穩(wěn)"的證明

態(tài)度原創(chuàng)

時尚
藝術
游戲
旅游
軍事航空

陳妍希這婚,離晚了

藝術要聞

李苦禪寫菊,酣暢淋漓

《巫火》仍堅持是單人游戲 沒有升級到虛幻5計劃

旅游要聞

北緯 36° 奇跡!北方最北茶園憑 1 片葉子,讓貧瘠嶺變富民園

軍事要聞

福建艦入列后首過臺海 臺方談為何"甲板上沒有艦載機"

無障礙瀏覽 進入關懷版