国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

一行代碼,Claude成本直降85%!最強Opus做大腦,Sonnet瘋狂搬磚

0
分享至


新智元報道

編輯:桃子 好困

【新智元導讀】Anthropic深夜發(fā)布Claude「顧問策略」,讓Opus 4.6退居幕后當軍師,Sonnet/Haiku當苦力。實測性能翻倍,成本暴降85%,全網直呼:這就是我們要的「龍蝦」完全體!

深夜,Anthropic官宣重磅更新:Claude「顧問策略」(Advisor Strategy)上線。

這一架構的核心邏輯是——

讓智商最高的Opus 4.6退居幕后當「顧問」;

讓性價比極高的Sonnet 4.6或Haiku 4.5沖在前面當「執(zhí)行者」。


簡單來說,Opus做「大腦」,Sonnet/Haiku做「手腳」

在全新的工作流中,核心是由Sonnet/Haiku,全權負責跑通整個流程。


當遇到真正棘手的難題、無法做出合理決策時,才會通過API調用Opus「顧問」來指點迷津。

隨后,Opus會迅速審閱上下文,給出一個錦囊妙計、修正方案,然后由執(zhí)行者繼續(xù)完成剩下的「苦差事」。

這一策略的提出,真正反轉了傳統(tǒng)的「大模型拆解任務、小模型搬磚」模式。


結果,實測數據極其震撼。

在SWE-bench編程測試中,「Sonnet 4.6+Opus 4.6」得分提升2.7個百分點,而成本暴降11.9%!

更離譜的是,「Haiku4.5+Opus 4.6」性能直接翻倍,成本($1.07)只有Sonnet($7)的一小部分。

用網友的話來說,「享受Opus的性能,卻無需支付Opus的錢」。




還有人全網奔走相告,Claude「龍蝦」超進化了,一個更好的OpenClaw版本誕生。



可以說,這不只是一次API更新,更是一場徹底的效率革命。

Claude有了「顧問」

最強Opus 4.6幕后指路

一直以來,開發(fā)者在構建AI Agent的過程中,往往面臨一個兩難選擇:

  • 用頂級模型雖聰明,但價格昂貴;

  • 用輕量模型雖便宜,但處理復雜任務時容易「掉鏈子」。

傳統(tǒng)模式的做法是,讓性能最強的LLM坐鎮(zhèn)中央當「編排者」,把大任務拆解成若干子任務,再分發(fā)給更小、更快的模型去執(zhí)行。


這就好比一個項目經理(大模型)在開會,給底下的組員(小模型)分發(fā)不同的工單。

它的局限在于,無論任務簡單還是復雜,頂級模型都必須首先介入拆解。每一條請求的開頭,都要燒掉最貴的Token。

Anthropic這次玩了個「反直覺」的戰(zhàn)術,徹底反轉了「大管小」的邏輯。


「顧問策略」采用了一種更加靈活的向上追溯機制:

  • 執(zhí)行者: 由Sonnet 4.6或Haiku 4.5擔任,負責端到端的任務執(zhí)行、調用工具、讀取結果并持續(xù)迭代;

  • 顧問: 由頂級模型Opus 4.6擔任,潛伏在幕后,并不直接與人對話,也不調用工具。

只有當「執(zhí)行者」遇到無法獨立決策的難題時,它才會主動向「顧問」請教。

Opus會讀取共享的上下文,給出計劃、糾正方案或停止信號,隨后「執(zhí)行者」再帶著這些「應急妙策」繼續(xù)工作。


這種策略,將前沿級的推理能力精準地用在了「刀刃」上。

在SWE-bench測試中,「Sonnet+Opus顧問」提升了2.7個百分點,還將單次Agent任務的成本壓縮了11.9%。


在智能體基準測試中:

  • 智能體搜索任務(BrowseComp),性能漲2.3%,成本6.13美元。

  • 終端編碼任務(Terminal-Bench 2.0),性能漲3.8%,成本0.88美元。


對于預算更敏感的場景,「Haiku 4.5+Opus 4.6顧問」的組合表現更是令人驚艷。

在BrowseComp測試中,其得分從19.7%飆升至41.2%,性能翻倍。

雖然這比Sonnet單獨運行的得分低29%,但其成本卻降低了85%,是處理高并發(fā)任務的極佳方案。

在Terminal-Bench 2.0中,性能暴漲13.3%,成本也降低了0.2美元。


對于那些既需要一定智能水平、又需要控制成本的大規(guī)模批量任務來說,Haiku絕對是個絕佳的選擇。

官博中,Anthropic說的非常直白——

這能讓AI Agent擁有接Opus級別的智能,同時讓token開銷保持在接近Sonnet的水平。

不得不說,簡直太香了!


一行代碼,即可調用

那么,究竟如何上手?


目前,Claude平臺上已上線了「測試版」。

只需在API調用中改寫「一行代碼」,便能用上「顧問策略」,具體來說:

在Messages API請求中聲明advisor_20260301,模型的交接就會在單次/v1/messages請求的內部靜默完成——不需要額外去回傳數據或管理上下文。

「執(zhí)行者」模型會自己決定什么時候搖人。

當它發(fā)起調用時,會把整理好的上下文路由給「顧問」模型,拿到計劃后返回,「執(zhí)行者」接著干活,所有操作都在同一個請求里一氣呵成。

# 顧問消耗的Token會在用量(usage)中單獨列出。

那么,token消耗的這筆賬如何算?

「顧問」消耗的Token按Opus定價,執(zhí)行者消耗的Token按Sonnet或Haiku定價。

關鍵在于,顧問每次出手只生成一份簡短的計劃,通常在400到700個Token左右。

而真正的大頭輸出,全部由執(zhí)行者以更低的費率包攬。

整體算下來,成本遠低于從頭到尾只用Opus。


擔心顧問被「薅」太多次?Anthropic也想到了。

開發(fā)者可以通過設置max_uses,限制單次請求中顧問的最大調用次數。

同時,顧問的Token消耗會在用量信息中單獨列出,方便追蹤每一層模型的開銷。

而且,advisor工具跟你現有的工具棧完全兼容。

它就是Messages API請求里的一個普通條目,沒有任何特殊架構要求。


你的Agent可以在同一個循環(huán)里,一邊搜索網頁、執(zhí)行代碼,一邊向Opus請教。

該搬磚搬磚,該問策問策,互不干擾。

一些用上「顧問策略」的大客戶全都被瞬間驚艷了,EVE機器學習工程師直言——

用上Haiku 4.5+Opus 4.6,成本降低了1/5,還用上了接近Opus級別的智能。


Agent不用一直轉了

后臺腳本守著就行

同在今天,Anthropic為Claude帶來了名為——Monitor的重量級工具更新。

這一功能,直接讓Claude創(chuàng)建并運行「后臺腳本」。


過去,讓Agent監(jiān)控某個任務(比如等CI跑完、等PR審批),它必須不停循環(huán)詢問,每問一次就燒一輪Token。

Monitor讓Claude自己寫一段后臺監(jiān)控代碼。程序報錯了,喚醒。代碼合規(guī)檢查通過了,喚醒。

從「主動輪詢」變成「事件驅動」。


有了Monitor,Claude可以做到兩件事。

  • 持續(xù)盯著系統(tǒng)日志中的錯誤,有問題了才叫Agent過來處理。

  • 自動追蹤GitHub上的PR狀態(tài),腳本在后臺輪詢,Agent本身不消耗Token。

具體用的時候,需在提示詞中明確要求,如Anthropic研究員給出的例子所示。


和Advisor Strategy的邏輯一脈相承,都是在Agent運行中找到「不需要燒錢的環(huán)節(jié)」,然后把它剝離出去。

一個省模型調用的錢,一個省空轉循環(huán)的錢。

但顧問策略和Monitor不是孤立的兩招。

再加上此前剛發(fā)布的Managed Agents,Agent的運維和基建全由Anthropic包辦,0.08美元一小時。

這幾步棋放在一起看,方向就明了了。

Anthropic不再只是一家賣模型API的公司。它在搭一整套Agent運行時平臺,從模型調度到任務執(zhí)行到云端托管,全棧通吃。

你不需要自己養(yǎng)Agent了

Advisor Strategy和Monitor優(yōu)化的是Agent的「跑法」,Managed Agents解決的是更根本的問題,誰來管基建。

0.08美元一個session小時,沙箱隔離、斷線自動恢復、會話可自主跑數小時,Anthropic全包了。

Managed Agents管運行,MCP Connectors管工具接入。

Anthropic的Connectors Directory覆蓋Asana、Notion、Sentry等工具,標準OAuth一鍵接入。

另一邊,4月4日封殺了OpenClaw通過Claude訂閱額度調API的通道,用戶要么換后端,要么按量付費,成本翻倍。

推自家生態(tài),切競品供給,一套組合拳。

HN上有人總結,「核心不是封殺誰,是讓開發(fā)者習慣在Anthropic的平臺上跑Agent。」

從賣模型到賣運行時

Advisor Strategy管調度,Monitor管效率,Managed Agents管基建,MCP Connectors管生態(tài)。四層疊起來,一個完整的Agent平臺。

Anthropic不是在賣聊天機器人,是在賣「你只管說要做什么,剩下的我來」。

而且野心可能不止于軟件。據Reuters本周報道,Anthropic正在探索自研AI芯片,目前仍處于早期階段。

支撐這個野心的數字,年化營收突破300億美元,去年底還是90億。企業(yè)級AI收入對OpenAI的份額已經追到50:50。

這盤棋能不能贏,取決于開發(fā)者愿不愿意把Agent邏輯交給Anthropic的平臺。

Sentry、Notion、Rakuten已經投了票。



彩蛋

Claude到底有多大?這是AI圈最想拆解的黑盒。

馬斯克在對比自家Grok 4.2與Claude時,漫不經心地透露了一個數字——

Claude Sonnet參數量約為1T,Opus高達5T。

對此,有大佬猜測,Claude Mythos體量至少是10T,甚至更大級別。



參考資料:

https://x.com/claudeai/status/2042308622181339453?s=20

https://x.com/noahzweben/status/2042332268450963774?s=20

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
暴跌95%!一代神車退場了,比燃油車賣不掉更可怕的事正在發(fā)生

暴跌95%!一代神車退場了,比燃油車賣不掉更可怕的事正在發(fā)生

毒sir財經
2026-04-10 16:25:00
震驚!做普工都要驗資了,網傳深圳一工廠招工,身價最低300元起

震驚!做普工都要驗資了,網傳深圳一工廠招工,身價最低300元起

火山詩話
2026-04-11 14:54:51
李想在朋友圈飆臟話!疑似炮轟東風日產

李想在朋友圈飆臟話!疑似炮轟東風日產

鞭牛士
2026-04-11 16:34:04
湖南祁東沿路插了百余米的白事支架燈籠,上面印“奠” 下面掛長條幅,當地民政局:已全部拆除

湖南祁東沿路插了百余米的白事支架燈籠,上面印“奠” 下面掛長條幅,當地民政局:已全部拆除

大風新聞
2026-04-11 10:41:08
網傳業(yè)內人士名單:4位奧運冠軍+央視名記在282人群 未辱罵全紅嬋

網傳業(yè)內人士名單:4位奧運冠軍+央視名記在282人群 未辱罵全紅嬋

念洲
2026-04-11 22:07:23
美伊談判開啟,美國釋放重要信號!此前打伊朗決策過程披露,僅萬斯反對,特朗普“全憑直覺”......

美伊談判開啟,美國釋放重要信號!此前打伊朗決策過程披露,僅萬斯反對,特朗普“全憑直覺”......

新民周刊
2026-04-11 18:14:15
導演溫成林突發(fā)心梗,不幸逝世

導演溫成林突發(fā)心梗,不幸逝世

南方都市報
2026-04-11 16:21:07
強制員工自費500元給顧客買禮物 海底撈通報:情況基本屬實

強制員工自費500元給顧客買禮物 海底撈通報:情況基本屬實

閃電新聞
2026-04-11 20:00:17
中國引進最成功的航空發(fā)動機,它的裝備為空軍緩解了30年的壓力

中國引進最成功的航空發(fā)動機,它的裝備為空軍緩解了30年的壓力

小熊侃史
2026-04-10 10:15:23
鄭麗文一聲“毛主席”,打破了國民黨一個禁忌

鄭麗文一聲“毛主席”,打破了國民黨一個禁忌

月明風清1029
2026-04-11 17:27:07
大眾汽車官宣,停產純電車型!

大眾汽車官宣,停產純電車型!

新浪財經
2026-04-11 15:06:14
陳麗華年輕照出烏龍:美女照片主人出來辟謠,真實年輕照像韓紅

陳麗華年輕照出烏龍:美女照片主人出來辟謠,真實年輕照像韓紅

動物奇奇怪怪
2026-04-11 15:25:19
萬茜蹲火了

萬茜蹲火了

動物奇奇怪怪
2026-04-11 17:32:32
官媒發(fā)文!高調官宣50歲撒貝寧喜訊,與李白婚變傳聞早就真相大白

官媒發(fā)文!高調官宣50歲撒貝寧喜訊,與李白婚變傳聞早就真相大白

阿纂看事
2026-04-11 15:55:08
千元童鞋把腳穿腫?泰蘭尼斯遭家長“圍攻”,醫(yī)生警惕影響發(fā)育,90%專利竟是外觀設計

千元童鞋把腳穿腫?泰蘭尼斯遭家長“圍攻”,醫(yī)生警惕影響發(fā)育,90%專利竟是外觀設計

新浪財經
2026-04-10 17:33:59
蘇州小伙娶小7歲俄羅斯美女,洋媳婦熱衷生娃,說至少要生4個

蘇州小伙娶小7歲俄羅斯美女,洋媳婦熱衷生娃,說至少要生4個

不似少年游
2026-04-11 19:41:13
封鎖6周,超2萬海員被困船上:同事死去,不得不與遺體共處一船;物資短缺,有人已出現“精神崩潰”,還有人辭職并拒絕穿越霍爾木茲海峽

封鎖6周,超2萬海員被困船上:同事死去,不得不與遺體共處一船;物資短缺,有人已出現“精神崩潰”,還有人辭職并拒絕穿越霍爾木茲海峽

大風新聞
2026-04-11 12:35:03
殷桃穿紅吊帶裙,這腰臀比是45歲該有的?

殷桃穿紅吊帶裙,這腰臀比是45歲該有的?

娛樂領航家
2026-04-11 21:30:03
新京報力挺陳芋汐:網友質疑,陳芋汐轉賬記錄曝光,評論區(qū)太扎心

新京報力挺陳芋汐:網友質疑,陳芋汐轉賬記錄曝光,評論區(qū)太扎心

眼光很亮
2026-04-11 20:22:50
他竟然轉型成了個“正能量偶像”?

他竟然轉型成了個“正能量偶像”?

BenSir本色說
2026-04-10 22:07:04
2026-04-12 00:07:00
新智元 incentive-icons
新智元
AI產業(yè)主平臺領航智能+時代
14947文章數 66765關注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

體育要聞

換帥之后,他們從降級區(qū)沖到升級區(qū)

娛樂要聞

鄭鈞回應兒子走路:會監(jiān)督他挺直腰板

財經要聞

從日本翻身看:這次誰能扛住高油價?

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

數碼
親子
房產
時尚
公開課

數碼要聞

逆天!英特爾新技術顯存暴降 18 倍,8GB 顯卡秒變頂配,游戲黨狂喜

親子要聞

測試一下兒子的安全意識

房產要聞

土地供應突然暴跌!2026??跇鞘?,格局大變!

普通人穿衣其實很簡單!構造腰線、一衣多穿,大方舒適又自然

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版