国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Claude Opus 4.7深夜炸場!勝任更長任務(wù)、自主檢查,視覺能力拉滿

0
分享至


智東西
編譯 楊京麗
編輯 李水青

智東西4月17日報道,昨天夜間,Anthropic發(fā)布新一代旗艦大模型Claude Opus 4.7。


▲Anthropic發(fā)布新模型Claude Opus 4.7(圖源:X)

該模型在高級軟件工程方面相比Opus 4.6有顯著提升,尤其在處理最復(fù)雜的任務(wù)時提升明顯;高分辨率圖像處理能力大幅提升,是此前Claude模型的3倍以上;此外,Claude Code還同步新增了/ultrareview代碼審查命令,輸入后會啟動審查會話,逐行檢查代碼變更。

用戶反饋稱,他們可以放心地將最難的編碼工作交給Opus 4.7處理。Opus 4.7能夠嚴(yán)謹(jǐn)一致地處理復(fù)雜的長時間運(yùn)行任務(wù),精確遵循指令,并在匯報結(jié)果之前自行驗(yàn)證輸出。

Opus 4.7今日起在所有Claude產(chǎn)品和API、Amazon Bedrock、谷歌云Vertex AI以及Microsoft Foundry上線。定價與Opus 4.6一致:輸入每百萬token 5美元(約合人民幣34元),輸出每百萬token 25美元(約合人民幣170.5元)。開發(fā)者可通過Claude API使用claude-opus-4-7。

不得不說,Claude最近更新實(shí)在是快,大家都跟不上了,網(wǎng)友在Claude的評論區(qū)下面刷起了表情包,“兩眼一睜,Claude又更新了”。


▲網(wǎng)友評論Claude推文(圖源:X)

一、更嚴(yán)格執(zhí)行指令,多模態(tài)支持增強(qiáng)

測試中,Claude Opus 4.7在以下幾個方面表現(xiàn)突出,顯著超越Opus 4.6:

1、指令遵循。Opus 4.7在遵循指令方面有顯著提升。以前的模型會寬松地解讀指令或完全跳過部分內(nèi)容,而Opus 4.7會按字面意思執(zhí)行指令。用戶應(yīng)相應(yīng)地重新調(diào)優(yōu)提示詞和應(yīng)用框架。

2、多模態(tài)支持增強(qiáng)。Opus 4.7對高分辨率圖像的視覺能力更強(qiáng):它可以接受長邊最高2576像素(約375萬像素)的圖像,是此前Claude模型的3倍以上。這為依賴精細(xì)視覺細(xì)節(jié)的多模態(tài)應(yīng)用開辟了廣闊的空間:比如用Agent操作電腦時識別密集的屏幕截圖、從復(fù)雜圖表中提取數(shù)據(jù)、以及需要像素級精度的設(shè)計(jì)工作等。

3、實(shí)際工作。除了在金融Agent評測中取得最優(yōu)成績外,Anthropic內(nèi)部測試顯示Opus 4.7是比Opus 4.6更有效的金融分析師,能產(chǎn)出更嚴(yán)謹(jǐn)?shù)姆治龊湍P汀⒏鼘I(yè)的演示文稿,能做到更緊密地進(jìn)行跨任務(wù)整合。Opus 4.7在金融、法律等領(lǐng)域的第三方經(jīng)濟(jì)價值知識工作評測GDPval-AA上也達(dá)到了最優(yōu)水平。

4、記憶能力。Opus 4.7在使用基于文件系統(tǒng)的記憶方面更強(qiáng)。它能在長時間、多會話的工作中記住重要筆記,并利用這些記憶來推進(jìn)新任務(wù),從而減少對前置上下文的需求。


▲Opus 4.7模型基準(zhǔn)測試表現(xiàn)(圖源:Anthropic)

Opus 4.7獲得了部分早期測試者的積極反饋。財務(wù)軟件公司Intuit技術(shù)副總裁Clarence Huang稱,該模型能在規(guī)劃階段自行發(fā)現(xiàn)邏輯錯誤,執(zhí)行速度也遠(yuǎn)超前代。AI編程工具公司Augment Code的CTO Igor Ostrovsky則認(rèn)為,Opus 4.7的優(yōu)勢在于它能處理好實(shí)際工作中的自動化流程、CI/CD(持續(xù)集成與部署)和長任務(wù)流程,且會主動給出自己的判斷,而非一味附和用戶。

二、多項(xiàng)測評領(lǐng)先,生物推理、文檔推理提升顯著

Anthropic在預(yù)發(fā)布測試中,針對不同領(lǐng)域?qū)pus 4.7進(jìn)行了測評,并對比了Opus 4.6、GPT-5.4和Gemini 3.1 Pro。


生物推理進(jìn)步最為明顯,Opus 4.7得分74.0%,Opus 4.6僅30.9%,提升了1.4倍。


文檔推理方面,Opus 4.7得分80.6%,遠(yuǎn)超Opus 4.6的57.1%,也大幅領(lǐng)先GPT-5.4(51.1%)和Gemini 3.1 Pro(42.9%),是橫評中差距最明顯的項(xiàng)目之一。


另外,知識工作方面,Opus 4.7以1753的Elo分?jǐn)?shù)排名第一,領(lǐng)先明顯,超過GPT-5.4(1674)、Opus 4.6(1619)、Gemini 3.1 Pro(1314)。


長上下文推理方面,在處理較簡單的父節(jié)點(diǎn)查找任務(wù)(Parents 1M)時,Opus 4.7得分75.1%,Opus 4.6為71.1%,差距不大;但處理更難的廣度優(yōu)先搜索任務(wù)(BFS 1M)時,Opus 4.7得分58.6%,Opus4.6僅41.2%,拉開了17個百分點(diǎn)。越難的任務(wù),模型提升效果越明顯。


安全與對齊方面,Anthropic還公布了各模型的錯位行為評分。Opus 4.7的錯位行為得分約為2.47(滿分10分,越低越好),略優(yōu)于Opus 4.6的2.75,但與Mythos Preview的1.78仍有明顯差距。

總體而言,Opus 4.7 的安全性能與 Opus 4.6 相似,其出現(xiàn)欺騙、奉承和與濫用者合作等行為比例較低。Anthropic對此評價:“Opus 4.7總體對齊良好且值得信賴,但行為并非完全理想?!蹦壳?,對齊表現(xiàn)最好的Mythos Preview尚未全面開放。

三、其他更新:新增xhigh等級、審查命令,任務(wù)預(yù)算進(jìn)入公測

除Opus 4.7本身外,Anthropic還同步推出了幾項(xiàng)功能更新。

推理等級方面,新增xhigh(extra high)等級,介于現(xiàn)有的high和max之間,讓用戶在推理深度和響應(yīng)速度之間有更細(xì)的調(diào)節(jié)空間。Claude Code的默認(rèn)推理等級已提升至xhigh。

API方面,任務(wù)預(yù)算功能進(jìn)入公測,開發(fā)者可以引導(dǎo)Claude在長任務(wù)中如何分配token消耗。

Claude Code方面,新增/ultrareview命令,輸入后會啟動一個專門的審查會話,逐行檢查代碼變更,并標(biāo)記Bug和設(shè)計(jì)問題,Pro和Max用戶各贈3次免費(fèi)體驗(yàn)。此外,Auto模式擴(kuò)展至Max用戶,該模式下Claude可自主做出操作決策,減少人工確認(rèn)中斷。

四、當(dāng)心Opus 4.7更費(fèi)token,但生成質(zhì)量更優(yōu)

Opus 4.7是Opus 4.6的直接升級版,但有兩個影響token用量的變化值得注意。

一是文本處理方式有更新,Opus 4.7相同輸入消耗的token最多增加約35%;二是模型在較高推理等級下會進(jìn)行更多思考,尤其在Agent場景的后續(xù)輪次中,Opus 4.7輸出token也會相應(yīng)增多。用戶可以通過調(diào)整推理等級、設(shè)置任務(wù)預(yù)算,或在提示詞中要求更簡潔來控制用量。


從Agent編程評測圖表來看,Opus 4.7在每個推理等級上都以更少的token達(dá)到了更高的得分。例如Opus 4.7在xhigh等級下消耗約10萬token,得分超過70%;而Opus 4.6在max等級下消耗約13萬token,得分才剛過60%。不過,該評測中模型是根據(jù)單一提示自主工作,結(jié)果不一定能代表交互式編程中的實(shí)際token消耗。

結(jié)語:更準(zhǔn)確更全能,競爭對手將至

從Anthropic公布的數(shù)據(jù)來看,Opus 4.7在編程、文檔推理、生物推理等多個基準(zhǔn)上的提升是實(shí)打?qū)嵉?,token效率也有所提升。但測評終歸是測評,實(shí)際表現(xiàn)還需要在真實(shí)場景中進(jìn)一步驗(yàn)證。

隨著Opus 4.7的發(fā)布,OpenAI后續(xù)又會做出哪些新動作,大家期待已久的DeepSeek月底會不會發(fā)布新模型,大模型廠商的競爭可謂是越來越有意思了。

來源:Anthropic

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1991年,22歲的許晴解開衣襟喂奶,導(dǎo)致電影《狂》被封12年

1991年,22歲的許晴解開衣襟喂奶,導(dǎo)致電影《狂》被封12年

她時尚丫
2026-04-12 23:05:31
京東買冰柜容積大縮水!“榮事達(dá)”狂賠6萬元求和,客戶:不需要

京東買冰柜容積大縮水!“榮事達(dá)”狂賠6萬元求和,客戶:不需要

科技Nice
2026-04-15 11:42:18
奧黛麗赫本人生最后30年:在瑞士小鎮(zhèn)一座帶花園的漂亮房子里度過

奧黛麗赫本人生最后30年:在瑞士小鎮(zhèn)一座帶花園的漂亮房子里度過

毒舌小紅帽
2026-04-17 18:24:06
于鳳至去世一年后,張學(xué)良來她墳?zāi)骨?,痛哭道:鳳至,我來晚了

于鳳至去世一年后,張學(xué)良來她墳?zāi)骨?,痛哭道:鳳至,我來晚了

千秋文化
2026-01-23 19:19:38
追覓全球首創(chuàng)仿生機(jī)械臂掃地機(jī),累計(jì)銷量超700萬臺!

追覓全球首創(chuàng)仿生機(jī)械臂掃地機(jī),累計(jì)銷量超700萬臺!

解碼NewSight
2026-04-16 21:59:04
隨著蓉城1-0,津門虎3-0,銅梁龍2-0,泰山1-1,中超最新積分榜出爐

隨著蓉城1-0,津門虎3-0,銅梁龍2-0,泰山1-1,中超最新積分榜出爐

俯身沖頂
2026-04-17 22:17:14
滄州阻擊戰(zhàn),1.3萬雜牌軍七天耗彈140萬發(fā),以強(qiáng)悍重創(chuàng)日軍千余人

滄州阻擊戰(zhàn),1.3萬雜牌軍七天耗彈140萬發(fā),以強(qiáng)悍重創(chuàng)日軍千余人

嘮叨說歷史
2026-03-05 17:12:55
全民考公考編,是這個時代的悲哀。

全民考公考編,是這個時代的悲哀。

老陸不老
2026-04-12 12:19:50
女兒美國讀高中花掉110萬,單親媽媽向社會求助:求捐200萬讀大學(xué)

女兒美國讀高中花掉110萬,單親媽媽向社會求助:求捐200萬讀大學(xué)

談史論天地
2026-04-17 16:50:03
僅剩最后一席!奧沙利文+常冰玉分別打出2桿147分均獲14.7萬榜

僅剩最后一席!奧沙利文+常冰玉分別打出2桿147分均獲14.7萬榜

籃球看比賽
2026-04-17 13:03:46
4月17日俄烏最新:川普開始打方向盤了

4月17日俄烏最新:川普開始打方向盤了

西樓飲月
2026-04-17 18:46:46
特朗普稱伊朗同意不擁有核武器

特朗普稱伊朗同意不擁有核武器

每日經(jīng)濟(jì)新聞
2026-04-17 07:48:51
臺灣地區(qū)前領(lǐng)導(dǎo)人馬英九:我不希望臺灣成為第二個香港!

臺灣地區(qū)前領(lǐng)導(dǎo)人馬英九:我不希望臺灣成為第二個香港!

大魚簡科
2026-04-14 17:11:07
撕破臉!北約多國集體拋棄F-35,背后真相撕開美國軍工遮羞布

撕破臉!北約多國集體拋棄F-35,背后真相撕開美國軍工遮羞布

Ck的蜜糖
2026-04-17 19:37:59
特朗普與教皇公開對峙,引爆MAGA分裂內(nèi)斗升級

特朗普與教皇公開對峙,引爆MAGA分裂內(nèi)斗升級

心靈的觸動a
2026-04-18 01:18:19
我國肝癌高發(fā),茶葉是背后的禍因?醫(yī)生勸告:3種茶才是幫兇

我國肝癌高發(fā),茶葉是背后的禍因?醫(yī)生勸告:3種茶才是幫兇

岐黃傳人孫大夫
2026-04-12 06:30:03
《浪姐7》一公人氣排名,烏蘭圖雅第4,張?jiān)碌?,冠軍評論區(qū)淪陷

《浪姐7》一公人氣排名,烏蘭圖雅第4,張?jiān)碌?,冠軍評論區(qū)淪陷

娛樂圈筆娛君
2026-04-17 18:07:51
“真銅實(shí)料”互嗆升級,海信高管稱格力部分機(jī)型用鋁線電機(jī)

“真銅實(shí)料”互嗆升級,海信高管稱格力部分機(jī)型用鋁線電機(jī)

紅星資本局
2026-04-17 18:26:04
云南鴕鳥肉案兇手被判死刑,當(dāng)?shù)卦嗳速徺I,這些人后來怎樣了

云南鴕鳥肉案兇手被判死刑,當(dāng)?shù)卦嗳速徺I,這些人后來怎樣了

林林故事揭秘
2025-01-03 17:30:21
19日起,連下5天,4月最強(qiáng)降雨大幕拉開!暴雨、大暴雨連成片

19日起,連下5天,4月最強(qiáng)降雨大幕拉開!暴雨、大暴雨連成片

風(fēng)云圈天氣
2026-04-17 23:57:54
2026-04-18 02:51:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11626文章數(shù) 117033關(guān)注度
往期回顧 全部

科技要聞

7家頭部平臺被罰沒35.97億元

頭條要聞

知情人:伊朗為霍爾木茲海峽通行設(shè)定三個條件

頭條要聞

知情人:伊朗為霍爾木茲海峽通行設(shè)定三個條件

體育要聞

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

又快又穩(wěn)的開掛動力! 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

教育
時尚
游戲
房產(chǎn)
本地

教育要聞

別再無效卷了你需要一套不累的學(xué)習(xí)系統(tǒng)!!

今日熱點(diǎn):許光漢否認(rèn)和周子瑜戀情;郝熠然與誠實(shí)一口終止合作……

PS5完全獨(dú)占新作曝光!科樂美為索尼傾力打造

房產(chǎn)要聞

重磅利好!2500個學(xué)位,??跒I江片區(qū),要建九年一貫制學(xué)校!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

無障礙瀏覽 進(jìn)入關(guān)懷版