国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Claude Opus 4.7 發(fā)布,全網(wǎng)最詳細(xì)解讀

Claude Opus4.7

0
分享至

PRODUCT

我把手上幾個(gè)活都換到 4.7 試了試,比 4.6 好用太多,斷檔的強(qiáng)

剛剛,Anthropic 發(fā)布 Claude Opus 4.7,已經(jīng)在 Claude 的所有產(chǎn)品、API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 上全面可用。模型 id claude-opus-4-7


這是 Opus 4.6 的直接升級版。三條主線:編程能力在最難的任務(wù)上明顯提升、視覺分辨率擴(kuò)大到過去的三倍多、同時(shí)是 Project Glasswing 之后第一個(gè)試驗(yàn)新網(wǎng)絡(luò)安全護(hù)欄的對外模型

定價(jià)完全不變,$5/M 輸入 token,$25/M 輸出 token。相比之下 Mythos Preview 的 API 價(jià)格是 $25/$125 per million,Opus 4.7 便宜 5 倍

Anthropic 官方給出的總體對比圖,Opus 4.7 在多個(gè)基準(zhǔn)上高于 Opus 4.6,但仍然弱于內(nèi)部的 Mythos Preview


Opus 4.7 / Opus 4.6 / GPT-5.4 / Gemini 3.1 Pro / Mythos Preview 橫向?qū)Ρ?/p>

編程是主升級點(diǎn)

Opus 4.7 最顯眼的變化在高難度軟件工程任務(wù)上。用戶反饋里反復(fù)出現(xiàn)兩個(gè)詞:長程、自主

過去必須盯著改的那類代碼活,現(xiàn)在可以放手讓它跑

28 家早期客戶給了反饋,這里挑最硬核的幾個(gè)數(shù)據(jù)點(diǎn)

GitHub:93 個(gè)任務(wù)的編程基準(zhǔn)上,比 Opus 4.6 高 13%,4 個(gè)任務(wù)是 Opus 4.6 和 Sonnet 4.6 都搞不定的

Cursor:CursorBench 過 70%,Opus 4.6 是 58%

Rakuten:Rakuten-SWE-Bench 上解決的生產(chǎn)任務(wù)是 Opus 4.6 的 3 倍

Hex:低 effort 檔的 Opus 4.7 大致等于中 effort 檔的 Opus 4.6

Notion:準(zhǔn)確率提升 14%,token 用得更少,工具調(diào)用錯(cuò)誤減少到 三分之一。第一個(gè)通過 Notion 「隱含需求」測試的模型

Cognition(Devin 的公司):能連貫工作幾個(gè)小時(shí),不會(huì)卡在難題上放棄

Replit、Vercel、Databricks、Warp、Factory、Ramp、CodeRabbit、Qodo、Bolt 等一系列廠商都給出了正面反饋。公告里一個(gè)反復(fù)出現(xiàn)的觀察是:Opus 4.7 減少了無意義的包裝函數(shù)和兜底腳手架,寫的時(shí)候自己發(fā)現(xiàn)問題自己改

XBOW 的視覺敏銳度基準(zhǔn):Opus 4.6 是 54.5%,Opus 4.7 是 98.5%

XBOW 做自動(dòng)化滲透測試,這是這次發(fā)布里最硬的一個(gè)數(shù)據(jù)跳變

Imbue 的案例最極端:Opus 4.7 自主從零構(gòu)建了一個(gè)完整的 Rust TTS 引擎,包括神經(jīng)網(wǎng)絡(luò)模型、SIMD 內(nèi)核、瀏覽器 demo,然后用語音識別器反過來驗(yàn)證自己的輸出是否匹配 Python 參考實(shí)現(xiàn)。代碼庫公開

官方給出的編程基準(zhǔn)圖


編程基準(zhǔn)橫掃

視覺能力是第二大升級

Opus 4.7 能接受的圖片長邊從之前的水平上升到 2,576 像素(約 3.75 兆像素),是此前 Claude 模型的三倍多

這個(gè)能力是模型層的變化,沒有 API 參數(shù)開關(guān)。直接送圖過去就行,需要更高分辨率就不要自己壓縮

順便把 Anthropic 的 Vision 文檔看一下,背景信息在這里:用 base64 或 URL 喂圖,單次請求最多可以傳 600 張(API)或 20 張(claude.ai)。上傳太大(單邊超過 1568 像素或超過約 1600 token 的圖)會(huì)先被服務(wù)端 down-sample。計(jì)價(jià)按 tokens ≈ (width × height) / 750 估算,1 兆像素大約 1334 tokens

能用得上的場景:computer-use agent 讀密集截圖、復(fù)雜圖表里的數(shù)據(jù)抽取、需要像素級對照的工作。XBOW 的數(shù)據(jù)說明這個(gè)升級對 computer-use 是實(shí)質(zhì)的


視覺理解、OCR、計(jì)算機(jī)使用、圖表閱讀多項(xiàng)基準(zhǔn)

安全策略:Mythos 還沒放,先用 Opus 4.7 練手

這次的安全設(shè)計(jì)要配合 Project Glasswing 一起看

上周 Anthropic 聯(lián)合 AWS、蘋果、博通、思科、CrowdStrike、Google、摩根大通、Linux 基金會(huì)、微軟、NVIDIA、Palo Alto Networks 成立了 Project Glasswing。起因是 Anthropic 訓(xùn)出了 Claude Mythos Preview 這個(gè)沒發(fā)布的前沿模型,在挖漏洞方面達(dá)到了超過大多數(shù)安全專家的水平

Mythos Preview 過去幾周已經(jīng)在每一個(gè)主流操作系統(tǒng)和主流瀏覽器里都找出了 0-day 漏洞。有三個(gè)公開案例:

→ OpenBSD 上存活了 27 年 的漏洞,攻擊者可以只靠連接就遠(yuǎn)程崩掉任何一臺(tái)機(jī)器

→ FFmpeg 里的 16 年老洞,自動(dòng)化測試工具跑過同一行代碼五百萬次都沒發(fā)現(xiàn)

→ Linux 內(nèi)核里自主鏈起了幾個(gè)漏洞,把普通用戶權(quán)限升到完全控制

Anthropic 的結(jié)論是,前沿 AI 在代碼漏洞發(fā)現(xiàn)和利用上已經(jīng)進(jìn)入可以比肩頂級安全專家的階段。如果護(hù)欄跟不上,這種能力一旦擴(kuò)散會(huì)非常危險(xiǎn)

Opus 4.7 就是為這個(gè)問題準(zhǔn)備的第一個(gè)對外模型。訓(xùn)練過程中差異性地降低了網(wǎng)絡(luò)安全能力,發(fā)布時(shí)帶上了自動(dòng)檢測和攔截高風(fēng)險(xiǎn)網(wǎng)絡(luò)安全用途請求的護(hù)欄。做合法用途的安全研究員(漏洞研究、滲透測試、紅隊(duì))可以申請加入 Cyber Verification Program

Mythos Preview 不會(huì)廣泛發(fā)布,Anthropic 給 Glasswing 參與方承諾了最高一億美元的使用額度。它的 API 價(jià)格是 $25/$125 每百萬 token,是 Opus 4.7 的 5 倍

Opus 4.7 在網(wǎng)絡(luò)安全能力上弱于 Mythos Preview(訓(xùn)練時(shí)就是這么設(shè)計(jì)的)。這些現(xiàn)實(shí)部署數(shù)據(jù)里學(xué)到的護(hù)欄經(jīng)驗(yàn),會(huì)用來為后面更大范圍放 Mythos 級模型做準(zhǔn)備

對齊評估的總體結(jié)論:Opus 4.7 比 Opus 4.6 和 Sonnet 4.6 好一些,但 Mythos Preview 仍然是 Anthropic 訓(xùn)出來的對齊最好的模型

官方原話是 largely well-aligned and trustworthy, though not fully ideal in its behavior


對齊評估總分,越低越好

誠實(shí)度、抗 prompt injection 上 Opus 4.7 有改進(jìn)。受控物質(zhì)減害建議過于詳細(xì)這類問題上有小幅倒退。完整評估在 Claude Opus 4.7 System Card 里

同步發(fā)布的東西

除了模型本身,這次還有幾項(xiàng)更新

新的 effort 檔位 xhigh。原來的檔位是 low / medium / high / max,這次在 highmax 中間插了一個(gè) xhigh


effort 檔位示意,xhigh 是這次新增

這個(gè)參數(shù)控制的是 Claude 響應(yīng)的 token 花費(fèi)規(guī)模,覆蓋文字回答、工具調(diào)用、extended thinking 全部。Claude Code 里默認(rèn) effort 已經(jīng)拉到 xhigh。官方建議編程和 agentic 場景用 highxhigh 起步

task budgets 公測。API 端新功能,讓開發(fā)者能給 Claude 設(shè)置 token 預(yù)算,讓它在長任務(wù)里自己分配優(yōu)先級。和 effort 參數(shù)一起用更細(xì)

/ultrareview slash 命令。Claude Code 里新增,專門跑一個(gè)獨(dú)立的 review 會(huì)話,把改動(dòng)從頭到尾過一遍,找 bug 和設(shè)計(jì)問題。Pro 和 Max 用戶有 3 次免費(fèi)額度

Auto mode 下放到 Max 用戶。3 月 24 日 Anthropic 先在 Team 計(jì)劃上發(fā)布了這個(gè)模式。機(jī)制是在 --dangerously-skip-permissions 和默認(rèn)每步都問的兩極之間加了一個(gè)中間檔:每次工具調(diào)用前有個(gè)分類器檢查是否有危險(xiǎn)操作(批量刪文件、敏感數(shù)據(jù)外泄、惡意代碼執(zhí)行),安全的直接放行,危險(xiǎn)的攔下來讓 Claude 換方案。這次 Max 用戶也能用

遷移:兩個(gè)變化影響 token 消耗

從 Opus 4.6 升 Opus 4.7 是直接替換,但有兩個(gè)點(diǎn)值得提前規(guī)劃

第一:tokenizer 換了,文本處理方式更好了。代價(jià)是同樣的輸入文本,新 tokenizer 下的 token 數(shù)大約是舊版的 1.0–1.35 倍,取決于內(nèi)容類型

第二:高 effort 檔位下 Opus 4.7 想得更多,尤其是 agentic 場景里靠后的輪次。這帶來更高的硬題可靠性,但也意味著更多的輸出 token

控制 token 使用的方法:調(diào) effort、調(diào) task budgets、提示模型更簡潔。Anthropic 自己的內(nèi)部編程評估上,整體是 token 效率改善的,不同 effort 檔位都更優(yōu),但他們建議用戶在真實(shí)流量上自己量


內(nèi)部編程評估里,不同 effort 檔位都更優(yōu)

還有一個(gè)容易踩的坑:指令跟隨強(qiáng)度大幅提升

意思是,為老模型寫的 prompt 有可能在 Opus 4.7 上產(chǎn)生意料之外的結(jié)果。過去 Claude 會(huì)寬松解讀或者跳過的指令,Opus 4.7 會(huì)嚴(yán)格按字面執(zhí)行。升級的時(shí)候,prompt 和 harness 要重新調(diào)

Anthropic 的遷移指南里還有一條老賬:用 Claude 4.6 或以上模型,thinking: {type: "enabled", budget_tokens: N} 已經(jīng) deprecated,推薦遷到 thinking: {type: "adaptive"}effort 參數(shù)。老的 beta header(effort-2025-11-24、fine-grained-tool-streaming-2025-05-14、interleaved-thinking-2025-05-14)也該刪掉了,這些功能都已經(jīng)正式上線

真實(shí)工作

除了跑分,Anthropic 內(nèi)部測試?yán)?Opus 4.7 在金融分析師任務(wù)上比 Opus 4.6 更有效:更嚴(yán)謹(jǐn)?shù)姆治龊徒!⒏鼘I(yè)的演示、任務(wù)之間的銜接更緊

在第三方評估 GDPval-AA 上,Opus 4.7 拿到 state-of-the-art。這個(gè)評估是 Artificial Analysis 基于 OpenAI 的 GDPval 數(shù)據(jù)集做的,覆蓋 44 個(gè)職業(yè)、9 大行業(yè)的 220 個(gè)真實(shí)經(jīng)濟(jì)價(jià)值任務(wù)。模型需要產(chǎn)出文檔、幻燈片、圖表、電子表格等實(shí)際工作交付物

在 Opus 4.7 之前的榜單上,前三是 GPT-5.4 xhigh(ELO 1677)、Claude Sonnet 4.6 Max(1654)、Claude Opus 4.6 Max(1620)

記憶方面,Opus 4.7 更會(huì)用基于文件系統(tǒng)的記憶。跨多輪、多 session 的長任務(wù)里記得住重要筆記,開新任務(wù)時(shí)需要的前置上下文更少

其他 benchmark

官方博客里還給出了辦公、文檔推理、長上下文、生物、長程一致性等基準(zhǔn)的詳細(xì)數(shù)據(jù)

辦公任務(wù)


文檔推理


長上下文推理


生物


長程一致性


Anthropic 還特別標(biāo)注了 benchmark 上的幾個(gè)細(xì)節(jié)。Terminal-Bench 2.0 用的是 Terminus-2 harness 關(guān)閉 thinking 模式。CyberGym 上 Opus 4.6 的分?jǐn)?shù)從原報(bào)的 66.6 更新到 73.8。SWE-bench Verified / Pro / Multilingual 上做了記憶化篩查,排除可能被模型記住的問題后,Opus 4.7 對 Opus 4.6 的領(lǐng)先仍然成立

和競品對比的時(shí)候,用的是 API 可用的最好版本,GPT-5.4 和 Gemini 3.1 Pro 都是這個(gè)口徑

入口

模型字符串:claude-opus-4-7

Claude 所有產(chǎn)品已經(jīng)切到 Opus 4.7。API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 同步可用

Claude Code 用戶默認(rèn) effort 拉到 xhigh,Pro/Max 有 3 次免費(fèi) /ultrareview,Max 用戶開啟 auto mode

參考材料

微信打不開外鏈,長按復(fù)制 URL 到瀏覽器打開

Opus 4.7 發(fā)布公告

https://www.anthropic.com/news/claude-opus-4-7

Claude Opus 4.7 System Card

https://anthropic.com/claude-opus-4-7-system-card

Claude API 模型總覽

https://platform.claude.com/docs/en/about-claude/models/overview

從 Opus 4.6 遷移到 Opus 4.7 的官方指南

https://platform.claude.com/docs/en/about-claude/models/migration-guide#migrating-to-claude-opus-4-7

Effort 參數(shù)文檔

https://platform.claude.com/docs/en/build-with-claude/effort

高分辨率 Vision 能力文檔

https://platform.claude.com/docs/en/build-with-claude/vision

Claude Code slash 命令文檔(含 /ultrareview)

https://code.claude.com/docs/en/commands

Auto mode 發(fā)布說明

https://claude.com/blog/auto-mode

Project Glasswing 發(fā)布公告

https://www.anthropic.com/glasswing

Cyber Verification Program 申請入口

https://claude.com/form/cyber-use-case

GDPval-AA 榜單

https://artificialanalysis.ai/evaluations/gdpval-aa

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
56歲的王菲現(xiàn)身西藏,打扮的很高級,不愧是經(jīng)常拜佛的人

56歲的王菲現(xiàn)身西藏,打扮的很高級,不愧是經(jīng)常拜佛的人

鄉(xiāng)野小珥
2026-04-11 01:30:53
慎咬筆頭!日本商家把活體寄生蟲做成圓珠筆,蟲子還在筆里游…

慎咬筆頭!日本商家把活體寄生蟲做成圓珠筆,蟲子還在筆里游…

最黑科技
2026-04-17 21:27:38
無錫機(jī)器人交警上路執(zhí)勤 當(dāng)?shù)亟还埽涸圏c(diǎn)投入兩臺(tái),身高1.75米,單次充滿電可工作5小時(shí)

無錫機(jī)器人交警上路執(zhí)勤 當(dāng)?shù)亟还埽涸圏c(diǎn)投入兩臺(tái),身高1.75米,單次充滿電可工作5小時(shí)

紅星新聞
2026-04-17 17:07:58
公職人員注意:朋友圈發(fā)這3種內(nèi)容可能直接引來紀(jì)委調(diào)查

公職人員注意:朋友圈發(fā)這3種內(nèi)容可能直接引來紀(jì)委調(diào)查

細(xì)說職場
2026-04-17 17:06:13
“富人才不會(huì)把女兒養(yǎng)這么胖”,家長曬女兒喝60元礦泉水,被群嘲

“富人才不會(huì)把女兒養(yǎng)這么胖”,家長曬女兒喝60元礦泉水,被群嘲

妍妍教育日記
2026-04-16 10:25:09
隨著朝鮮0-1,U20女足亞洲杯冠亞軍浮出水面,中國女足無緣加冕

隨著朝鮮0-1,U20女足亞洲杯冠亞軍浮出水面,中國女足無緣加冕

側(cè)身凌空斬
2026-04-18 20:56:10
CBA一夜再爆2冷!山西、遼寧嚴(yán)重翻車,鬼才杜鋒把廣東送進(jìn)附加賽

CBA一夜再爆2冷!山西、遼寧嚴(yán)重翻車,鬼才杜鋒把廣東送進(jìn)附加賽

后仰大風(fēng)車
2026-04-18 22:30:15
不許中國買伊朗石油,不到24小時(shí),伊外長致電中國,中方斬釘截鐵

不許中國買伊朗石油,不到24小時(shí),伊外長致電中國,中方斬釘截鐵

軍機(jī)Talk
2026-04-17 18:44:06
“臺(tái)球皇帝”亨德利鄭重表態(tài):趙心童世錦賽衛(wèi)冕無需被克魯斯堡魔咒束縛

“臺(tái)球皇帝”亨德利鄭重表態(tài):趙心童世錦賽衛(wèi)冕無需被克魯斯堡魔咒束縛

海闊山遙YAO
2026-04-19 00:38:33
剛剛,“蘇超”積分榜更新!今晚共有90387人到場觀賽

剛剛,“蘇超”積分榜更新!今晚共有90387人到場觀賽

揚(yáng)子晚報(bào)
2026-04-18 22:19:03
蘇林剛夸完復(fù)興號,后腳越南列車就著火:越南高鐵到底差在哪?

蘇林剛夸完復(fù)興號,后腳越南列車就著火:越南高鐵到底差在哪?

芳芳?xì)v史燴
2026-04-18 17:40:21
局地陣風(fēng)可達(dá)10級以上,北京2區(qū)發(fā)布大風(fēng)黃色預(yù)警

局地陣風(fēng)可達(dá)10級以上,北京2區(qū)發(fā)布大風(fēng)黃色預(yù)警

北青網(wǎng)-北京青年報(bào)
2026-04-18 17:20:20
江青書信曝光!鋼筆字竟暗藏驚人秘密,書法之爭誰勝出?

江青書信曝光!鋼筆字竟暗藏驚人秘密,書法之爭誰勝出?

書畫相約
2026-04-14 07:21:03
特朗普“帶全家”來訪華,兒子兒媳齊上陣,要一起見證歷史性時(shí)刻

特朗普“帶全家”來訪華,兒子兒媳齊上陣,要一起見證歷史性時(shí)刻

南宗歷史
2026-04-17 14:08:22
60歲的郭富城在香港銅鑼灣街邊被撞見,染著一頭黃發(fā),腳蹬帆布鞋

60歲的郭富城在香港銅鑼灣街邊被撞見,染著一頭黃發(fā),腳蹬帆布鞋

可樂談情感
2026-04-18 00:18:37
Claude Design連夜突襲,F(xiàn)igma市值瞬間蒸發(fā)!或搶走全球UI設(shè)計(jì)師飯碗

Claude Design連夜突襲,F(xiàn)igma市值瞬間蒸發(fā)!或搶走全球UI設(shè)計(jì)師飯碗

新智元
2026-04-18 12:55:26
國內(nèi)暴跌35%,全球大跌19.1%,為什么大家都不買小米手機(jī)了?

國內(nèi)暴跌35%,全球大跌19.1%,為什么大家都不買小米手機(jī)了?

科技松鼠
2026-04-16 16:00:08
日本那艘軍艦在海峽里被“押送”了14個(gè)小時(shí),我看著都替他們難受

日本那艘軍艦在海峽里被“押送”了14個(gè)小時(shí),我看著都替他們難受

荷蘭豆愛健康
2026-04-18 14:50:22
別再尬演“萬人迷”!滿臉褶子疙瘩、鼻孔朝天,這皮囊能迷倒誰?

別再尬演“萬人迷”!滿臉褶子疙瘩、鼻孔朝天,這皮囊能迷倒誰?

雨月海星
2026-04-18 05:25:40
宇宙第一行潰敗,3707億凈利遮不住的貪腐、罰單與用戶憤怒

宇宙第一行潰敗,3707億凈利遮不住的貪腐、罰單與用戶憤怒

磐石之心
2026-04-18 13:05:11
2026-04-19 01:35:00
賽博禪心
賽博禪心
拜AI古佛,修賽博禪心
389文章數(shù) 50關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

伊朗革命衛(wèi)隊(duì)向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

頭條要聞

伊朗革命衛(wèi)隊(duì)向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

體育要聞

時(shí)隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細(xì)節(jié)

財(cái)經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬元起

態(tài)度原創(chuàng)

教育
藝術(shù)
手機(jī)
健康
軍事航空

教育要聞

成都英才領(lǐng)辦的新學(xué)校來了,今年小學(xué)招生,明年開初一!

藝術(shù)要聞

波蘭美女奧拉·卡茲馬雷克,絕美風(fēng)情讓人驚艷!

手機(jī)要聞

榮耀600系列參數(shù)、外觀全曝光

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

軍事要聞

解放軍護(hù)衛(wèi)艦與外艦纏斗20小時(shí) 細(xì)節(jié)披露

無障礙瀏覽 進(jìn)入關(guān)懷版