国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Manus都點(diǎn)贊的Claude 4,究竟好在哪兒?

0
分享至

目睹完今天 Claude 4 的發(fā)布會(huì)全程,我只看到了一句話 ——大模型正在范式轉(zhuǎn)變, AI智能體時(shí)代真的來(lái)了。

AI 編程的唯一真神 Claude 3.7 Sonnet,終于被 Antrhopic 的下一代 AI 大模型——Claude Opus 4 和 Claude Sonnet 4 徹底淘汰掉了。各國(guó)網(wǎng)友對(duì)此有非常直觀的感受,比如有人在一手實(shí)測(cè)中瘋狂夸贊 Claude 4:「它一下子就能寫(xiě)出 8000 行代碼」。

除了 Claude 4 的推出之外,他們還順手給了幾個(gè)新智能體時(shí)代的功能拓展。

我們先從大模型講起。

01

Claude 4 瞄準(zhǔn)了 AI 智能體編程

這次,他們推出的 Claude Opus 4 和 Claude Sonnet 4 這兩款模型都是混合模型:及時(shí)響應(yīng)與深度思考并重。

可見(jiàn),混合思考架構(gòu)已然成為未來(lái)大模型的趨勢(shì),用戶需要在簡(jiǎn)單的需求下獲得更快的回復(fù),在復(fù)雜要求中獲得更好的生成結(jié)果。兩款模型在性能、功能和應(yīng)用場(chǎng)景上有了顯著提升,價(jià)格卻與之前的 Opus 和 Sonnet 模型保持一致,內(nèi)部?jī)?yōu)化做得很好。

先從評(píng)分開(kāi)始看起。Claude 4 模型在用于評(píng)估真實(shí)軟件工程任務(wù)性能的 SWE-bench Verified 基準(zhǔn)上堪稱(chēng)「遙遙領(lǐng)先」。值得一提的是,在本次評(píng)分對(duì)比中,Claude 4 特意被拉來(lái)與 OpenAI 前幾天剛剛高調(diào)發(fā)布的「最強(qiáng) AI 編程智能體 Codex-1」進(jìn)行正面較量。

Claude Opus 4 在編碼、研究、寫(xiě)作和科學(xué)發(fā)現(xiàn)等人類(lèi)復(fù)雜性高的任務(wù)方向,拓展了邊界。比如,在編碼領(lǐng)域它被 Cursor 稱(chēng)為頂尖技術(shù),顯著提升復(fù)雜代碼庫(kù)的理解能力,適合處理復(fù)雜的編程任務(wù)。Cognition則強(qiáng)調(diào)Opus 4已經(jīng)能夠解決其他模型無(wú)法應(yīng)對(duì)的復(fù)雜任務(wù)。

Claude Sonnet 4 將“天賦”融入日常使用場(chǎng)景,這款均衡型模型在內(nèi)部和外部應(yīng)用中兼顧了性能與效率,雖在多數(shù)領(lǐng)域不及 Opus 4,但提供了能力與實(shí)用性的最佳結(jié)合。它非常適合需要自主性的場(chǎng)景。iGent 的報(bào)告指出,Sonnet 4 在自主開(kāi)發(fā)多功能應(yīng)用方面表現(xiàn)驚艷,錯(cuò)誤率幾從 20% 驟降至幾乎為零。

在下面這張綜合基準(zhǔn)測(cè)試評(píng)分表中,Claude 4 與其他市場(chǎng)主流大模型在編程、推理、多模態(tài)能力、智能體任務(wù)方面都拉開(kāi)了一定差距。

有趣的一點(diǎn)是,Anthropic 將最左側(cè)的數(shù)個(gè)基準(zhǔn)測(cè)試名稱(chēng)中都加入了「Agentic」。

2025 是 AI 智能體時(shí)代這一說(shuō)法,再次被確認(rèn)。

在 Anthropic 的官方發(fā)布中,有很大的篇幅著重介紹了 Claude 4 系列在「復(fù)雜項(xiàng)目」構(gòu)建中的震撼級(jí)能力。其中,官方著重引用了 Github Copilot、iGent,甚至是 Manus 等平臺(tái)的反饋。日本一家名叫樂(lè)天得企業(yè),甚至讓Claude Opus 4獨(dú)立編程7h,團(tuán)隊(duì)自己都有些驚訝。

前段時(shí)間剛一問(wèn)世就被網(wǎng)絡(luò)平臺(tái)譽(yù)為「上帝之手」的 Manus 則在報(bào)告中大贊 Claude Sonnet 4,稱(chēng)它復(fù)雜指令遵循能力和輸出的美觀度非常高。

可以預(yù)見(jiàn)的是,目前智能體賽道的各個(gè)選手將會(huì)第一時(shí)間集成 Claude 4,因?yàn)樗鄬?duì)于之前的 Claude 模型在智能體任務(wù)中有了太多的改進(jìn)。

比如:

1. Opus 4 和 Sonnet 4 不再像 Sonnet 3.7 那樣愛(ài)走捷徑和漏洞了,這種不正常的行為發(fā)生率直接降低了 65%。

2. Opus 4 也迅速跟進(jìn)了「記憶增強(qiáng)」,現(xiàn)在它可以更好地執(zhí)行長(zhǎng)期任務(wù)了。

3. 使用小型模型壓縮冗長(zhǎng)的思考過(guò)程,自己去做思考摘要。

圖注:Claude Opus 4 在玩《寶可夢(mèng)時(shí)》自主記錄筆記。

02

Claude 4 其實(shí)是 LLM + Agent 的混合體?

除了 Claude 4 發(fā)布之外,整場(chǎng)發(fā)布會(huì)的另一個(gè)側(cè)重點(diǎn)是:Claude 代碼已經(jīng)發(fā)布。用戶已經(jīng)能夠通過(guò)終端、IDE (VS Code 和 JetBrains)及通過(guò) Claude 代碼 SDK 后臺(tái)將 Claude 融入開(kāi)發(fā)流程。用戶可以在終端中直接利用 Claude,瞬間搜索百萬(wàn)行代碼庫(kù)。

在官方介紹中,Claude Code搭載 Claude Opus 4,可以通過(guò)智能體搜索全面理解代碼庫(kù),無(wú)需手動(dòng)選擇上下文即可協(xié)調(diào)多個(gè)文件更改,無(wú)縫融入工作流,直接運(yùn)行于終端。

只需在 IDE 終端運(yùn)行 Claude 代碼即可安裝,可擴(kuò)展的 Claude 代碼 SDK 還能讓用戶輕松「打造自定義智能體和應(yīng)用」。Anthropic 給想要構(gòu)建智能體的用戶們又打上了一劑強(qiáng)心針。

Anthropic 還發(fā)布了幾個(gè)面向智能體的新功能:代碼執(zhí)行工具、MCP 連接器、文件 API,以及最多可緩存一小時(shí)提示詞的能力,讓 Claude 4 幾乎成為了智能體專(zhuān)精模型。在我看來(lái),這就是 Anthropic 在 AI 下半程「智能體入口爭(zhēng)奪戰(zhàn)」中的大動(dòng)作。允許模型將推理與外部資源結(jié)合的設(shè)計(jì),使 Claude 4 架構(gòu)更像是一個(gè) LLM+Agent 的混合體。

可以這么說(shuō),整場(chǎng)發(fā)布會(huì)看下來(lái),Claude 4 幾乎是將自己確立為「AI 智能體時(shí)代」最能用也是最好用的大模型。

除了技術(shù)側(cè)內(nèi)容,Anthropic 在安全上的操作一直都非常令人「印象深刻」,封號(hào)封的各個(gè)社區(qū)怨聲載道。官方這回依舊強(qiáng)調(diào)了這些模型都經(jīng)過(guò)了廣泛的測(cè)試和評(píng)估,比如他們用了ASL-3 安全分類(lèi),在這個(gè)風(fēng)險(xiǎn)標(biāo)準(zhǔn)下:「AI 系統(tǒng)具有顯著增加災(zāi)難性濫用風(fēng)險(xiǎn)」。

他們還是沿襲了Anthropic的標(biāo)志性安全策略——“憲法AI”(Constitutional AI)。該方法為模型嵌入了一套“憲法”原則,通過(guò)額外的AI模型對(duì)用戶的輸入和模型的輸出進(jìn)行再度掃描,檢查是否有「壞」的內(nèi)容,決定是否放行。這回,Anthropic放出來(lái)的模型卡PDF中足足有123頁(yè),其中大部分仍然是在專(zhuān)注于AI安全的測(cè)試。

比如,Anthropic決定根據(jù) AI 安全級(jí)別 3 標(biāo)準(zhǔn)發(fā)布 Claude Opus 4,根據(jù) AI 安全級(jí)別 2 標(biāo)準(zhǔn)發(fā)布 Claude Sonnet 4,分級(jí)分的非常精準(zhǔn)。

但是,現(xiàn)在的外網(wǎng)針對(duì) Claude 4「過(guò)于高」的安全措施的討論,幾乎亂成了一鍋粥。因?yàn)橛芯W(wǎng)友似乎基于Claude給出的系統(tǒng)卡文件爆料:Claude 4 會(huì)檢測(cè)用戶內(nèi)容,并自主「報(bào)警」……

雖然暫無(wú)法確定這些爆料是否真實(shí),但也確實(shí)反映了大家認(rèn)為 Claude 4 的安全措施真的太過(guò)于嚴(yán)格了,甚至到了可能影響用戶體驗(yàn)或功能性的地步。畢竟,國(guó)內(nèi)的Claude使用者已經(jīng)流行起了「打一槍?zhuān)瑩Q一個(gè)地」的使用策略。

03

Claude 4 在實(shí)測(cè)中全面提升

目前各個(gè)社區(qū)、各個(gè)國(guó)家的網(wǎng)友全部在瘋狂測(cè)試這款即將取代 Claude 3.7 Sonnet 的大模型。為了支撐智能體中常常需要的長(zhǎng)序列復(fù)雜處理任務(wù),具有美感輸出能力且超強(qiáng)的 AI 編程能力的大模型仍然是極度稀缺的。Claude 4 系列只是看前方無(wú)人在,順勢(shì)補(bǔ)缺而已。

那么說(shuō)到底,Claude 4 面對(duì)復(fù)雜性任務(wù),表現(xiàn)到底有多超綱?

下面來(lái)看看全網(wǎng)實(shí)測(cè)案例:

Claude 4 與 Blender MCP 的連接,讓產(chǎn)品 3D 模型設(shè)計(jì)幾乎有了質(zhì)的飛躍。像是有網(wǎng)友使用 Claude 4 和 Blender 通過(guò) MCP 聯(lián)動(dòng)制作了日本清水寺的 3D 模型。這回的 Claude 4 相比于前代 Claude 3.7,編程時(shí)間大幅減少,全程無(wú)需「人類(lèi)陪伴」,AI 的幻覺(jué)發(fā)生率也下降了很多。

甚至還有網(wǎng)友使用 Claude Opus 4 制作了類(lèi)似 Bemani 2DX 風(fēng)格的游戲。不僅重現(xiàn)了經(jīng)典的音樂(lè)游戲體驗(yàn),還融入了許多創(chuàng)新元素,提升了游戲的可玩性和趣味性。

Claude 4 在面對(duì)復(fù)雜任務(wù)的處理上十分得心應(yīng)手。比如有網(wǎng)友輸入提示詞:用立體相機(jī)拍攝物體,推測(cè) 3D 空間坐標(biāo),并通過(guò)交互式可視化展示,并支持拖動(dòng)。

除了硬核編程能力的提升之外,Claude 4 在設(shè)計(jì)感上正如 Manus 所說(shuō),有了很大的美學(xué)提升。很多網(wǎng)友曾在各個(gè)社區(qū)評(píng)論下笑稱(chēng):各個(gè)智能體什么小游戲都能做,但是沒(méi)見(jiàn)過(guò)做 PPT 的。

一位外網(wǎng)網(wǎng)友就試著讓 Claude 4 制作說(shuō)明幻燈片,呈現(xiàn)出來(lái)的效果非常具有設(shè)計(jì)感,整體要素也更加簡(jiǎn)潔。

在美學(xué)的提升方面,這有個(gè)更直觀的 Case。一位網(wǎng)友只給了 Claude Opus 4 一小段提示詞:“將書(shū)籍 《Piranesi》作為 p5js 3d 空間,do it for me”,沒(méi)有摻雜任何其他元素。

Claude Opus 4 甚至在初版原型中加入鳥(niǎo)、光照、水面等元素,雖然效果還比較基礎(chǔ),但仍能反應(yīng)這款旗艦?zāi)P偷男阅堋?/p>

目前,大量的 AI 編程平臺(tái)(像是 Cursor、Trae、WindsurfVapi、Codegen)、智能體產(chǎn)品(像是 Flowith)內(nèi)幾乎都迅速接入了 Claude 4 系列,畢竟它可能是能進(jìn)一步提升智能體表現(xiàn)的重要模型。

Anthropic 由于一直以來(lái)專(zhuān)注于安全頂層設(shè)計(jì),而常常被認(rèn)為「他們還沒(méi)有找到一個(gè)合適的 AI 入口,只能當(dāng)個(gè)掃地神僧,甚至沒(méi)有辦法參加到最高級(jí)別的公開(kāi)賽場(chǎng)之中」。

當(dāng) Claude 4 系列模型發(fā)布,以及其他像是代碼執(zhí)行器、MCP 連接器、Claude 代碼等等面向智能體產(chǎn)品的功能模塊推出,Anthropic 可以說(shuō)已經(jīng)拿到了一個(gè)非常好的「智能體入口」,正式站到了頂級(jí)賽場(chǎng)。

從 Anthropic 去年推出 MCP 協(xié)議以來(lái),再到 Claude 4 的出現(xiàn),他們已經(jīng)在事實(shí)上為 AI 智能體時(shí)代按下了「加速鍵」。Anthropic 的 CEO——Dario Amodei 為整個(gè) AI 大模型賽道明確了一個(gè)未來(lái)的方向:真正優(yōu)秀的 AI 大模型,一定是「大模型」與「智能體」的深度融合 —— 它能編程、能思考,還能自主解決復(fù)雜問(wèn)題,甚至具備了美學(xué)與設(shè)計(jì)感。

AI 的下半場(chǎng)早已經(jīng)開(kāi)啟,Claude 4 正在引領(lǐng)一場(chǎng)新的「 AI 大模型+智能體」范式轉(zhuǎn)變。

歡迎在評(píng)論區(qū)留言~
如需開(kāi)白請(qǐng)加小編微信:dongfangmark

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗,進(jìn)入倒計(jì)時(shí)

伊朗,進(jìn)入倒計(jì)時(shí)

難得君
2026-01-10 08:24:21
山西2人接受紀(jì)律審查和監(jiān)察調(diào)查!

山西2人接受紀(jì)律審查和監(jiān)察調(diào)查!

晉城關(guān)注暢緣
2026-01-10 12:09:46
新華社消息|中央宣傳部、公安部聯(lián)合發(fā)布2025年“最美基層民警”

新華社消息|中央宣傳部、公安部聯(lián)合發(fā)布2025年“最美基層民警”

新華社
2026-01-09 20:09:29
莫拉:接到三鎮(zhèn)邀請(qǐng)時(shí)第一反應(yīng)非常驚訝;我的風(fēng)格是追求進(jìn)攻

莫拉:接到三鎮(zhèn)邀請(qǐng)時(shí)第一反應(yīng)非常驚訝;我的風(fēng)格是追求進(jìn)攻

懂球帝
2026-01-10 13:37:05
中領(lǐng)館提醒中國(guó)公民注意遵守越南外匯管理新規(guī)

中領(lǐng)館提醒中國(guó)公民注意遵守越南外匯管理新規(guī)

界面新聞
2026-01-09 18:41:27
毛岸英遺體不能回國(guó),劉思齊哭著問(wèn)原因,毛主席:留在朝鮮很重要

毛岸英遺體不能回國(guó),劉思齊哭著問(wèn)原因,毛主席:留在朝鮮很重要

歷史龍?jiān)w
2026-01-09 14:45:06
時(shí)隔312天助攻再度上雙!庫(kù)里27+10+6三分提前打卡 37歲仍巔峰

時(shí)隔312天助攻再度上雙!庫(kù)里27+10+6三分提前打卡 37歲仍巔峰

顏小白的籃球夢(mèng)
2026-01-10 13:11:31
中國(guó)向全世界曝光:美國(guó)4400顆衛(wèi)星,圍堵中國(guó)空間站,這是要干啥

中國(guó)向全世界曝光:美國(guó)4400顆衛(wèi)星,圍堵中國(guó)空間站,這是要干啥

趣文說(shuō)娛
2026-01-08 18:49:48
佩特羅:“特朗普對(duì)我說(shuō)已在策劃軍事行動(dòng)”

佩特羅:“特朗普對(duì)我說(shuō)已在策劃軍事行動(dòng)”

環(huán)球時(shí)報(bào)國(guó)際
2026-01-09 23:53:19
馬斯克預(yù)言再成真,特斯拉FSD重大突破

馬斯克預(yù)言再成真,特斯拉FSD重大突破

電動(dòng)知家
2026-01-10 11:11:56
1945年重慶酒局,毛主席偶遇江青前夫,握手時(shí)說(shuō)了3個(gè)字,讓張治中冷汗直流

1945年重慶酒局,毛主席偶遇江青前夫,握手時(shí)說(shuō)了3個(gè)字,讓張治中冷汗直流

歷史回憶室
2026-01-05 11:05:14
沈伯洋禍害全家!家族海內(nèi)外資產(chǎn)被凍結(jié),面臨破產(chǎn);子女留學(xué)被拒

沈伯洋禍害全家!家族海內(nèi)外資產(chǎn)被凍結(jié),面臨破產(chǎn);子女留學(xué)被拒

可樂(lè)愛(ài)微笑
2026-01-09 19:45:04
特朗普放話“中俄怕美國(guó)”,馬斯克預(yù)測(cè)了中美博弈,普京另有想法

特朗普放話“中俄怕美國(guó)”,馬斯克預(yù)測(cè)了中美博弈,普京另有想法

零洛浮華
2026-01-10 12:23:56
鑿開(kāi)墻壁,掉出來(lái)600多斤橡果。啄木鳥(niǎo):天塌了!

鑿開(kāi)墻壁,掉出來(lái)600多斤橡果。啄木鳥(niǎo):天塌了!

科普中國(guó)
2026-01-09 12:54:13
這反轉(zhuǎn)驚掉下巴!當(dāng)初要整蔡正元的檢察官陳舒怡,覺(jué)都睡不踏實(shí)了

這反轉(zhuǎn)驚掉下巴!當(dāng)初要整蔡正元的檢察官陳舒怡,覺(jué)都睡不踏實(shí)了

扶蘇聊歷史
2026-01-10 12:05:03
比固態(tài)電池更實(shí)用,吉利電車(chē)開(kāi)始“不用充電”了

比固態(tài)電池更實(shí)用,吉利電車(chē)開(kāi)始“不用充電”了

華庭講美食
2026-01-09 08:36:00
鮑威爾交易迎來(lái)反轉(zhuǎn)?近4戰(zhàn)場(chǎng)均18+5,三分15中11,小卡迎來(lái)絕配

鮑威爾交易迎來(lái)反轉(zhuǎn)?近4戰(zhàn)場(chǎng)均18+5,三分15中11,小卡迎來(lái)絕配

你的籃球頻道
2026-01-10 12:04:26
傳拼多多三倍薪資征集春節(jié)加班員工,研發(fā)崗一天1萬(wàn)5……

傳拼多多三倍薪資征集春節(jié)加班員工,研發(fā)崗一天1萬(wàn)5……

柴狗夫斯基
2026-01-09 10:25:20
多哈賽1月10日:國(guó)乒5場(chǎng)比賽,直播頻道有變,陳幸同夜戰(zhàn)張本美和

多哈賽1月10日:國(guó)乒5場(chǎng)比賽,直播頻道有變,陳幸同夜戰(zhàn)張本美和

體育大學(xué)僧
2026-01-10 10:20:57
俄媒:一旦開(kāi)戰(zhàn),中方只靠解放軍難以取勝,必須調(diào)動(dòng)另一股力量!

俄媒:一旦開(kāi)戰(zhàn),中方只靠解放軍難以取勝,必須調(diào)動(dòng)另一股力量!

boss外傳
2026-01-09 14:00:03
2026-01-10 15:04:49
直面派 incentive-icons
直面派
講述值得講述的真實(shí)故事
244文章數(shù) 236關(guān)注度
往期回顧 全部

科技要聞

傳DeepSeek準(zhǔn)備第二次震驚全世界

頭條要聞

媒體:中國(guó)若在其任期統(tǒng)一特朗普不悅 中方回應(yīng)滴水不漏

頭條要聞

媒體:中國(guó)若在其任期統(tǒng)一特朗普不悅 中方回應(yīng)滴水不漏

體育要聞

怒摔水瓶!杜蘭特30+12 難阻火箭遭雙殺

娛樂(lè)要聞

趙櫻子稱(chēng)和蔣毅試婚三天:像試面膜

財(cái)經(jīng)要聞

投資必看!瑞銀李萌給出3大核心配置建議

汽車(chē)要聞

寶馬25年全球銷(xiāo)量246.3萬(wàn)臺(tái) 中國(guó)仍是第一大市場(chǎng)

態(tài)度原創(chuàng)

旅游
教育
時(shí)尚
親子
軍事航空

旅游要聞

重慶豐都南天湖:日照金山 雪映朝暉

教育要聞

不可思議,中國(guó)數(shù)學(xué),中國(guó)歷史,文化斷層,文化入侵

專(zhuān)欄 |?做“主語(yǔ)”的體驗(yàn)

親子要聞

大寶抵觸二寶?二胎家庭,父母如何避免給孩子造成心理創(chuàng)傷?

軍事要聞

特朗普:已開(kāi)始從委石油資源中賺錢(qián)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版