国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

剛剛,Claude Opus 4.6 和 GPT-5.3-Codex 同時炸場!AI 編程要變天了

0
分享至

大家好,我是程序員魚皮。

今天凌晨,AI 圈又雙叒炸了。Anthropic 和 OpenAI 幾乎同時發(fā)布了自家的最新大模型 —— Claude Opus 4.6 和 GPT-5.3-Codex,中門對狙,火藥味十足。


這次兩家是真往編程和實際工作能力上卷了,不是那種 “跑分升了 2 個點” 就發(fā)篇博客的敷衍更新。

下面我?guī)Т蠹铱焖倭私庖幌?,這兩個模型到底更新了什么?對我們程序員和 AI 玩家來說有什么用?

Claude Opus 4.6:更聰明、更能干、更持久

先說 Anthropic 這邊。Claude Opus 4.6 是目前 Claude 家族最強的模型,之前用 Claude Opus 4.5 編程就已經(jīng)讓我感覺 “AI 寫代碼無所不能” 了,而這次的 Opus 4.6 在多項評估中均處于最先進水平,包括智能編碼、多學科推理、知識工作和智能搜索等。

光看這個跑分我就賊激動了!


實際上手后,我最直觀的感受就是:干活更靠譜了

具體更新了這些:

1)編程能力大幅提升:Opus 4.6 能更好地在大型代碼庫中工作,調(diào)試和代碼審查能力增強,寫完代碼還能自己檢查錯誤。

我實測了一波,讓之前的 Opus 4.5 和新出的 Opus 4.6 同時開發(fā)一個「聚合搜索引擎」項目:

請你幫我開發(fā)一個聚合搜索網(wǎng)站,包含完整的前端和后端,能夠同時從多個不同的搜索引擎搜索和聚合結(jié)果。
應(yīng)該先做 MVP 最小可行產(chǎn)品,整個過程不需要向我確認、不需要我提供 API Key,你必須確保功能正??捎谩?br/>

幾分鐘后,二者都完成了任務(wù):


但是對比一下實際搜索效果,Opus 4.5 完敗,看到這我就放心了,以后我用 AI 編程估計 Bug 更少了~


2)100 萬 token 上下文窗口。Opus 系列第一次支持這么長的上下文,簡單來說就是你可以一次性給它丟一大堆文件和代碼,它都能記住并理解,不會像以前那樣聊著聊著就失憶了。

這也是我最最最期待的特性,復(fù)雜的前后端項目也可以在同一對話框中一把梭了!不用來來回回總結(jié)上下文和新開對話框。

贛,準備嘎嘎燒 Tokens 了。

3)128k 輸出 token。輸出長度翻倍,意味著 Claude 可以一次性生成更長的代碼和文檔,不用再拆成好幾次請求了。

4)自適應(yīng)思考。以前開發(fā)者只能手選開啟或關(guān)閉深度推理,現(xiàn)在 Claude 會自動判斷這個問題需不需要深度思考。簡單問題秒回,復(fù)雜問題慢慢想,智能調(diào)節(jié),省時省錢。

5)上下文壓縮。以前跑長任務(wù)的時候,AI 經(jīng)常會撞到上下文長度的天花板?,F(xiàn)在 Claude 能自動壓縮和總結(jié)之前的對話內(nèi)容,讓長時間運行的任務(wù)不會中途翻車。搭配 100 萬 token 上下文,不敢想象有多持久!

6)Claude Code 支持多智能體協(xié)作。你可以同時啟動多個 AI Agent 并行工作,比如讓幾個 Agent 同時審查代碼庫的不同部分,效率直接翻倍。

7)Claude in Excel 大升級。現(xiàn)在能處理更復(fù)雜的長時間任務(wù),支持數(shù)據(jù)透視表、圖表修改、條件格式、數(shù)據(jù)驗證等,還能一次性處理多步驟操作。


8)Claude in PowerPoint 上線。能讀取你已有的模板、字體和母版,保持品牌風格一致,然后直接幫你生成完整的 PPT。


大家對 Opus 4.6 也是一致好評,不少早期測試的公司都表示 “用了回不去”,Cursor 官方說 Opus 4.6 是他們內(nèi)部長任務(wù)測試中的最強模型,Replit 說它的任務(wù)拆解和并行規(guī)劃能力有了巨大飛躍。

GPT-5.3-Codex:OpenAI 的編程殺手锏

再看 OpenAI 這邊。這次發(fā)布的 GPT-5.3-Codex,劍指 最強編程 Agent,而且不只是寫代碼,還能像你的同事一樣邊干活邊和你溝通。

相比 Claude 官方連發(fā)好幾個帖子介紹自家新模型,OpenAI 官方這邊則低調(diào)不少。Sam Altman 親自在 X 上喊話:


來看看具體有什么:

1)編程跑分全面領(lǐng)先。SWE-Bench Pro 57% 和 TerminalBench 2.0 77%,編程相關(guān)基準都創(chuàng)了新高。尤其是 OSWorld(測試 AI 在真實桌面環(huán)境中完成任務(wù)的能力)直接從上一代的 38.2% 飆到 64.7%,這個提升幅度相當炸裂。


2)速度更快、更省錢。完成同樣的任務(wù),token 消耗量不到上一代(5.2-Codex)的一半,而且每個 token 處理速度還快了 25%。又快又省,這才是實實在在的體驗提升。

3)邊干活邊匯報。以前你丟一個任務(wù)給 AI,只能干等結(jié)果?,F(xiàn)在 GPT-5.3-Codex 會在工作過程中實時告訴你它在做什么、做到哪了,你隨時可以插嘴調(diào)整方向,就像真的在和一個同事協(xié)作一樣。

4)超強的前端開發(fā)能力。官方直接展示了讓它做賽車游戲和潛水游戲的效果,完整度高得離譜,有多個地圖、道具系統(tǒng)和完整的游戲邏輯。


生成普通網(wǎng)頁時 AI 也更懂你的意圖了,默認就能給你做出功能更豐富、設(shè)計更合理的頁面。

5)電腦操作能力增強。不只是寫代碼,它還能像人一樣操作電腦完成各種任務(wù),比如做 PPT、分析數(shù)據(jù)、處理表格,把編程 Agent 的邊界擴展到了全能打工 Agent。

6)自己訓練自己。OpenAI 團隊說 GPT-5.3-Codex 是第一個 參與了自身創(chuàng)造 的模型。團隊用它的早期版本來調(diào)試訓練過程、管理部署、分析測試結(jié)果。也就是說,AI 在加速 AI 自身的進化,以后的進化速度肯定會越來越快。

7)網(wǎng)絡(luò)安全能力大幅增強。這是第一個被 OpenAI 歸類為高能力網(wǎng)絡(luò)安全模型的版本,能主動發(fā)現(xiàn)代碼漏洞。OpenAI 同時承諾投入 1000 萬美元 API 額度支持網(wǎng)絡(luò)防御研究。

我的看法

這次兩家巨頭同時發(fā)布新模型,互相貼臉開大,對我們用戶來說是好事??梢钥吹?,這兩個模型都在往 實用方向 猛卷,是真的想讓你日常工作中用得上。

這兩個大模型應(yīng)該如何選擇呢?

簡單對比一下:

  • Claude Opus 4.6 是六邊形戰(zhàn)士,編程、辦公、研究樣樣行,特別是在 Excel、PowerPoint 這些辦公場景里做了很深的整合。

  • GPT-5.3-Codex 把編程能力拉滿,在代碼生成、任務(wù)執(zhí)行和人機協(xié)作上打出了差異化優(yōu)勢。

不過我估計網(wǎng)絡(luò)和價格就已經(jīng)勸退一大波國內(nèi)用戶了,如果你只是日常學習、或者做做工具類小項目,也不必盲目追求國外的大模型。很快 DeepSeek V4 等一系列國產(chǎn)大模型應(yīng)該就要出來了,期待一波~

點擊下方關(guān)注魚皮,獲取免費編程學習路線、簡歷模板、面試題解、AI 知識庫、項目教程、交流群。

一些對大家有用的資源:
100+ 編程學習路線 / 實戰(zhàn)項目 / 求職指導(dǎo)
100+ 簡歷模板
300+ 企業(yè)面試題庫 mianshiya.com
500+ AI 資源大全
1 對 1 模擬面試
動畫學算法教程

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
從武大碩士到商場導(dǎo)購:誣告學弟性騷擾的楊景媛,終于付出了代價

從武大碩士到商場導(dǎo)購:誣告學弟性騷擾的楊景媛,終于付出了代價

地理三體說
2026-04-25 22:06:06
上海地鐵互毆后續(xù):央媒發(fā)聲定調(diào),女子工作恐不保,知情人曝更多

上海地鐵互毆后續(xù):央媒發(fā)聲定調(diào),女子工作恐不保,知情人曝更多

以茶帶書
2026-04-27 19:23:12
高市早苗稱要為長期戰(zhàn)爭做準備

高市早苗稱要為長期戰(zhàn)爭做準備

界面新聞
2026-04-27 18:36:46
一場硬核風力實驗,一見這屆頂級游戲本散熱有多強?

一場硬核風力實驗,一見這屆頂級游戲本散熱有多強?

極果酷玩
2026-04-23 23:13:17
婚介所徹底變天!因沒有男客戶而倒閉,轉(zhuǎn)變成了??优说臍⒇i盤

婚介所徹底變天!因沒有男客戶而倒閉,轉(zhuǎn)變成了??优说臍⒇i盤

譚談社會
2026-04-27 19:01:19
公開開炮!文班亞馬炮轟NBA官方:賽季結(jié)束再來問我

公開開炮!文班亞馬炮轟NBA官方:賽季結(jié)束再來問我

體育妞世界
2026-04-28 00:50:03
現(xiàn)在就業(yè)環(huán)境真的這么嚴峻嗎?

現(xiàn)在就業(yè)環(huán)境真的這么嚴峻嗎?

慧翔百科
2026-04-27 17:34:09
她終于重回顏值巔峰!

她終于重回顏值巔峰!

奮斗在韓國
2026-04-27 19:19:56
孕婦200元買水果被丈夫“吃死你” 引產(chǎn)后離婚,事件反轉(zhuǎn)賬號被封

孕婦200元買水果被丈夫“吃死你” 引產(chǎn)后離婚,事件反轉(zhuǎn)賬號被封

社會日日鮮
2026-04-28 03:58:45
賬號被封禁!孕婦稱因買200元水果遭丈夫辱罵后引產(chǎn),網(wǎng)友質(zhì)疑擺拍!河南省婦聯(lián)回應(yīng)

賬號被封禁!孕婦稱因買200元水果遭丈夫辱罵后引產(chǎn),網(wǎng)友質(zhì)疑擺拍!河南省婦聯(lián)回應(yīng)

瀟湘晨報
2026-04-27 23:04:24
最高院:提供 “口交” “肛交”等進入式性服務(wù),是否屬賣淫行為?

最高院:提供 “口交” “肛交”等進入式性服務(wù),是否屬賣淫行為?

周軍律師聊案子
2026-04-21 09:50:16
這才是提高數(shù)學成績最好的方法!(建議永久收藏)

這才是提高數(shù)學成績最好的方法?。ńㄗh永久收藏)

戶外阿毽
2026-04-27 09:46:34
普京:俄羅斯將全力推動中東盡快實現(xiàn)和平

普京:俄羅斯將全力推動中東盡快實現(xiàn)和平

澎湃新聞
2026-04-28 04:11:05
吉林伊通驚現(xiàn)200萬豪華住宅式墓地,獨門獨戶地上地下兩層

吉林伊通驚現(xiàn)200萬豪華住宅式墓地,獨門獨戶地上地下兩層

大象新聞
2026-04-27 13:41:32
觸目驚心!央視曝光上海一中醫(yī)館:從醫(yī)生到病人全是演員!

觸目驚心!央視曝光上海一中醫(yī)館:從醫(yī)生到病人全是演員!

人間頌
2026-04-20 10:16:00
80歲不管存款多少,記得提前給自己準備4樣東西,建議了解

80歲不管存款多少,記得提前給自己準備4樣東西,建議了解

小談食刻美食
2026-04-27 07:57:04
網(wǎng)傳五一后醫(yī)療行業(yè)被查,醫(yī)護人員人心惶惶,評論區(qū)呼聲十分強烈

網(wǎng)傳五一后醫(yī)療行業(yè)被查,醫(yī)護人員人心惶惶,評論區(qū)呼聲十分強烈

譚談社會
2026-04-27 23:01:22
山西澤州發(fā)生重大刑事案件,33歲嫌犯潛逃,警方發(fā)布協(xié)查通報

山西澤州發(fā)生重大刑事案件,33歲嫌犯潛逃,警方發(fā)布協(xié)查通報

極目新聞
2026-04-27 17:56:03
男子曝入職全球頂尖科技公司時突然被降薪20萬,拒offer后被嘲諷:你的愛國情懷不值20萬嗎

男子曝入職全球頂尖科技公司時突然被降薪20萬,拒offer后被嘲諷:你的愛國情懷不值20萬嗎

爆角追蹤
2026-04-27 14:54:06
副部級王中和被判有期徒刑17年!受賄超6674萬元、行賄200萬元,結(jié)交政治騙子、搞權(quán)色交易

副部級王中和被判有期徒刑17年!受賄超6674萬元、行賄200萬元,結(jié)交政治騙子、搞權(quán)色交易

揚子晚報
2026-04-27 17:19:01
2026-04-28 06:35:00
程序員魚皮 incentive-icons
程序員魚皮
一手科技資訊和編程干貨
100文章數(shù) 94關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

普京就中東局勢明確表態(tài) 伊朗外長當面感謝

頭條要聞

普京就中東局勢明確表態(tài) 伊朗外長當面感謝

體育要聞

人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

娛樂要聞

黃楊鈿甜為“耳環(huán)風波”出鏡道歉:謠言已澄清

財經(jīng)要聞

Meta 140億收購Manus遭中國發(fā)改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態(tài)度原創(chuàng)

房產(chǎn)
本地
教育
手機
公開課

房產(chǎn)要聞

信號!海南商業(yè)版圖,迎來大變局!

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統(tǒng)文化

教育要聞

地理干貨|高中地理18類題型規(guī)范答題模板

手機要聞

一加Nord CE6 Lite官宣5月7日發(fā)布,7000mAh電池

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版