国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

剛剛,Claude Opus 4.6 和 GPT-5.3-Codex 同時(shí)炸場(chǎng)!AI 編程要變天了

0
分享至

大家好,我是程序員魚(yú)皮。

今天凌晨,AI 圈又雙叒炸了。Anthropic 和 OpenAI 幾乎同時(shí)發(fā)布了自家的最新大模型 —— Claude Opus 4.6 和 GPT-5.3-Codex,中門(mén)對(duì)狙,火藥味十足。


這次兩家是真往編程和實(shí)際工作能力上卷了,不是那種 “跑分升了 2 個(gè)點(diǎn)” 就發(fā)篇博客的敷衍更新。

下面我?guī)Т蠹铱焖倭私庖幌?,這兩個(gè)模型到底更新了什么?對(duì)我們程序員和 AI 玩家來(lái)說(shuō)有什么用?

Claude Opus 4.6:更聰明、更能干、更持久

先說(shuō) Anthropic 這邊。Claude Opus 4.6 是目前 Claude 家族最強(qiáng)的模型,之前用 Claude Opus 4.5 編程就已經(jīng)讓我感覺(jué) “AI 寫(xiě)代碼無(wú)所不能” 了,而這次的 Opus 4.6 在多項(xiàng)評(píng)估中均處于最先進(jìn)水平,包括智能編碼、多學(xué)科推理、知識(shí)工作和智能搜索等。

光看這個(gè)跑分我就賊激動(dòng)了!


實(shí)際上手后,我最直觀的感受就是:干活更靠譜了。

具體更新了這些:

1)編程能力大幅提升:Opus 4.6 能更好地在大型代碼庫(kù)中工作,調(diào)試和代碼審查能力增強(qiáng),寫(xiě)完代碼還能自己檢查錯(cuò)誤。

我實(shí)測(cè)了一波,讓之前的 Opus 4.5 和新出的 Opus 4.6 同時(shí)開(kāi)發(fā)一個(gè)「聚合搜索引擎」項(xiàng)目:

請(qǐng)你幫我開(kāi)發(fā)一個(gè)聚合搜索網(wǎng)站,包含完整的前端和后端,能夠同時(shí)從多個(gè)不同的搜索引擎搜索和聚合結(jié)果。
應(yīng)該先做 MVP 最小可行產(chǎn)品,整個(gè)過(guò)程不需要向我確認(rèn)、不需要我提供 API Key,你必須確保功能正??捎?。

幾分鐘后,二者都完成了任務(wù):


但是對(duì)比一下實(shí)際搜索效果,Opus 4.5 完敗,看到這我就放心了,以后我用 AI 編程估計(jì) Bug 更少了~


2)100 萬(wàn) token 上下文窗口。Opus 系列第一次支持這么長(zhǎng)的上下文,簡(jiǎn)單來(lái)說(shuō)就是你可以一次性給它丟一大堆文件和代碼,它都能記住并理解,不會(huì)像以前那樣聊著聊著就失憶了。

這也是我最最最期待的特性,復(fù)雜的前后端項(xiàng)目也可以在同一對(duì)話框中一把梭了!不用來(lái)來(lái)回回總結(jié)上下文和新開(kāi)對(duì)話框。

贛,準(zhǔn)備嘎嘎燒 Tokens 了。

3)128k 輸出 token。輸出長(zhǎng)度翻倍,意味著 Claude 可以一次性生成更長(zhǎng)的代碼和文檔,不用再拆成好幾次請(qǐng)求了。

4)自適應(yīng)思考。以前開(kāi)發(fā)者只能手選開(kāi)啟或關(guān)閉深度推理,現(xiàn)在 Claude 會(huì)自動(dòng)判斷這個(gè)問(wèn)題需不需要深度思考。簡(jiǎn)單問(wèn)題秒回,復(fù)雜問(wèn)題慢慢想,智能調(diào)節(jié),省時(shí)省錢(qián)。

5)上下文壓縮。以前跑長(zhǎng)任務(wù)的時(shí)候,AI 經(jīng)常會(huì)撞到上下文長(zhǎng)度的天花板。現(xiàn)在 Claude 能自動(dòng)壓縮和總結(jié)之前的對(duì)話內(nèi)容,讓長(zhǎng)時(shí)間運(yùn)行的任務(wù)不會(huì)中途翻車。搭配 100 萬(wàn) token 上下文,不敢想象有多持久!

6)Claude Code 支持多智能體協(xié)作。你可以同時(shí)啟動(dòng)多個(gè) AI Agent 并行工作,比如讓幾個(gè) Agent 同時(shí)審查代碼庫(kù)的不同部分,效率直接翻倍。

7)Claude in Excel 大升級(jí)?,F(xiàn)在能處理更復(fù)雜的長(zhǎng)時(shí)間任務(wù),支持?jǐn)?shù)據(jù)透視表、圖表修改、條件格式、數(shù)據(jù)驗(yàn)證等,還能一次性處理多步驟操作。


8)Claude in PowerPoint 上線。能讀取你已有的模板、字體和母版,保持品牌風(fēng)格一致,然后直接幫你生成完整的 PPT。


大家對(duì) Opus 4.6 也是一致好評(píng),不少早期測(cè)試的公司都表示 “用了回不去”,Cursor 官方說(shuō) Opus 4.6 是他們內(nèi)部長(zhǎng)任務(wù)測(cè)試中的最強(qiáng)模型,Replit 說(shuō)它的任務(wù)拆解和并行規(guī)劃能力有了巨大飛躍。

GPT-5.3-Codex:OpenAI 的編程殺手锏

再看 OpenAI 這邊。這次發(fā)布的 GPT-5.3-Codex,劍指 最強(qiáng)編程 Agent,而且不只是寫(xiě)代碼,還能像你的同事一樣邊干活邊和你溝通。

相比 Claude 官方連發(fā)好幾個(gè)帖子介紹自家新模型,OpenAI 官方這邊則低調(diào)不少。Sam Altman 親自在 X 上喊話:


來(lái)看看具體有什么:

1)編程跑分全面領(lǐng)先。SWE-Bench Pro 57% 和 TerminalBench 2.0 77%,編程相關(guān)基準(zhǔn)都創(chuàng)了新高。尤其是 OSWorld(測(cè)試 AI 在真實(shí)桌面環(huán)境中完成任務(wù)的能力)直接從上一代的 38.2% 飆到 64.7%,這個(gè)提升幅度相當(dāng)炸裂。


2)速度更快、更省錢(qián)。完成同樣的任務(wù),token 消耗量不到上一代(5.2-Codex)的一半,而且每個(gè) token 處理速度還快了 25%。又快又省,這才是實(shí)實(shí)在在的體驗(yàn)提升。

3)邊干活邊匯報(bào)。以前你丟一個(gè)任務(wù)給 AI,只能干等結(jié)果?,F(xiàn)在 GPT-5.3-Codex 會(huì)在工作過(guò)程中實(shí)時(shí)告訴你它在做什么、做到哪了,你隨時(shí)可以插嘴調(diào)整方向,就像真的在和一個(gè)同事協(xié)作一樣。

4)超強(qiáng)的前端開(kāi)發(fā)能力。官方直接展示了讓它做賽車游戲和潛水游戲的效果,完整度高得離譜,有多個(gè)地圖、道具系統(tǒng)和完整的游戲邏輯。


生成普通網(wǎng)頁(yè)時(shí) AI 也更懂你的意圖了,默認(rèn)就能給你做出功能更豐富、設(shè)計(jì)更合理的頁(yè)面。

5)電腦操作能力增強(qiáng)。不只是寫(xiě)代碼,它還能像人一樣操作電腦完成各種任務(wù),比如做 PPT、分析數(shù)據(jù)、處理表格,把編程 Agent 的邊界擴(kuò)展到了全能打工 Agent。

6)自己訓(xùn)練自己。OpenAI 團(tuán)隊(duì)說(shuō) GPT-5.3-Codex 是第一個(gè) 參與了自身創(chuàng)造 的模型。團(tuán)隊(duì)用它的早期版本來(lái)調(diào)試訓(xùn)練過(guò)程、管理部署、分析測(cè)試結(jié)果。也就是說(shuō),AI 在加速 AI 自身的進(jìn)化,以后的進(jìn)化速度肯定會(huì)越來(lái)越快。

7)網(wǎng)絡(luò)安全能力大幅增強(qiáng)。這是第一個(gè)被 OpenAI 歸類為高能力網(wǎng)絡(luò)安全模型的版本,能主動(dòng)發(fā)現(xiàn)代碼漏洞。OpenAI 同時(shí)承諾投入 1000 萬(wàn)美元 API 額度支持網(wǎng)絡(luò)防御研究。

我的看法

這次兩家巨頭同時(shí)發(fā)布新模型,互相貼臉開(kāi)大,對(duì)我們用戶來(lái)說(shuō)是好事??梢钥吹?,這兩個(gè)模型都在往 實(shí)用方向 猛卷,是真的想讓你日常工作中用得上。

這兩個(gè)大模型應(yīng)該如何選擇呢?

簡(jiǎn)單對(duì)比一下:

  • Claude Opus 4.6 是六邊形戰(zhàn)士,編程、辦公、研究樣樣行,特別是在 Excel、PowerPoint 這些辦公場(chǎng)景里做了很深的整合。

  • GPT-5.3-Codex 把編程能力拉滿,在代碼生成、任務(wù)執(zhí)行和人機(jī)協(xié)作上打出了差異化優(yōu)勢(shì)。

不過(guò)我估計(jì)網(wǎng)絡(luò)和價(jià)格就已經(jīng)勸退一大波國(guó)內(nèi)用戶了,如果你只是日常學(xué)習(xí)、或者做做工具類小項(xiàng)目,也不必盲目追求國(guó)外的大模型。很快 DeepSeek V4 等一系列國(guó)產(chǎn)大模型應(yīng)該就要出來(lái)了,期待一波~

點(diǎn)擊下方關(guān)注魚(yú)皮,獲取免費(fèi)編程學(xué)習(xí)路線、簡(jiǎn)歷模板、面試題解、AI 知識(shí)庫(kù)、項(xiàng)目教程、交流群。

一些對(duì)大家有用的資源:
100+ 編程學(xué)習(xí)路線 / 實(shí)戰(zhàn)項(xiàng)目 / 求職指導(dǎo)
100+ 簡(jiǎn)歷模板
300+ 企業(yè)面試題庫(kù) mianshiya.com
500+ AI 資源大全
1 對(duì) 1 模擬面試
動(dòng)畫(huà)學(xué)算法教程

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
《海賊王》第二季口碑爆棚:爛番茄新鮮度100%開(kāi)分

《海賊王》第二季口碑爆棚:爛番茄新鮮度100%開(kāi)分

3DM游戲
2026-03-11 13:22:07
小楊阿姨松口了,若真回不去臺(tái)北,聽(tīng)老板安排,反正她不喜歡做飯

小楊阿姨松口了,若真回不去臺(tái)北,聽(tīng)老板安排,反正她不喜歡做飯

小娛樂(lè)悠悠
2026-03-13 12:51:19
伊朗警察總長(zhǎng)威脅:抗議者敢上街就開(kāi)槍

伊朗警察總長(zhǎng)威脅:抗議者敢上街就開(kāi)槍

桂系007
2026-03-11 16:18:41
生死時(shí)速72小時(shí),營(yíng)救伊朗女球員

生死時(shí)速72小時(shí),營(yíng)救伊朗女球員

家傳編輯部
2026-03-12 11:07:56
CBA最新戰(zhàn)報(bào):遼寧主場(chǎng)力克殘陣山西,北控主場(chǎng)勝天津!

CBA最新戰(zhàn)報(bào):遼寧主場(chǎng)力克殘陣山西,北控主場(chǎng)勝天津!

風(fēng)風(fēng)拒絕焦慮
2026-03-14 03:14:57
中國(guó)工商銀行浙江省分行原黨委書(shū)記、行長(zhǎng)沈榮勤被開(kāi)除黨籍

中國(guó)工商銀行浙江省分行原黨委書(shū)記、行長(zhǎng)沈榮勤被開(kāi)除黨籍

環(huán)球網(wǎng)資訊
2026-03-13 17:06:13
見(jiàn)美國(guó)突然松綁,澤連斯基急赴歐洲,要拿自家絕活談筆大買(mǎi)賣

見(jiàn)美國(guó)突然松綁,澤連斯基急赴歐洲,要拿自家絕活談筆大買(mǎi)賣

我是盲流
2026-03-14 01:30:27
男子網(wǎng)購(gòu)了一臺(tái)80寸的“小米電視”,安裝寬帶的師傅提醒他買(mǎi)的電視是假的!

男子網(wǎng)購(gòu)了一臺(tái)80寸的“小米電視”,安裝寬帶的師傅提醒他買(mǎi)的電視是假的!

張曉磊
2025-09-29 11:32:28
女子用洗衣機(jī)洗完的衣服總有尿味,查監(jiān)控發(fā)現(xiàn)弟媳拿壺上廁所后把排泄物倒進(jìn)洗衣機(jī),女子:我們還未分家,去年就倒過(guò)好幾回,弟媳稱“對(duì)我們不滿意”

女子用洗衣機(jī)洗完的衣服總有尿味,查監(jiān)控發(fā)現(xiàn)弟媳拿壺上廁所后把排泄物倒進(jìn)洗衣機(jī),女子:我們還未分家,去年就倒過(guò)好幾回,弟媳稱“對(duì)我們不滿意”

觀威海
2026-03-13 10:39:15
過(guò)氣男頂流淪為酒局“工具人”!全程討好、倒酒賠笑,像一個(gè)商品

過(guò)氣男頂流淪為酒局“工具人”!全程討好、倒酒賠笑,像一個(gè)商品

涵豆說(shuō)娛
2026-01-19 18:16:27
打了十來(lái)天,“最高強(qiáng)度”打擊來(lái)了

打了十來(lái)天,“最高強(qiáng)度”打擊來(lái)了

中國(guó)新聞周刊
2026-03-11 15:02:08
2026年美加墨世界杯阿根廷最強(qiáng)陣容預(yù)測(cè)!奪冠幾乎不可能了?

2026年美加墨世界杯阿根廷最強(qiáng)陣容預(yù)測(cè)!奪冠幾乎不可能了?

體壇八點(diǎn)半的那些事兒
2026-03-13 18:50:31
西安不倒翁小姐姐離職:沒(méi)嫁入豪門(mén),七年沒(méi)拿到編制,壓力太大!

西安不倒翁小姐姐離職:沒(méi)嫁入豪門(mén),七年沒(méi)拿到編制,壓力太大!

眼光很亮
2026-03-12 19:25:00
沈陽(yáng)91歲老太太病逝,臨終遺言:我就是國(guó)民黨一直在找的軍火大盜

沈陽(yáng)91歲老太太病逝,臨終遺言:我就是國(guó)民黨一直在找的軍火大盜

興趣知識(shí)
2026-03-12 17:18:51
俄媒:伊朗向俄羅斯請(qǐng)求人道主義援助

俄媒:伊朗向俄羅斯請(qǐng)求人道主義援助

參考消息
2026-03-13 14:17:21
15.65萬(wàn)起!豐田官宣:4月6日,新車正式開(kāi)售

15.65萬(wàn)起!豐田官宣:4月6日,新車正式開(kāi)售

高科技愛(ài)好者
2026-03-13 23:01:07
伊朗終于提出一個(gè)停戰(zhàn)條件:就一句話

伊朗終于提出一個(gè)停戰(zhàn)條件:就一句話

新動(dòng)察
2026-03-12 15:41:46
漠河觀測(cè)員趙海儒:42萬(wàn)津貼買(mǎi)招行,持有13年,狂賺近190萬(wàn)

漠河觀測(cè)員趙海儒:42萬(wàn)津貼買(mǎi)招行,持有13年,狂賺近190萬(wàn)

真實(shí)人物采訪
2026-03-13 06:15:06
石破茂回應(yīng)中日現(xiàn)狀,不是打得過(guò)打不過(guò)的問(wèn)題,而是能不能活下去

石破茂回應(yīng)中日現(xiàn)狀,不是打得過(guò)打不過(guò)的問(wèn)題,而是能不能活下去

笑談歷史阿晡
2026-01-14 11:26:05
淪為共享單車的女色虎

淪為共享單車的女色虎

深度報(bào)
2026-03-05 22:39:27
2026-03-14 04:11:00
程序員魚(yú)皮 incentive-icons
程序員魚(yú)皮
一手科技資訊和編程干貨
62文章數(shù) 64關(guān)注度
往期回顧 全部

科技要聞

龍蝦熱卷到AI硬件 “無(wú)腦”硬件或被淘汰

頭條要聞

穆杰塔巴"亮相"沒(méi)講話 伊朗學(xué)者:其處境可能非常危險(xiǎn)

頭條要聞

穆杰塔巴"亮相"沒(méi)講話 伊朗學(xué)者:其處境可能非常危險(xiǎn)

體育要聞

叕戰(zhàn)奧運(yùn),張雨霏要做回“小將”

娛樂(lè)要聞

廣電總局公布演員將用姓氏筆畫(huà)定番位

財(cái)經(jīng)要聞

“十五五”規(guī)劃綱要,全文來(lái)了!

汽車要聞

置換補(bǔ)貼價(jià)8.68萬(wàn) 五菱繽果S 525km旗艦款上市

態(tài)度原創(chuàng)

旅游
教育
藝術(shù)
房產(chǎn)
軍事航空

旅游要聞

春滿來(lái)鳳山,花開(kāi)迎客忙!騰沖茶花基地13萬(wàn)游人踏春“打卡”

教育要聞

25年堅(jiān)守,6次進(jìn)化!這所學(xué)校如何通過(guò)閱讀拿下省科研特等獎(jiǎng)第一名?

藝術(shù)要聞

她的美,竟是用粉彩描繪的,太震撼了!

房產(chǎn)要聞

不容易??!??诮K于又要賣地了!

軍事要聞

伊朗稱襲擊"林肯"號(hào)航母致其撤走

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版