国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT5.5:更貴不更燒,主角給到Codex,逼Claude慌忙修復(fù)降智問題

0
分享至


作者 | 貓貓頭
郵箱 | cathy@pingwest.com

GPT-5.5來了。API定價$5/$30每百萬token,GPT-5.4的兩倍。

但它并不更燒token。


Sam Altman在公布定價的同一條推文里補了一句:"Remember, you will need less tokens per task than 5.4!" 貴一倍,但每個任務(wù)token更少——"其實更劃算"。OpenAI總裁Greg Brockman在發(fā)布會上給了更大的詞:"a new class of intelligence."


先看模型本身。

主戰(zhàn)場是agentic coding和長文本:Terminal-Bench 2.0上82.7%,碾壓Opus 4.7的69.4%;1M token context window讓長文本檢索(MRCR v2)從GPT-5.4的36.6%跳到74.0%,Opus 4.7只有32.2%。GDPval(覆蓋44個職業(yè)的知識工作基準)84.9%。但SWE-Bench Pro(代碼修復(fù))只有58.6%,Opus 4.7拿了64.3%——不是所有維度都贏。


用例方面,三個數(shù)字值得記。24,771份K-1稅表(71,637頁)自動審閱省了兩周;GPT-5.5參與了一個Ramsey數(shù)漸近證明,研究者說原本需要數(shù)月人工分析;OpenAI內(nèi)部85%的員工每周都在用Codex。


所以最大亮點不是"更聰明"。是更貴但更高效——定價翻倍但單任務(wù)token消耗顯著下降,推理速度通過與NVIDIA GB200/GB300的co-design提升了20%。加上Codex同步升級了瀏覽器控制、Sheets/Docs處理、系統(tǒng)級語音——GPT-5.5本質(zhì)上是一個為Codex生態(tài)量身定制的模型。


這是官方敘事。但4月23日的故事不止一個模型。

1

Benchmark先打起來了

發(fā)布當天,獨立開發(fā)者@bridgemindai發(fā)了兩條推文
第一條:"Claude Opus 4.7 dominates GPT 5.5 on SWE Bench Pro."


幾小時后:"Claude Opus 4.7 is no longer the best model in the world. Not even close."


同一個人,同一天,結(jié)論完全相反。兩邊的數(shù)據(jù)都是真的:

SWE-Bench Pro(編碼):GPT-5.5不及Opus 4.7。@deedydas指出OpenAI刻意沒在發(fā)布材料里報這個成績——"trying really hard to bury the lede."

Terminal-Bench 2.0(長時間推理):GPT-5.5 82.7% vs Opus 4.7 69.4%。碾壓。

幻覺率(AA-Omniscience):GPT-5.5為86%,Opus 4.7為36%。上一代GPT-5.4是89%——兩代之間只降了3個百分點。

Vending-Bench Arena(多人博弈):GPT-5.5策略干凈,照樣贏了耍賴的Opus 4.7。

賓夕法尼亞大學教授Ethan Mollick在給了個框架:jagged frontier。AI的能力邊界不是平線推進,是鋸齒膨脹。選報道哪顆齒,就決定你講什么故事。

這說明:當"誰最強"不再有統(tǒng)一答案,競爭重心就必須轉(zhuǎn)移。


1

Codex才是主菜

轉(zhuǎn)移到哪?

GPT-5.5發(fā)布同天,Codex桌面端上線了瀏覽器控制、Sheets/Slides/Docs處理、系統(tǒng)級語音、自動審查。Mollick的分析框架值得借用:AI有三層——Models、Apps、Harnesses。4月23日OpenAI三層同時升級。

更重要的是生態(tài)卡位。


Anthropic封殺了OpenClaw通過訂閱接口調(diào)用Claude。OpenAI則雇了OpenClaw創(chuàng)始人Peter Steinberger,宣布Codex訂閱可以在任何第三方工具里用——JetBrains、Xcode、Pi,甚至Claude Code。

OpenAI開發(fā)者體驗主管Romain Huet的原話:"We want people to be able to use Codex, and their ChatGPT subscription, wherever they like!"


Django Web 框架發(fā)起人Simon Willison用Claude Code逆向了Codex認證機制,做了個插件直接用訂閱調(diào)GPT-5.5。OpenAI沒封,還半官方鼓勵。Codex CLI已開源。

Anthropic守API利潤率。OpenAI把訂閱制變成了開放平臺。

再看API延遲發(fā)布。官方說"working on security and safeguards"?陀^效果:API上線前想用GPT-5.5,唯一路徑是Codex生態(tài)。用戶被鎖進了應(yīng)用層。


漲價兩倍 + API延后 + Codex全面升級開放第三方。三個同步?jīng)Q策,一個意圖:不賣算力,搶入口。

競爭不在于模型本身了,主角是一整個生態(tài)的配套能力,搶的是未來的入口。

1

加速才剛開始

GPT-5.5距GPT-5.4只隔了一個多月。OpenAI 首席科學家Jakub Pachocki在發(fā)布會上說了句讓人意外的話:"I would say the last few years have been surprisingly slow."


過去幾年——外界看來AI狂飆的幾年——在OpenAI首席科學家眼里是慢的。

OpenAI員工@tszzl透露已有研究者用GPT-5.5做"隔夜實驗":給個算法idea,通宵跑,醒來dashboard就緒。他的措辭是"competent AI research partner"。不是assistant,是partner。


Mollick四個prompt拿到一篇完整學術(shù)論文,統(tǒng)計方法正確,文獻綜述真實。問題不在能力——"假設(shè)不夠有趣"。

AI的瓶頸從能力滑向了品味。模型的競賽,從跑分滑向了生態(tài)。

OpenAI在4月23日押注的不是更聰明的模型。是一個讓用戶走不掉的入口。

而對于OpenAI新模型最大的背書,來自死敵Anthropic。

此前兩者的競爭里,勢頭已經(jīng)被Anthropic拿走,但這一次OpenAI的勢頭回來了。在發(fā)布當天,Claude官方開發(fā)平臺賬號發(fā)布公告,承認了大家詬病已久的“降智”問題,并表示已經(jīng)修復(fù)。


網(wǎng)友揶揄道:被用戶指責了足足一個月后,在對手發(fā)布更強模型后你來承認和修復(fù)了。


這可能是GPT 5.5能力之強的最好背書。


點個愛心,再走 吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
貝克漢姆迎51歲生日,貝嫂大方曬老公腹肌泳裝,長子沉默令人心寒

貝克漢姆迎51歲生日,貝嫂大方曬老公腹肌泳裝,長子沉默令人心寒

譯言
2026-05-03 08:10:06
世乒賽爆冷+丑聞日:張本智和、松島翻車,中國臺北教練發(fā)文炮轟

世乒賽爆冷+丑聞日:張本智和、松島翻車,中國臺北教練發(fā)文炮轟

大秦壁虎白話體育
2026-05-02 23:54:47
別再跟風了!五一最堵五大景點,第5名擠到勸退,第1名直接崩潰

別再跟風了!五一最堵五大景點,第5名擠到勸退,第1名直接崩潰

吃青菜長高
2026-05-03 08:12:17
張雪這張嘴,正在給品牌埋雷

張雪這張嘴,正在給品牌埋雷

全棧遛狗員
2026-04-30 17:12:13
我懷疑,男人更喜歡左邊這一款

我懷疑,男人更喜歡左邊這一款

娛你同歡
2026-05-02 21:44:54
演員陳學冬:2年4次手術(shù),11部作品被下架,如今生活無法自理

演員陳學冬:2年4次手術(shù),11部作品被下架,如今生活無法自理

悅君兮君不知
2026-05-02 11:55:33
退休后才懂:為啥多數(shù)老人不旅游_真正滿世界跑的,竟是這兩類人

退休后才懂:為啥多數(shù)老人不旅游_真正滿世界跑的,竟是這兩類人

心理觀察局
2026-05-03 09:12:14
繼亨德利后,世錦賽六冠王戴維斯也痛批艾倫:這讓斯諾克蒙羞

繼亨德利后,世錦賽六冠王戴維斯也痛批艾倫:這讓斯諾克蒙羞

觀察鑒娛
2026-05-02 15:26:23
人不會無緣無故患帶狀皰疹!調(diào)查發(fā)現(xiàn):得帶狀皰疹,離不開這5點

人不會無緣無故患帶狀皰疹!調(diào)查發(fā)現(xiàn):得帶狀皰疹,離不開這5點

岐黃傳人孫大夫
2026-05-01 14:35:03
歷史第8次黑七!76人掀翻綠軍創(chuàng)造歷史 前7支球隊走了多遠?

歷史第8次黑七!76人掀翻綠軍創(chuàng)造歷史 前7支球隊走了多遠?

羅說NBA
2026-05-03 10:43:20
失蹤的17歲女生遺體已經(jīng)找到,那天她穿上了最好看的裙子和假發(fā)

失蹤的17歲女生遺體已經(jīng)找到,那天她穿上了最好看的裙子和假發(fā)

映射生活的身影
2026-05-02 20:13:26
委內(nèi)瑞拉代總統(tǒng)干了什么,換下馬杜羅后整個國家蒸蒸日上?

委內(nèi)瑞拉代總統(tǒng)干了什么,換下馬杜羅后整個國家蒸蒸日上?

錯過美好
2026-05-02 14:40:24
太離譜!華西醫(yī)院五一放假引爭議,被罵想休息別當醫(yī)生,網(wǎng)友吵翻

太離譜!華西醫(yī)院五一放假引爭議,被罵想休息別當醫(yī)生,網(wǎng)友吵翻

譚談社會
2026-05-02 14:27:21
皇馬悔青腸子!死保姆巴佩的同時,當初錯過的神鋒正在持續(xù)封神

皇馬悔青腸子!死保姆巴佩的同時,當初錯過的神鋒正在持續(xù)封神

奶蓋熊本熊
2026-05-03 02:07:54
又行了?阿森納完勝6分領(lǐng)跑!記者:槍手調(diào)查后決定簽阿爾瓦雷斯

又行了?阿森納完勝6分領(lǐng)跑!記者:槍手調(diào)查后決定簽阿爾瓦雷斯

足球偵探
2026-05-03 08:30:16
哈佛研究生大罷工:你們有五百億美元,發(fā)薪水給你的學術(shù)勞動者

哈佛研究生大罷工:你們有五百億美元,發(fā)薪水給你的學術(shù)勞動者

知識分子
2026-05-02 22:16:41
南昌一樂園過山車空中發(fā)生故障,多名游客被困空中從軌道走下來,文旅局:已督促景區(qū)整改;樂園:有游客的手被倒刺扎傷,已賠償

南昌一樂園過山車空中發(fā)生故障,多名游客被困空中從軌道走下來,文旅局:已督促景區(qū)整改;樂園:有游客的手被倒刺扎傷,已賠償

極目新聞
2026-05-03 10:40:39
搶七轟34+12+6率隊黑七,大帝成NBA歷史首人!三巨頭1-3絕境翻盤

搶七轟34+12+6率隊黑七,大帝成NBA歷史首人!三巨頭1-3絕境翻盤

鍋子籃球
2026-05-03 11:33:14
退役3年 38歲前皇馬巨星形象全毀:發(fā)福大肚腩 如同60歲

退役3年 38歲前皇馬巨星形象全毀:發(fā)福大肚腩 如同60歲

葉青足球世界
2026-05-02 15:22:52
足壇瘋狂一夜:阿森納橫掃富勒姆,大巴黎爆冷丟分,巴薩2-1險勝

足壇瘋狂一夜:阿森納橫掃富勒姆,大巴黎爆冷丟分,巴薩2-1險勝

足球狗說
2026-05-03 05:19:37
2026-05-03 12:52:49
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個星球。
3054文章數(shù) 10493關(guān)注度
往期回顧 全部

科技要聞

庫克罕見"拒答"!蘋果正被AI供應(yīng)鏈卡脖子

頭條要聞

上?萍即髮W王晨輝教授因營救至親不幸去世 年僅39歲

頭條要聞

上?萍即髮W王晨輝教授因營救至親不幸去世 年僅39歲

體育要聞

裁判準備下班,結(jié)果吳宜澤進了決賽

娛樂要聞

蔡卓妍婚后首現(xiàn)身 戴結(jié)婚戒指笑容不斷

財經(jīng)要聞

后巴菲特時代,首場股東會透露了啥

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態(tài)度原創(chuàng)

房產(chǎn)
家居
親子
數(shù)碼
公開課

房產(chǎn)要聞

五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

家居要聞

靈動實用 生活藝術(shù)場

親子要聞

勞動小能手節(jié)日快樂

數(shù)碼要聞

Perplexity稱贊Mac mini是其Personal Computer的最佳本地部署平臺

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版