国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

GPT5.5深夜炸場,這次OpenAI又行了

0
分享至


出品|虎嗅科技組

作者|趙致格

編輯|苗正卿

頭圖|視覺中國

曾經,OpenAI CEO奧特曼用“嚇暈癱坐在椅子上,彷佛看到原子彈爆炸”來形容自己初次使用GPT5的體驗。然而,當人們最終發(fā)現這次更新遠沒有期待中的驚艷時,這段夸張的描述反而成為了人們反復嘲諷OpenAI的網梗。

然而在4月24日,OpenAI在事前并沒有進行預告鋪墊的情況下半夜發(fā)布的GPT5.5,卻帶來了不小的驚喜。官方稱GPT5.5是一種面向實際工作和智能體的新型智能,主打Agent編程、知識工作、科學研究等。目前,GPT5.5已經面向ChatGPT和Codex的Plus、Business、Enterprise用戶推出,API也將隨后發(fā)布。

雖然沒人被“嚇癱”,但從各類第三方網站的評分看,GPT5.5的綜合表現確實優(yōu)異,不僅比GPT5.4大幅進步,也在多個領域超越了Claude Opus 4.7、Gemini 3.1 Pro等主要競爭對手?梢哉f,在過去一段時間里飽受質疑的OpenAI今天打了個漂亮的翻身仗。

在OpenAI內部設立的,針對20小時長周期軟件工程的Expert-SWE測評中,GPT-5.5的成功率來到了驚人的73.1%,顯著高于上一代GPT5.4的68.5%。

在衡量復雜命令行工作流的Terminal-Bench2.0的測試中,GPT5.5的評分達到82.7%,遠高于Claude的69.4%。在知識工作任務GDPval、高級數學測試FrontierMath、衡量真實電腦操作能力的OSWorld-Verified等維度,GPT5.5的評分均高出競爭對手一截。

GPT5.5的編程能力較為出色,但Opus4.7在SweetBench Pro測試中的表現依然保持領先地位。GPT5.5在測試中的得分為58.6%,低于Opus4.7的64.3%。但是對于這個成績,OpenAI也進行了進一步說明,稱行業(yè)內已有報告指出該評測存在過擬合現象,無法代表真實的編程能力。

GPT還有一個顯著提升的維度就是網絡安全。在CyberGym測試中,GPT5.5的得分為81.8%,高過了Opus 4.7的73.1%。在CTF“奪旗”挑戰(zhàn)中,GPT5.5的得分為881%,高于GPT5.4的83.7%。

雖然GPT在多個領域正在變得更聰明,但OpenAI更樂于強調這是一個專為真實工作和智能體任務打造的模型。OpenAI的X官方賬號稱,GPT5.5“旨在理解復雜目標、使用工具、檢查其工作,并將更多任務進行到底”,而它的出現“標志著完成計算機工作的全新方式”。

用更直白的話說,這次升級讓GPT有了能自己干活的能力,從輔助決策變成了參與執(zhí)行。人類直接把一個亂糟糟的復雜任務丟給GPT5.5,它就可以通過理解目標、拆解步驟、調用工具、修正過程的流程交付出最終結果。

為了更好說明這一點,OpenAI還公布了公司內部對產品的使用情況。目前,OpenAI有超過85%的員工每周跨部門使用搭載GPT5.5的Codex。而公司的財務團隊已經用GPT5.5完成了24771份,共計7萬余頁的稅表審核,比往年提前兩年完工。

不過,這次升級似乎還沒有一步到位,讓人們可以完全放手。多個第三方評測都提到了GPT-5.5對任務邊界的依賴更強。當人們的需求描述不清楚時,它不會主動幫你補全,而是會按現有信息執(zhí)行。這種“服從”在某些場景是優(yōu)點,在另一些場景反而是缺陷。

AI大模型的智慧和速度往往被視為不可兼得,更大的模型和更多的參數就意味著更長的思考時間。但在這次更新中,OpenAI官方稱GPT5.5在智能水平大幅提高的同時,真實服務中的速度與GPT5.4保持了一致。

GPT5.5的另一大特征就是更加節(jié)省Token,將Token消耗降低到了前一代的36分之一。在同類的Codex任務里,GPT5.5也只需要更少的Token就能完成。這也意味著,雖然此次API的價格大幅上漲至每百萬Token 5美元,pro版30美元,但因為效率的提升和Token消耗的減少,實際增加的成本不多。

OpenAI聯合創(chuàng)始人兼總裁格雷格·布羅克曼(Greg Brockman)提到這一點時表示,“讓企業(yè)和普通用戶都能用上更前沿的AI能力”是公司的目標之一。

當OpenAI帶著新模型重回巔峰時,Anthropic最近卻比較煩。長期主打安全牌卻爆出了安全丑聞、對重度付費用戶嚴厲限流、大面積無差別封號等事件都引發(fā)了巨大爭議,日益高企的Token費用和Token消耗也讓很多人直呼“用不起”。

此前OpenAI在內部郵件中說自己相對于Anthropic的優(yōu)勢是算力,F在,隨著算力充足的OpenAI大秀肌肉,而Anthropic在算力吃緊中體驗不斷打折,這兩位一度“貼身肉搏”的死對頭似乎又有了拉開差距的趨勢。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4853572.html?f=wyxwapp

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
iPhone 20周年紀念版曝光,回歸四曲面屏設計

iPhone 20周年紀念版曝光,回歸四曲面屏設計

劉奔跑
2026-04-24 19:53:58
扇人耳光的保安社會性死亡!“底褲”被扒,正臉流出,還有黑歷史

扇人耳光的保安社會性死亡!“底褲”被扒,正臉流出,還有黑歷史

君笙的拂兮
2026-04-24 08:13:27
美伊將進行第二輪談判,美防長:談判底線是“伊朗不可能獲得核彈”,對伊朗封鎖已擴展至全球范圍,34艘船只在霍爾木茲海峽被勒令折返

美伊將進行第二輪談判,美防長:談判底線是“伊朗不可能獲得核彈”,對伊朗封鎖已擴展至全球范圍,34艘船只在霍爾木茲海峽被勒令折返

魯中晨報
2026-04-24 21:04:06
角色扮演界的“泥石流”回歸:低成本cos,讓人一看一個不吱聲

角色扮演界的“泥石流”回歸:低成本cos,讓人一看一個不吱聲

絳紫藝術
2026-04-20 19:16:21
外資跑了,名聲臭了,印度組團來華,中企為何不敢輕易接盤?

外資跑了,名聲臭了,印度組團來華,中企為何不敢輕易接盤?

三農老歷
2026-04-25 08:11:12
風塵女子要怎么分辨出來?行家人都能看出來

風塵女子要怎么分辨出來?行家人都能看出來

霹靂炮
2026-04-03 21:31:48
她因長得漂亮,被日本兵拖進炮樓,一晚上遭受50多個鬼子的折磨

她因長得漂亮,被日本兵拖進炮樓,一晚上遭受50多個鬼子的折磨

凡人聊史
2026-04-11 03:06:57
64歲俞敏洪獨居北京,妻兒定居加拿大原因曝光,原來他是身不由己

64歲俞敏洪獨居北京,妻兒定居加拿大原因曝光,原來他是身不由己

閱微札記
2026-04-24 14:49:10
1944年,師長呂公良拒絕換裝逃生,帶三千官兵與八萬日軍血戰(zhàn)九日

1944年,師長呂公良拒絕換裝逃生,帶三千官兵與八萬日軍血戰(zhàn)九日

掠影后有感
2026-04-25 10:23:20
索金新片:一個工程師對抗巨頭

索金新片:一個工程師對抗巨頭

追星雷達站
2026-04-24 10:57:45
特朗普訪華倒計時,美方已經提出首個條件,希望中方不要見死不救

特朗普訪華倒計時,美方已經提出首個條件,希望中方不要見死不救

風雨與陽光
2026-04-24 19:38:48
CBA“北京市長”到常規(guī)賽55分慘敗收官!姜偉澤社媒發(fā)文耐人尋味

CBA“北京市長”到常規(guī)賽55分慘敗收官!姜偉澤社媒發(fā)文耐人尋味

狼叔評論
2026-04-24 23:36:06
“被嚇到!”AI生圖已經這么逼真了?網友:以后還能信嗎?

“被嚇到!”AI生圖已經這么逼真了?網友:以后還能信嗎?

魯中晨報
2026-04-24 16:56:11
坐高鐵千萬別帶這幾樣東西,安檢直接沒收,帶了純屬白費

坐高鐵千萬別帶這幾樣東西,安檢直接沒收,帶了純屬白費

健身狂人
2026-04-25 07:13:55
76歲的萬科創(chuàng)始人王石,最近徹底成了全網焦點。

76歲的萬科創(chuàng)始人王石,最近徹底成了全網焦點。

夢錄的西方史話
2026-04-23 14:36:39
皇馬警報:姆巴佩在白衣軍團災難前要求換人

皇馬警報:姆巴佩在白衣軍團災難前要求換人

綠茵情報局
2026-04-25 05:47:18
丁俊暉三度領先被趙心童反超,亨得利驚呼他要崩,結果讓皇帝噤聲

丁俊暉三度領先被趙心童反超,亨得利驚呼他要崩,結果讓皇帝噤聲

楊華評論
2026-04-25 00:46:43
古籍記載龍長虎短手相 無名指更長之人晚年多有四種人生結局

古籍記載龍長虎短手相 無名指更長之人晚年多有四種人生結局

嘮叨說歷史
2026-03-31 14:25:43
蘇翊鳴朱易4年戀情結束!雙方互相取關,女方曬眼淚照喊話向前走

蘇翊鳴朱易4年戀情結束!雙方互相取關,女方曬眼淚照喊話向前走

萌神木木
2026-04-24 11:41:28
“牛股”業(yè)績大增!多家A股公司,一季度盈利翻倍!

“牛股”業(yè)績大增!多家A股公司,一季度盈利翻倍!

證券時報e公司
2026-04-25 11:15:19
2026-04-25 13:16:49
虎嗅APP incentive-icons
虎嗅APP
個性化商業(yè)資訊與觀點交流平臺
26177文章數 687690關注度
往期回顧 全部

科技要聞

Anthropic剛拿亞馬遜250億美元,又拿谷歌400億

頭條要聞

媒體:三航母準備圍逼伊朗 結果美國海軍后院先"炸"了

頭條要聞

媒體:三航母準備圍逼伊朗 結果美國海軍后院先"炸"了

體育要聞

火箭0-3觸發(fā)百分百出局定律:本季加時賽9戰(zhàn)8敗

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態(tài)度原創(chuàng)

游戲
健康
藝術
旅游
軍事航空

育碧再出王炸!《AC黑旗》重制版登頂8大地區(qū)PS商店

干細胞如何讓燒燙傷皮膚"再生"?

藝術要聞

廈門新地標奠基!美圖立方視覺藝術中心,OPEN設計

旅游要聞

活化千年文脈 擘畫大河新篇

軍事要聞

美防長:戰(zhàn)事不會“沒完沒了”

無障礙瀏覽 進入關懷版