国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

太狠了!奧特曼親手「干掉」GPT-5.2,OpenAI祭出最強編程AI

0
分享至


新智元報道

編輯:桃子 好困

【新智元導(dǎo)讀】最強AI智能體編程模型GPT-5.2-Codex登場!上下文壓縮,長程任務(wù)處理更強,而且還懂網(wǎng)絡(luò)安全。

GPT-5.2-Codex,深夜突襲!

它是OpenAI迄今為止,最強的AI智能體編程模型,專為復(fù)雜、真實世界軟件工程而打造。


從名字可以看出,GPT-5.2-Codex基于GPT-5.2進一步優(yōu)化版本,它在多項能力上實現(xiàn)了關(guān)鍵改進:

· 上下文壓縮,提升了長周期任務(wù)處理能力

· 在大型代碼變更,如重構(gòu)與遷移上性能更強

· 在原生Windows環(huán)境下,編程能力顯著增強

· 網(wǎng)絡(luò)安全能力最強

奧特曼宣稱,「OpenAI們」已經(jīng)用上了,而且還取得了非常好的成效。


在基準(zhǔn)測試中,GPT-5.2-Codex在軟件工程、終端測試中,擊敗了5.1-Codex-Max、GPT-5.2、GPT-5.1。


OpenAI博客中多次重點強調(diào),GPT-5.2-Codex在網(wǎng)絡(luò)安全上,達到了迄今為止最高水平。

就在上周,一位安全研究員用GPT-5.1-Codex-Max+Codex CLI,直接挖出了一個導(dǎo)致源代碼泄露的React漏洞。


今天起,所有付費用戶皆可用上GPT-5.2-Codex,API將在未來幾周開放。

GPT-5.2-Codex編程狂飆,長跑不掉線

全新AI智能體編程GPT-5.2-Codex,簡單來說,就是一次「強強聯(lián)合」。

它不光繼承了GPT-5.2原本擅長的「專業(yè)工作處理能力」,還學(xué)到了5.1-Codex-Max在AI智能體編程和終端操作方面的能力。

這樣一來,它的進步就很實在了——

在長上下文理解、工具調(diào)用、事實準(zhǔn)確性、原生上下文壓縮等方面,得到了顯著提升。

由此,GPT-5.2-Codex可以穩(wěn)定支持長時間運行的編程任務(wù),并在推理時更省token。

在業(yè)內(nèi)專業(yè)基準(zhǔn)測試中,5.2-Codex在SWE-Bench Pro和Terminal-Bench 2.0上刷新SOTA。

相較于5.1-Codex,約6%的性能提升。


這兩個測試,就是專門用于評估模型在真實終端環(huán)境中處理多樣化任務(wù)時的智能體能力。

同時,它在原生Windows環(huán)境中的智能體編程表現(xiàn)也顯著增強,進一步擴展了GPT-5.1-Codex-Max所引入的能力。

得益于這些改進,Codex能在大型代碼庫中長時間工作,并始終保持完整上下文。

這也就意味著,諸如大規(guī)模重構(gòu)、代碼遷移和功能開發(fā)等復(fù)雜任務(wù),GPT-5.2-Codex可以靠譜地完成。

——即便中途方案調(diào)整或嘗試失敗,也能持續(xù)迭代而不迷失方向。

不僅如此,GPT-5.2-Codex「視力」更強了。

編程時,直接發(fā)給它截圖、技術(shù)示意圖、圖表以及各類UI界面,它都能理解得更準(zhǔn)。


更厲害的是,它可以直接讀取設(shè)計稿,并迅速將其轉(zhuǎn)化為可運行的功能原型。

同時,開發(fā)者也可以與Codex協(xié)作,將這些原型一點點打磨,直到能正式上線使用。

三大躍遷,AI已「攻破」真實世界

在OpenAI的一項核心網(wǎng)絡(luò)安全評估中,可以明顯看到「能力隨時間的躍遷」——

· GPT-5-Codex帶來了第一次顯著提升,

· GPT-5.1-Codex-Max帶來了第二次,

· GPT-5.2-Codex則實現(xiàn)了第三次躍遷。


對此,OpenAI判斷,未來的AI模型仍將沿著這一趨勢持續(xù)演進。

在做規(guī)劃和能力評估時,他們一直假設(shè)每一代模型,都有潛力達到「準(zhǔn)備框架」(Preparedness Framework)里,定義的「高」等級網(wǎng)絡(luò)安全能力。

不過,GPT-5.2-Codex目前還未達到這一水平。

那么,在真實世界中,OpenAI的智能體編程模型表現(xiàn)如何?

一周挖出React高危漏洞

12月11日,React團隊爆出了:React Server Components的三個安全漏洞。

然后,Stripe旗下公司Privy的首席安全工程師Andrew MacPherson,就決定拿這個漏洞來「測試」一下現(xiàn)在的AI模型到底有多能打。

他使用了GPT-5.1-Codex-Max+Codex CLI,以及其他編程智能體,意外的是,在復(fù)現(xiàn)和研究漏洞的過程中,把關(guān)鍵React漏洞挖出來了。


具體實操過程如下——

最初,他嘗試了多次零樣本學(xué)習(xí)分析,直接讓模型檢查補丁并判斷其修復(fù)的漏洞類型,但并未取得成果。

隨后,他轉(zhuǎn)向更高頻、迭代式的提示方式;在這些方法仍然無效后,他引導(dǎo)Codex按照標(biāo)準(zhǔn)的防御性安全流程開展工作——搭建本地測試環(huán)境、分析潛在攻擊面,并通過模糊測試向系統(tǒng)注入異常輸入。

在嘗試復(fù)現(xiàn)原始React2Shell問題的過程中,Codex發(fā)現(xiàn)了一些異常行為,值得深入調(diào)查。

最終,在短短一周內(nèi),這一流程促成了此前未知漏洞的發(fā)現(xiàn),并被以負責(zé)任的方式披露給React團隊。

這一案例清楚地展示了,先進AI系統(tǒng)如何顯著加速真實世界、廣泛使用的軟件中的防御性安全研究。

網(wǎng)友實測

一位開發(fā)者實測GPT-5.2-Codex編寫一個模擬道路上車輛與交通燈工作方式的程序,結(jié)果失敗了。



不過也有人認為,其具備了與Gemini 3 Flash和Pro同樣精美的動畫效果。



GPT-5.2-Codex在生成一款反恐精英的游戲,表現(xiàn)亮眼。


總言之,OpenAI認為,GPT-5.2-Codex的發(fā)布,是AI在真實軟件開發(fā)與網(wǎng)絡(luò)安全領(lǐng)域的又一大步。

它讓開發(fā)者,能輕松應(yīng)對復(fù)雜又耗時的任務(wù),同時也為網(wǎng)絡(luò)安全研究提供更好的工具支持。

參考資料:

https://openai.com/index/introducing-gpt-5-2-codex/

https://openai.com/index/gpt-5-2-codex-system-card/

秒追ASI

?點贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點亮星標(biāo),鎖定新智元極速推送!



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“馬院老師每月多拿一兩千,憑啥?”高校教師吐槽不公,引熱議

“馬院老師每月多拿一兩千,憑啥?”高校教師吐槽不公,引熱議

妍妍教育日記
2025-12-19 18:36:50
海南封關(guān),新加坡的沉默震耳欲聾!

海南封關(guān),新加坡的沉默震耳欲聾!

環(huán)球策論
2025-12-18 22:39:23
上海至嘉興南高鐵票需936元?12306客服:系環(huán)線列車,途經(jīng)17個站點,選擇旅游次票只需要61元

上海至嘉興南高鐵票需936元?12306客服:系環(huán)線列車,途經(jīng)17個站點,選擇旅游次票只需要61元

極目新聞
2025-12-19 17:46:43
臺北突發(fā)襲擊事件已致多人死傷,卓榮泰下令徹查嫌疑人犯罪動機

臺北突發(fā)襲擊事件已致多人死傷,卓榮泰下令徹查嫌疑人犯罪動機

海峽導(dǎo)報社
2025-12-19 21:36:03
當(dāng)年斥巨資拍攝的10大爛片,每一部都是電影界的奇恥大辱

當(dāng)年斥巨資拍攝的10大爛片,每一部都是電影界的奇恥大辱

小微看電影
2025-12-19 09:35:41
大瓜!年輕少婦出軌被當(dāng)場抓奸,丈夫唯唯諾諾,視頻曝光惹怒網(wǎng)友

大瓜!年輕少婦出軌被當(dāng)場抓奸,丈夫唯唯諾諾,視頻曝光惹怒網(wǎng)友

烏娛子醬
2025-12-19 14:26:23
南博流出畫卷簽字院長回應(yīng):非經(jīng)我手鑒定,以調(diào)查為準(zhǔn)

南博流出畫卷簽字院長回應(yīng):非經(jīng)我手鑒定,以調(diào)查為準(zhǔn)

正在新聞
2025-12-19 23:41:52
南京博物館:捐贈已歸國家,無義務(wù)返還

南京博物館:捐贈已歸國家,無義務(wù)返還

映射生活的身影
2025-12-19 17:13:17
中亞五國赴日會議,只有托卡耶夫現(xiàn)身,背后隱藏什么秘密?

中亞五國赴日會議,只有托卡耶夫現(xiàn)身,背后隱藏什么秘密?

時時有聊
2025-12-19 07:17:26
泰國牽頭成立全球反詐聯(lián)盟:聯(lián)合國提供支持,五國率先達成合作

泰國牽頭成立全球反詐聯(lián)盟:聯(lián)合國提供支持,五國率先達成合作

土澳的故事
2025-12-19 00:21:58
殺豬盤新套路:先讓你賺錢,再掏空你全部身家

殺豬盤新套路:先讓你賺錢,再掏空你全部身家

流蘇晚晴
2025-12-17 18:10:58
突發(fā)!湛江帥哥何聰宇去世,年僅20歲,常吃雌激素,知情人曝細節(jié)

突發(fā)!湛江帥哥何聰宇去世,年僅20歲,常吃雌激素,知情人曝細節(jié)

裕豐娛間說
2025-12-19 08:45:53
河南“毆打第三者”事件最新進展:原配取保候?qū)?年后再被刑拘,近日將開庭,多方發(fā)聲

河南“毆打第三者”事件最新進展:原配取保候?qū)?年后再被刑拘,近日將開庭,多方發(fā)聲

瀟湘晨報
2025-12-19 18:22:14
剛剛,動手了!30年首次。。

剛剛,動手了!30年首次。。

格隆匯
2025-12-19 12:53:09
正是他們的主張!造成龐大貧富差距,令國企員工處境艱難?

正是他們的主張!造成龐大貧富差距,令國企員工處境艱難?

小陸搞笑日常
2025-12-19 13:56:56
山西省人民政府發(fā)文:宣布廢止《禁止燃放、儲存煙花爆竹》等文件...

山西省人民政府發(fā)文:宣布廢止《禁止燃放、儲存煙花爆竹》等文件...

無比
2025-12-19 10:45:03
海南封關(guān)次日實探三亞免稅店:蘭蔻等護膚品牌有免稅臨期產(chǎn)品5折銷售,此前甚至有口紅打1折

海南封關(guān)次日實探三亞免稅店:蘭蔻等護膚品牌有免稅臨期產(chǎn)品5折銷售,此前甚至有口紅打1折

極目新聞
2025-12-19 13:22:22
突發(fā)!北京建國路發(fā)生交通事故,約10輛機動車受損

突發(fā)!北京建國路發(fā)生交通事故,約10輛機動車受損

BRTV新聞
2025-12-19 19:04:49
《阿凡達3》上映票房飆8500萬,差評卻刷屏,理由一致:老套至極

《阿凡達3》上映票房飆8500萬,差評卻刷屏,理由一致:老套至極

銀河史記
2025-12-19 18:17:36
烏克蘭攻入俄羅斯本土布良斯克!摧毀俄軍指揮部

烏克蘭攻入俄羅斯本土布良斯克!摧毀俄軍指揮部

項鵬飛
2025-12-19 17:32:26
2025-12-20 04:12:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14135文章數(shù) 66391關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

普京:俄方愿在烏克蘭選舉期間暫時停止打擊

頭條要聞

普京:俄方愿在烏克蘭選舉期間暫時停止打擊

體育要聞

“惡龍”埃托奧,正在毀滅喀麥隆足球

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財經(jīng)要聞

日元加息,恐慌來了?貨幣三國殺

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

數(shù)碼
健康
本地
旅游
公開課

數(shù)碼要聞

機械大師E06臥式ITX機箱上市:支持200mm長半高顯卡,298元

這些新療法,讓化療不再那么痛苦

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

旅游要聞

打開深圳冬天的方式 來沙井“蠔”運當(dāng)頭

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版