国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

最強(qiáng)智能體編程模型!OpenAI重磅發(fā)布GPT-5.2 Codex

0
分享至


整理 | 蘇宓

出品 | CSDN(ID:CSDNnews)

當(dāng)下,各家 AI 模型的能力還在你追我趕地往上「卷」,尤其是在編碼領(lǐng)域。

就在今天,OpenAI 發(fā)布了智能體編程模型 Codex 的新版本——GPT-5.2 Codex,目標(biāo)很直接:把更復(fù)雜、更耗時(shí)的軟件工程工作,盡量交給 AI 來完成。

按照 OpenAI 的說法,GPT-5.2 Codex 是在 GPT-5.2 能力基礎(chǔ)上的一次“強(qiáng)化升級(jí)”,重點(diǎn)補(bǔ)齊了幾個(gè)工程里常見的痛點(diǎn):長上下文處理、大規(guī)模代碼重構(gòu)、Windows 環(huán)境下的開發(fā)體驗(yàn),以及網(wǎng)絡(luò)安全相關(guān)能力。

從模型基準(zhǔn)測(cè)試結(jié)果來看,這次更新也不只是“小修小補(bǔ)”。



更強(qiáng)的 GPT-5.2 Codex 來了

在衡量真實(shí)軟件工程能力的 SWE-Bench Pro 測(cè)試中,GPT-5.2 Codex 拿下了 56.4% 的準(zhǔn)確率,刷新了該基準(zhǔn)的最高紀(jì)錄,超過了目前已發(fā)布的其他編程模型。這一基準(zhǔn)下,GPT-5.2 獲得了 55.6% 的準(zhǔn)確率,GPT-5.1 僅有 50.8%。

在 Terminal-Bench 2.0 中,它的成績(jī)也達(dá)到了 64%,超過了 GPT-5.2 的 62.2% 和 GPT-5.1-Codex-Max 的 58.1%,該測(cè)試評(píng)估了智能體在真實(shí)終端環(huán)境下進(jìn)行編譯、訓(xùn)練和服務(wù)器配置的能力。

同時(shí),模型的視覺能力也更強(qiáng)了,能更好地看懂屏幕截圖、技術(shù)圖表和用戶界面,可以直接把設(shè)計(jì)稿轉(zhuǎn)成可運(yùn)行的原型。


OpenAI 在博客中反復(fù)強(qiáng)調(diào),GPT-5.2 Codex 的核心目標(biāo)是推動(dòng)“軟件工程”,而不僅僅是寫幾段代碼。在工程實(shí)踐中,設(shè)計(jì)、開發(fā)、測(cè)試、維護(hù)缺一不可,最終追求的是穩(wěn)定、可靠、好維護(hù)、還能不斷演進(jìn)的軟件。

在這些環(huán)節(jié)里,GPT-5.2 Codex 尤其擅長的一項(xiàng)能力是代碼重構(gòu)。簡(jiǎn)單說,就是在不加新功能的前提下,把代碼寫得更干凈、更高效。OpenAI 舉例稱,這個(gè)模型可以調(diào)整代碼結(jié)構(gòu),降低內(nèi)存占用,或者讓應(yīng)用響應(yīng)更快——這些往往是工程師最不想、但又不得不花時(shí)間做的事情。

從演進(jìn)路線來看,GPT-5.2 Codex 也不是憑空出現(xiàn)的。在它之前,GPT-5-Codex、GPT-5.1-Codex-Max 已經(jīng)在多步推理、長上下文理解,以及和開發(fā)工具協(xié)作方面持續(xù)打磨,而 5.2 版本正是在這些積累之上繼續(xù)往前推了一步。

比如,得益于上下文壓縮能力,GPT-5.2 Codex 在長時(shí)間、跨步驟的編程任務(wù)中更不容易“忘事”,能把復(fù)雜流程一口氣跑完;在大規(guī)模代碼庫中,它對(duì)重構(gòu)、遷移和新功能構(gòu)建的支持也更成熟。此外,Windows 環(huán)境下的編程體驗(yàn)有所提升,并加入了更高級(jí)的安全能力,用于輔助漏洞發(fā)現(xiàn)、測(cè)試和緩解。


安全性進(jìn)一步提升

除此之外,OpenAI 也特別提到,安全性是 AI 參與軟件工程時(shí)繞不開的一環(huán)。企業(yè)級(jí)系統(tǒng)對(duì)穩(wěn)定性和可靠性的要求極高,開發(fā)和安全團(tuán)隊(duì)在修復(fù)復(fù)雜漏洞時(shí),既需要 AI 的幫助,也必須確保這些工具本身不會(huì)帶來新的安全隱患。

這一次,在專業(yè)級(jí) Capture-the-Flag(CTF)挑戰(zhàn)賽中的 pass@12 成績(jī)遠(yuǎn)超前幾代模型,如 o3、GPT-5 和 GPT-5.1-Codex-Max。從 2025 年 4 月到 2026 年 1 月的走勢(shì)圖來看,它的能力呈指數(shù)級(jí)增長,但仍低于 OpenAI 定義的“高等級(jí)準(zhǔn)備框架”門檻,因此官方在系統(tǒng)說明中設(shè)置了多層安全防護(hù)。


事實(shí)上,Codex 在安全方向上的潛力已經(jīng)有過實(shí)際案例。本月早些時(shí)候,安全研究員 Andrew MacPherson 使用 GPT-5.1-Codex-Max 分析了 React 的一個(gè)漏洞(CVE-2025-55182)。他在博客中提到,模型通過多輪評(píng)估、模糊測(cè)試和漏洞利用分析相結(jié)合的方式,不僅幫助緩解了問題,還意外發(fā)現(xiàn)并修復(fù)了此前未被注意到的漏洞。

在 OpenAI 看來,GPT-5.2 Codex 的這些改進(jìn),能在現(xiàn)實(shí)中給企業(yè)帶來直接價(jià)值:把最復(fù)雜、最重復(fù)的軟件工程任務(wù)自動(dòng)化,同時(shí)支持更復(fù)雜功能和更高等級(jí)的安全需求,幫助團(tuán)隊(duì)提高效率、減少人為失誤,在激烈的工程競(jìng)爭(zhēng)中保持優(yōu)勢(shì)。

這個(gè)模型是在競(jìng)爭(zhēng)越來越激烈的情況下推出的。此前,OpenAI 內(nèi)部就曾因?yàn)?Google 的 Gemini 3 進(jìn)展而啟動(dòng)“紅色警報(bào)”應(yīng)對(duì)。GPT-5.2-Codex 可以在命令行工具(CLI)、IDE 插件、網(wǎng)頁端、移動(dòng)端以及 GitHub 代碼審查中使用。

在發(fā)布節(jié)奏上,OpenAI 表示 GPT-5.2 Codex 即日起向所有付費(fèi) ChatGPT 用戶開放。接下來一段時(shí)間,訪問權(quán)限將擴(kuò)展至 API 用戶,同時(shí)還會(huì)推出一個(gè)僅限邀請(qǐng)的可信訪問試點(diǎn),面向經(jīng)過審核、專注于防御型網(wǎng)絡(luò)安全的安全專業(yè)人士。

更多關(guān)于 GPT-5.2 Codex 詳見:https://openai.com/zh-Hans-CN/index/introducing-gpt-5-2-codex/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
大量博物館的閉館通知,元旦假期馬上來了為什么要閉館?

大量博物館的閉館通知,元旦假期馬上來了為什么要閉館?

歷史總在押韻
2025-12-26 21:34:35
票房會(huì)破20億!寧浩《用武之地》首輪口碑出爐,徐崢的話又應(yīng)驗(yàn)了

票房會(huì)破20億!寧浩《用武之地》首輪口碑出爐,徐崢的話又應(yīng)驗(yàn)了

小丸子的娛樂圈
2025-12-26 17:59:11
華子空砍44分,約基奇56+16+15!一戰(zhàn)刷新6大紀(jì)錄,創(chuàng)2個(gè)歷史第1

華子空砍44分,約基奇56+16+15!一戰(zhàn)刷新6大紀(jì)錄,創(chuàng)2個(gè)歷史第1

毒舌NBA
2025-12-26 14:48:26
對(duì)越反擊戰(zhàn)期間,先前有 15 個(gè)國家明確站隊(duì)支持越南,然而戰(zhàn)爭(zhēng)正式打響后,它們卻不約而同地選擇了緘口不言,這是為何?

對(duì)越反擊戰(zhàn)期間,先前有 15 個(gè)國家明確站隊(duì)支持越南,然而戰(zhàn)爭(zhēng)正式打響后,它們卻不約而同地選擇了緘口不言,這是為何?

史海孤雁
2025-12-19 17:46:17
隨著廣東+北京皆險(xiǎn)勝,天津獲首勝,CBA最新積分榜:全敗僅剩1隊(duì)

隨著廣東+北京皆險(xiǎn)勝,天津獲首勝,CBA最新積分榜:全敗僅剩1隊(duì)

侃球熊弟
2025-12-26 21:53:28
廣東臺(tái)的衰敗:從“萬人空巷”到“無人問津”,被誰奪走了靈魂

廣東臺(tái)的衰?。簭摹叭f人空巷”到“無人問津”,被誰奪走了靈魂

阿訊說天下
2025-12-24 17:14:51
朱孝天或被刑拘!大麥網(wǎng)已取證不實(shí)信息,汪小菲被牽連緊急切割

朱孝天或被刑拘!大麥網(wǎng)已取證不實(shí)信息,汪小菲被牽連緊急切割

振華觀史
2025-12-26 19:10:10
廣東通報(bào):東莞多個(gè)鎮(zhèn)街制發(fā)實(shí)施方案大篇幅抄襲市級(jí)文件

廣東通報(bào):東莞多個(gè)鎮(zhèn)街制發(fā)實(shí)施方案大篇幅抄襲市級(jí)文件

大象新聞
2025-12-26 16:33:02
精確到樓號(hào)!西城這8棟老樓將大改!

精確到樓號(hào)!西城這8棟老樓將大改!

家住東西城
2025-12-26 21:28:36
天助C羅:1-2,C羅爭(zhēng)冠勁敵爆大冷門吞下首敗+落后利雅得勝利8分

天助C羅:1-2,C羅爭(zhēng)冠勁敵爆大冷門吞下首敗+落后利雅得勝利8分

俯身沖頂
2025-12-26 23:04:44
“向14億國人道歉!”亂港暴徒在法庭上大喊:是美國間諜指使的!

“向14億國人道歉!”亂港暴徒在法庭上大喊:是美國間諜指使的!

來科點(diǎn)譜
2025-12-24 09:01:30
人民幣匯率破7!接下來股市、樓市和你手里的資產(chǎn)都會(huì)怎么走?

人民幣匯率破7!接下來股市、樓市和你手里的資產(chǎn)都會(huì)怎么走?

墨蘭史書
2025-12-26 18:40:03
黃健翔:可以考慮將沃爾特馬德的譯名叫做華特馬、懷德馬

黃健翔:可以考慮將沃爾特馬德的譯名叫做華特馬、懷德馬

懂球帝
2025-12-26 16:36:03
你知道女性的陰道有多長嗎?或許與你所想,完全不同!

你知道女性的陰道有多長嗎?或許與你所想,完全不同!

戰(zhàn)爭(zhēng)茶館
2025-11-26 10:33:50
【2025.12.26】扒醬料不停:那些你不知道的八卦一二三

【2025.12.26】扒醬料不停:那些你不知道的八卦一二三

娛樂真爆姐
2025-12-26 23:11:27
臺(tái)海開戰(zhàn),只要美國敢插手,就叫他有來無回!

臺(tái)海開戰(zhàn),只要美國敢插手,就叫他有來無回!

忠于法紀(jì)
2025-12-26 23:08:11
特大“職業(yè)背債人”貸款詐騙案詳情披露:300多人騙貸全國多家銀行上千萬元,每個(gè)環(huán)節(jié)都有專人負(fù)責(zé)

特大“職業(yè)背債人”貸款詐騙案詳情披露:300多人騙貸全國多家銀行上千萬元,每個(gè)環(huán)節(jié)都有專人負(fù)責(zé)

都市快報(bào)橙柿互動(dòng)
2025-12-26 22:26:03
62歲失獨(dú)母親再懷孕,稱胎兒是離世獨(dú)子轉(zhuǎn)世:失去的兒子回來了

62歲失獨(dú)母親再懷孕,稱胎兒是離世獨(dú)子轉(zhuǎn)世:失去的兒子回來了

觀世記
2025-12-26 16:48:24
50歲佘詩曼私生活曝光:未婚,身價(jià)過億,獨(dú)居客廳僅10㎡小破宅,只想當(dāng)個(gè)富婆

50歲佘詩曼私生活曝光:未婚,身價(jià)過億,獨(dú)居客廳僅10㎡小破宅,只想當(dāng)個(gè)富婆

黎兜兜
2025-12-25 21:56:18
147:5,中俄反對(duì)無效,聯(lián)大通過決議,日本要求中國“自廢武功”

147:5,中俄反對(duì)無效,聯(lián)大通過決議,日本要求中國“自廢武功”

小小科普員
2025-12-04 20:14:22
2025-12-27 00:59:00
CSDN incentive-icons
CSDN
成就一億技術(shù)人
26215文章數(shù) 242203關(guān)注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

頭條要聞

老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

體育要聞

開翻航母之后,他決定親手造一艘航母

娛樂要聞

王傳君生病后近照變化大,面部浮腫

財(cái)經(jīng)要聞

投資巨鱷羅杰斯最新持倉:只留四種資產(chǎn)

汽車要聞

兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測(cè)

態(tài)度原創(chuàng)

教育
藝術(shù)
家居
公開課
軍事航空

教育要聞

鼓樓熱門民辦動(dòng)了!2026小升初最新消息

藝術(shù)要聞

你絕對(duì)想不到,佛陀微笑隱藏的秘密竟然是!

家居要聞

格調(diào)時(shí)尚 智慧品質(zhì)居所

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

烏最新20點(diǎn)俄烏和平草案遞交莫斯科 俄方拒絕

無障礙瀏覽 進(jìn)入關(guān)懷版