国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI最強(qiáng)代碼模型GPT-5.2-Codex上線

0
分享至



編輯|澤南

周五凌晨,OpenAI 發(fā)布 GPT-5.2-Codex,這是迄今為止最先進(jìn)的智能體編碼模型,專為復(fù)雜的實(shí)際軟件工程而設(shè)計(jì)。



GPT-5.2-Codex 是 GPT-5.2 的升級版本,提高了指令遵循能力、對長遠(yuǎn)語境的理解能力,它針對 Codex 中的智能體編碼進(jìn)行了進(jìn)一步優(yōu)化,包括通過上下文壓縮改進(jìn)長期工作。GPT-5.2-Codex 在重構(gòu)和遷移等大型代碼變更中表現(xiàn)更佳,在 Windows 環(huán)境下性能更優(yōu),同時網(wǎng)絡(luò)安全能力也顯著增強(qiáng)。

與 GPT-5.2 相比,5.2-Codex 在編碼任務(wù)的詞元效率方面也有顯著提升,尤其是在中等和高推理水平下。據(jù)稱,它已迅速成為 Codex 團(tuán)隊(duì)成員的日常主力工具。

新模型的發(fā)布獲得了人們的普遍關(guān)注。在開發(fā)者社區(qū)人們認(rèn)為,如果說 Claude Code 擅長「原始代碼」,那么 Codex/GPT5.x 在仔細(xì)、系統(tǒng)地查找「問題」(無論是代碼問題還是數(shù)學(xué)問題)方面則是無可匹敵的。

雖然新版本的 GPT 模型需要運(yùn)行更長時間,但是它的智能程度令人驚訝。新模型終于具備了推動優(yōu)秀設(shè)計(jì)的空間推理能力。



GPT-5.2-Codex 生成的內(nèi)容。

已經(jīng)有很多人開始認(rèn)同使用 Claude Code 寫代碼,同時用 Codex 來做代碼審查,讓后者分析流程和發(fā)現(xiàn)細(xì)微 bug 的工作方式。此外也有人表示 Codex 能帶來的一個意想不到的幫助是克服拖延癥:如果面對一項(xiàng)艱巨的任務(wù),卻不知從何下手,這時不妨把任務(wù)發(fā)給 Codex,它或許無法給出完美的答案,但幾乎總能提供一個不錯的起點(diǎn),讓你快速迭代改進(jìn)。

隨著模型能力的不斷進(jìn)步,研究人員觀察到這些提升正轉(zhuǎn)化為網(wǎng)絡(luò)安全等專業(yè)領(lǐng)域能力的突破。就在上周,一位使用 GPT-5.1-Codex-Max 和 Codex CLI 的安全研究人員發(fā)現(xiàn)并負(fù)責(zé)任地披露了 React 中存在一個可能導(dǎo)致源代碼泄露的漏洞。

GPT-5.2-Codex 的網(wǎng)絡(luò)安全能力比 OpenAI 迄今為止發(fā)布的任何模型都更強(qiáng)大。這些進(jìn)步有助于大規(guī)模加強(qiáng)網(wǎng)絡(luò)安全,但也帶來了新的兩用風(fēng)險(xiǎn),需要謹(jǐn)慎部署。雖然 GPT-5.2-Codex 在 OpenAI 內(nèi)部的「準(zhǔn)備框架」中尚未達(dá)到「高」網(wǎng)絡(luò)安全能力級別,但在設(shè)計(jì)部署方案時已考慮到了未來能力的提升。

GPT-5.2-Codex 已面向付費(fèi) ChatGPT 用戶在所有 Codex 平臺上開放,OpenAI 計(jì)劃在未來幾周內(nèi)向 API 用戶開放 GPT-5.2-Codex 的訪問權(quán)限。與此同時,OpenAI 正在試點(diǎn)僅限受邀用戶訪問即將推出的功能,并為經(jīng)過審核的專業(yè)人士和專注于防御性網(wǎng)絡(luò)安全工作的組織提供更寬松的訪問權(quán)限模式。

OpenAI 介紹說,GPT-5.2-Codex 融合了 GPT-5.2 在專業(yè)知識處理方面的優(yōu)勢以及 GPT-5.1-Codex-Max 在智能體編碼和終端使用方面的前沿能力。GPT-5.2-Codex 在長上下文理解、可靠的工具調(diào)用、事實(shí)準(zhǔn)確性和原生壓縮方面表現(xiàn)更佳,使其成為長時間編碼任務(wù)更可靠的伙伴,同時保持了推理的詞元效率。

GPT-5.2-Codex 在 SWE-Bench Pro 和 Terminal-Bench 2.0 基準(zhǔn)測試中取得了最先進(jìn)的性能(SOTA),這兩個基準(zhǔn)測試旨在評估智能體程序在真實(shí)終端環(huán)境下執(zhí)行各種任務(wù)的性能。此外,它在原生 Windows 環(huán)境下的智能體程序編碼方面也更加高效可靠,并在此基礎(chǔ)上進(jìn)一步增強(qiáng)了 GPT-5.1-Codex-Max 所引入的功能。

經(jīng)過這些改進(jìn),Codex 能夠更高效地處理大型代碼庫,即使在長時間會話中也能保持完整的上下文信息。它能夠更可靠地完成復(fù)雜的任務(wù),例如大型重構(gòu)、代碼遷移和功能構(gòu)建 —— 即使計(jì)劃有變或嘗試失敗,也能持續(xù)迭代而不丟失進(jìn)度。



在 SWE-Bench Pro 中,模型會被賦予一個代碼庫,要求 AI 生成一個補(bǔ)丁來解決一個實(shí)際的軟件工程任務(wù)。Terminal -Bench 2.0 是一個用于在真實(shí)終端環(huán)境中測試 AI 智能體的基準(zhǔn)測試工具。任務(wù)包括編譯代碼、訓(xùn)練模型和搭建服務(wù)器。

更強(qiáng)大的視覺性能使 GPT-5.2-Codex 能夠更準(zhǔn)確地解釋編碼過程中共享的屏幕截圖、技術(shù)圖表、圖表和 UI 界面。

Codex 可以快速將設(shè)計(jì)稿轉(zhuǎn)化為功能原型,開發(fā)者可以與 Codex 配合使用這些原型進(jìn)行生產(chǎn)。

設(shè)計(jì)原型:



由 GPT-5.2-Codex 生成的原型:



在繪制核心網(wǎng)絡(luò)安全評估指標(biāo)的長期性能圖表時,OpenAI 發(fā)現(xiàn),從 GPT-5-Codex 開始,能力出現(xiàn)了顯著提升;GPT-5.1-Codex-Max 又實(shí)現(xiàn)了大幅提升;而 GPT-5.2-Codex 則帶來了第三次飛躍。OpenAI 預(yù)計(jì),即將推出的 AI 模型將繼續(xù)保持這一發(fā)展趨勢。

為此,OpenAI 正在按照每個新模型都能達(dá)到「高」網(wǎng)絡(luò)安全能力水平的標(biāo)準(zhǔn)進(jìn)行規(guī)劃和評估,該能力水平由準(zhǔn)備框架進(jìn)行衡量。



專業(yè)奪旗賽 (CTF) 評估衡量模型在 Linux 環(huán)境下解決高級、多步驟真實(shí)世界挑戰(zhàn)(需要專業(yè)級網(wǎng)絡(luò)安全技能)的頻率。

現(xiàn)代社會依賴軟件運(yùn)行,而其可靠性取決于強(qiáng)大的網(wǎng)絡(luò)安全 —— 保障銀行、醫(yī)療、通信和基本服務(wù)等關(guān)鍵系統(tǒng)的在線運(yùn)行,保護(hù)敏感數(shù)據(jù),并確保人們可以信賴他們每天使用的軟件。漏洞可能在人們意識到之前就已存在,而發(fā)現(xiàn)、驗(yàn)證和修復(fù)這些漏洞通常需要一支由工程師和獨(dú)立安全研究人員組成的團(tuán)隊(duì),他們必須配備合適的工具。

2025 年 12 月 11 日,React 團(tuán)隊(duì)公布了三個影響使用 React 服務(wù)器組件構(gòu)建的應(yīng)用程序的安全漏洞。此次披露之所以引人注目,不僅在于漏洞本身,還在于漏洞的發(fā)現(xiàn)方式。

Privy(Stripe 旗下公司)的首席安全工程師 Andrew MacPherson 使用 GPT-5.1-Codex-Max、Codex CLI 和其他編碼代理來重現(xiàn)和研究前一周披露的另一個嚴(yán)重的 React 漏洞,即 React2Shell。他的目標(biāo)是評估該模型在多大程度上能夠幫助進(jìn)行現(xiàn)實(shí)世界的脆弱性研究。

他最初嘗試了幾次零樣本分析,讓模型檢查補(bǔ)丁并識別其修復(fù)的漏洞。當(dāng)這種方法沒有結(jié)果時,他轉(zhuǎn)而采用更大容量的迭代式提示方法。當(dāng)這些方法仍然失敗后,他指導(dǎo) Codex 完成了標(biāo)準(zhǔn)的防御安全工作流程 —— 搭建本地測試環(huán)境、分析潛在的攻擊面,并使用模糊測試向系統(tǒng)發(fā)送畸形輸入進(jìn)行探測。在嘗試重現(xiàn)最初的 React2Shell 問題時,Codex 發(fā)現(xiàn)了一些意料之外的行為,需要進(jìn)行更深入的調(diào)查。在短短一周內(nèi),這一過程發(fā)現(xiàn)了之前未知的漏洞,并已將其披露給 React 團(tuán)隊(duì)。



這表明,先進(jìn)的人工智能系統(tǒng)能夠顯著加快實(shí)際軟件的防御安全工作。與此同時,幫助防御者更快行動的能力也可能被不法分子濫用。

隨著智能體系統(tǒng)在網(wǎng)絡(luò)安全相關(guān)任務(wù)中的能力不斷增強(qiáng),OpenAI 正在把負(fù)責(zé)任的部署作為一項(xiàng)核心優(yōu)先事項(xiàng) —— 將能力的每一次提升與更強(qiáng)大的安全措施、更嚴(yán)格的訪問控制以及與安全社區(qū)的持續(xù)合作相結(jié)合。

參考內(nèi)容:

https://openai.com/index/introducing-gpt-5-2-codex/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中方升級反制,日重要人物收到制裁通知,不到24小時,日4字回應(yīng)

中方升級反制,日重要人物收到制裁通知,不到24小時,日4字回應(yīng)

非凡觀點(diǎn)
2025-12-20 10:39:08
央視曝光,日本策劃“太空珍珠港”事件,或威脅北斗衛(wèi)星系統(tǒng)

央視曝光,日本策劃“太空珍珠港”事件,或威脅北斗衛(wèi)星系統(tǒng)

非凡觀點(diǎn)
2025-12-19 10:17:00
傅作義拎著三斤黃金去面見毛澤東,主席說:“金子你拿回去,槍交出來!”

傅作義拎著三斤黃金去面見毛澤東,主席說:“金子你拿回去,槍交出來!”

老杉說歷史
2025-12-17 19:19:12
日本大阪府發(fā)生集體食物中毒事件

日本大阪府發(fā)生集體食物中毒事件

界面新聞
2025-12-20 12:28:53
善惡終有報(bào)!拿下冠軍的張本智和,做夢也想不到,日媒居然這么做

善惡終有報(bào)!拿下冠軍的張本智和,做夢也想不到,日媒居然這么做

簡讀視覺
2025-12-19 20:18:39
羽毛球總決賽:女單決賽席位出爐!安洗瑩2:0世界冠軍山口茜

羽毛球總決賽:女單決賽席位出爐!安洗瑩2:0世界冠軍山口茜

國乒二三事
2025-12-20 10:24:27
與王昶同框畫面曝光,錢天一徹底掉出國家隊(duì)名單!

與王昶同框畫面曝光,錢天一徹底掉出國家隊(duì)名單!

最愛乒乓球
2025-12-20 00:05:04
攜程與柬埔寨合作惹眾怒,利潤率高得嚇人

攜程與柬埔寨合作惹眾怒,利潤率高得嚇人

上峰視點(diǎn)
2025-12-18 11:41:46
中國人口死亡高峰將至,22年1041萬,23年1100萬

中國人口死亡高峰將至,22年1041萬,23年1100萬

透視到底
2025-12-20 18:52:46
兩名同病房患者同一天手術(shù)體內(nèi)都被遺落鉆頭,醫(yī)院隱瞞數(shù)月

兩名同病房患者同一天手術(shù)體內(nèi)都被遺落鉆頭,醫(yī)院隱瞞數(shù)月

第一財(cái)經(jīng)資訊
2025-12-20 19:34:37
河南美女“大晨”去世,年僅28歲,開的奧迪,喝酒畫面曝光引唏噓

河南美女“大晨”去世,年僅28歲,開的奧迪,喝酒畫面曝光引唏噓

詩意世界
2025-12-17 10:00:03
虞書欣演床戲,咸豬手“揪咪咪”!

虞書欣演床戲,咸豬手“揪咪咪”!

八卦瘋叔
2025-12-19 10:39:27
太頂了!明明什么都沒露,卻性感得要命!

太頂了!明明什么都沒露,卻性感得要命!

貴圈真亂
2025-12-20 12:02:06
嚴(yán)嵩父子為啥非要跟裕王死磕?真不怕他日后登基秋后算賬?

嚴(yán)嵩父子為啥非要跟裕王死磕?真不怕他日后登基秋后算賬?

呂醿極限手工
2025-12-18 19:03:45
許利民:曾凡博明天會跟隊(duì)前往客場合練,手續(xù)完畢第一時間登場

許利民:曾凡博明天會跟隊(duì)前往客場合練,手續(xù)完畢第一時間登場

懂球帝
2025-12-20 22:17:52
弱冷空氣南下影響廣東,明起氣溫小幅下降!全省大部多云間晴

弱冷空氣南下影響廣東,明起氣溫小幅下降!全省大部多云間晴

南方都市報(bào)
2025-12-20 11:46:04
連場轟20+!中國女籃26歲2米王牌閃耀:升聯(lián)盟第2,宮帥招她嗎?

連場轟20+!中國女籃26歲2米王牌閃耀:升聯(lián)盟第2,宮帥招她嗎?

李喜林籃球絕殺
2025-12-20 16:09:28
中日如果再開戰(zhàn),4小時之內(nèi)消滅它?張召忠一句話驚呆全場!?

中日如果再開戰(zhàn),4小時之內(nèi)消滅它?張召忠一句話驚呆全場!?

普覽
2025-11-27 20:27:33
荒誕!小洛熙尸檢公布:無手術(shù)指征!因血流干而死!

荒誕!小洛熙尸檢公布:無手術(shù)指征!因血流干而死!

東莞潮事兒
2025-12-20 20:46:58
余華:我為什么討厭魯迅 (深度好文)

余華:我為什么討厭魯迅 (深度好文)

尚曦讀史
2025-11-28 09:51:13
2025-12-20 23:24:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11957文章數(shù) 142514關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

美方最新表態(tài):不會強(qiáng)迫烏克蘭接受協(xié)議

頭條要聞

美方最新表態(tài):不會強(qiáng)迫烏克蘭接受協(xié)議

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

2026央視跨年晚會陣容曝光,豪華陣仗

財(cái)經(jīng)要聞

求解“地方財(cái)政困難”

汽車要聞

嵐圖推進(jìn)L3量產(chǎn)測試 已完成11萬公里實(shí)際道路驗(yàn)證

態(tài)度原創(chuàng)

旅游
健康
教育
本地
數(shù)碼

旅游要聞

虹口新春“五必”榜單來啦!一季度“樂購樂游”攻略輕松拿捏!

這些新療法,讓化療不再那么痛苦

教育要聞

建鄴教育:全區(qū)中考連續(xù)19年超市均分,三所學(xué)校高考成績再攀新高

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

數(shù)碼要聞

50歲了!長虹第一臺彩電入駐中國國家博物館

無障礙瀏覽 進(jìn)入關(guān)懷版