国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI最強代碼模型GPT-5.2-Codex上線

0
分享至



編輯|澤南

周五凌晨,OpenAI 發(fā)布 GPT-5.2-Codex,這是迄今為止最先進(jìn)的智能體編碼模型,專為復(fù)雜的實際軟件工程而設(shè)計。



GPT-5.2-Codex 是 GPT-5.2 的升級版本,提高了指令遵循能力、對長遠(yuǎn)語境的理解能力,它針對 Codex 中的智能體編碼進(jìn)行了進(jìn)一步優(yōu)化,包括通過上下文壓縮改進(jìn)長期工作。GPT-5.2-Codex 在重構(gòu)和遷移等大型代碼變更中表現(xiàn)更佳,在 Windows 環(huán)境下性能更優(yōu),同時網(wǎng)絡(luò)安全能力也顯著增強。

與 GPT-5.2 相比,5.2-Codex 在編碼任務(wù)的詞元效率方面也有顯著提升,尤其是在中等和高推理水平下。據(jù)稱,它已迅速成為 Codex 團隊成員的日常主力工具。

新模型的發(fā)布獲得了人們的普遍關(guān)注。在開發(fā)者社區(qū)人們認(rèn)為,如果說 Claude Code 擅長「原始代碼」,那么 Codex/GPT5.x 在仔細(xì)、系統(tǒng)地查找「問題」(無論是代碼問題還是數(shù)學(xué)問題)方面則是無可匹敵的。

雖然新版本的 GPT 模型需要運行更長時間,但是它的智能程度令人驚訝。新模型終于具備了推動優(yōu)秀設(shè)計的空間推理能力。



GPT-5.2-Codex 生成的內(nèi)容。

已經(jīng)有很多人開始認(rèn)同使用 Claude Code 寫代碼,同時用 Codex 來做代碼審查,讓后者分析流程和發(fā)現(xiàn)細(xì)微 bug 的工作方式。此外也有人表示 Codex 能帶來的一個意想不到的幫助是克服拖延癥:如果面對一項艱巨的任務(wù),卻不知從何下手,這時不妨把任務(wù)發(fā)給 Codex,它或許無法給出完美的答案,但幾乎總能提供一個不錯的起點,讓你快速迭代改進(jìn)。

隨著模型能力的不斷進(jìn)步,研究人員觀察到這些提升正轉(zhuǎn)化為網(wǎng)絡(luò)安全等專業(yè)領(lǐng)域能力的突破。就在上周,一位使用 GPT-5.1-Codex-Max 和 Codex CLI 的安全研究人員發(fā)現(xiàn)并負(fù)責(zé)任地披露了 React 中存在一個可能導(dǎo)致源代碼泄露的漏洞。

GPT-5.2-Codex 的網(wǎng)絡(luò)安全能力比 OpenAI 迄今為止發(fā)布的任何模型都更強大。這些進(jìn)步有助于大規(guī)模加強網(wǎng)絡(luò)安全,但也帶來了新的兩用風(fēng)險,需要謹(jǐn)慎部署。雖然 GPT-5.2-Codex 在 OpenAI 內(nèi)部的「準(zhǔn)備框架」中尚未達(dá)到「高」網(wǎng)絡(luò)安全能力級別,但在設(shè)計部署方案時已考慮到了未來能力的提升。

GPT-5.2-Codex 已面向付費 ChatGPT 用戶在所有 Codex 平臺上開放,OpenAI 計劃在未來幾周內(nèi)向 API 用戶開放 GPT-5.2-Codex 的訪問權(quán)限。與此同時,OpenAI 正在試點僅限受邀用戶訪問即將推出的功能,并為經(jīng)過審核的專業(yè)人士和專注于防御性網(wǎng)絡(luò)安全工作的組織提供更寬松的訪問權(quán)限模式。

OpenAI 介紹說,GPT-5.2-Codex 融合了 GPT-5.2 在專業(yè)知識處理方面的優(yōu)勢以及 GPT-5.1-Codex-Max 在智能體編碼和終端使用方面的前沿能力。GPT-5.2-Codex 在長上下文理解、可靠的工具調(diào)用、事實準(zhǔn)確性和原生壓縮方面表現(xiàn)更佳,使其成為長時間編碼任務(wù)更可靠的伙伴,同時保持了推理的詞元效率。

GPT-5.2-Codex 在 SWE-Bench Pro 和 Terminal-Bench 2.0 基準(zhǔn)測試中取得了最先進(jìn)的性能(SOTA),這兩個基準(zhǔn)測試旨在評估智能體程序在真實終端環(huán)境下執(zhí)行各種任務(wù)的性能。此外,它在原生 Windows 環(huán)境下的智能體程序編碼方面也更加高效可靠,并在此基礎(chǔ)上進(jìn)一步增強了 GPT-5.1-Codex-Max 所引入的功能。

經(jīng)過這些改進(jìn),Codex 能夠更高效地處理大型代碼庫,即使在長時間會話中也能保持完整的上下文信息。它能夠更可靠地完成復(fù)雜的任務(wù),例如大型重構(gòu)、代碼遷移和功能構(gòu)建 —— 即使計劃有變或嘗試失敗,也能持續(xù)迭代而不丟失進(jìn)度。



在 SWE-Bench Pro 中,模型會被賦予一個代碼庫,要求 AI 生成一個補丁來解決一個實際的軟件工程任務(wù)。Terminal -Bench 2.0 是一個用于在真實終端環(huán)境中測試 AI 智能體的基準(zhǔn)測試工具。任務(wù)包括編譯代碼、訓(xùn)練模型和搭建服務(wù)器。

更強大的視覺性能使 GPT-5.2-Codex 能夠更準(zhǔn)確地解釋編碼過程中共享的屏幕截圖、技術(shù)圖表、圖表和 UI 界面。

Codex 可以快速將設(shè)計稿轉(zhuǎn)化為功能原型,開發(fā)者可以與 Codex 配合使用這些原型進(jìn)行生產(chǎn)。

設(shè)計原型:



由 GPT-5.2-Codex 生成的原型:



在繪制核心網(wǎng)絡(luò)安全評估指標(biāo)的長期性能圖表時,OpenAI 發(fā)現(xiàn),從 GPT-5-Codex 開始,能力出現(xiàn)了顯著提升;GPT-5.1-Codex-Max 又實現(xiàn)了大幅提升;而 GPT-5.2-Codex 則帶來了第三次飛躍。OpenAI 預(yù)計,即將推出的 AI 模型將繼續(xù)保持這一發(fā)展趨勢。

為此,OpenAI 正在按照每個新模型都能達(dá)到「高」網(wǎng)絡(luò)安全能力水平的標(biāo)準(zhǔn)進(jìn)行規(guī)劃和評估,該能力水平由準(zhǔn)備框架進(jìn)行衡量。



專業(yè)奪旗賽 (CTF) 評估衡量模型在 Linux 環(huán)境下解決高級、多步驟真實世界挑戰(zhàn)(需要專業(yè)級網(wǎng)絡(luò)安全技能)的頻率。

現(xiàn)代社會依賴軟件運行,而其可靠性取決于強大的網(wǎng)絡(luò)安全 —— 保障銀行、醫(yī)療、通信和基本服務(wù)等關(guān)鍵系統(tǒng)的在線運行,保護敏感數(shù)據(jù),并確保人們可以信賴他們每天使用的軟件。漏洞可能在人們意識到之前就已存在,而發(fā)現(xiàn)、驗證和修復(fù)這些漏洞通常需要一支由工程師和獨立安全研究人員組成的團隊,他們必須配備合適的工具。

2025 年 12 月 11 日,React 團隊公布了三個影響使用 React 服務(wù)器組件構(gòu)建的應(yīng)用程序的安全漏洞。此次披露之所以引人注目,不僅在于漏洞本身,還在于漏洞的發(fā)現(xiàn)方式。

Privy(Stripe 旗下公司)的首席安全工程師 Andrew MacPherson 使用 GPT-5.1-Codex-Max、Codex CLI 和其他編碼代理來重現(xiàn)和研究前一周披露的另一個嚴(yán)重的 React 漏洞,即 React2Shell。他的目標(biāo)是評估該模型在多大程度上能夠幫助進(jìn)行現(xiàn)實世界的脆弱性研究。

他最初嘗試了幾次零樣本分析,讓模型檢查補丁并識別其修復(fù)的漏洞。當(dāng)這種方法沒有結(jié)果時,他轉(zhuǎn)而采用更大容量的迭代式提示方法。當(dāng)這些方法仍然失敗后,他指導(dǎo) Codex 完成了標(biāo)準(zhǔn)的防御安全工作流程 —— 搭建本地測試環(huán)境、分析潛在的攻擊面,并使用模糊測試向系統(tǒng)發(fā)送畸形輸入進(jìn)行探測。在嘗試重現(xiàn)最初的 React2Shell 問題時,Codex 發(fā)現(xiàn)了一些意料之外的行為,需要進(jìn)行更深入的調(diào)查。在短短一周內(nèi),這一過程發(fā)現(xiàn)了之前未知的漏洞,并已將其披露給 React 團隊。



這表明,先進(jìn)的人工智能系統(tǒng)能夠顯著加快實際軟件的防御安全工作。與此同時,幫助防御者更快行動的能力也可能被不法分子濫用。

隨著智能體系統(tǒng)在網(wǎng)絡(luò)安全相關(guān)任務(wù)中的能力不斷增強,OpenAI 正在把負(fù)責(zé)任的部署作為一項核心優(yōu)先事項 —— 將能力的每一次提升與更強大的安全措施、更嚴(yán)格的訪問控制以及與安全社區(qū)的持續(xù)合作相結(jié)合。

參考內(nèi)容:

https://openai.com/index/introducing-gpt-5-2-codex/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
1-1大冷!中國隊逼平韓國隊,末輪贏球=擺脫倒數(shù)第一

1-1大冷!中國隊逼平韓國隊,末輪贏球=擺脫倒數(shù)第一

何老師呀
2025-12-20 16:36:13
波蘭總統(tǒng)當(dāng)面向澤連斯基“發(fā)難”:烏克蘭人不知感激

波蘭總統(tǒng)當(dāng)面向澤連斯基“發(fā)難”:烏克蘭人不知感激

參考消息
2025-12-20 21:25:31
彈劾賴清德網(wǎng)絡(luò)連署破600萬,郭正亮:臺北反賴就超過6成

彈劾賴清德網(wǎng)絡(luò)連署破600萬,郭正亮:臺北反賴就超過6成

海峽導(dǎo)報社
2025-12-20 13:28:03
大風(fēng)追蹤 | 27歲海歸女子家中遇害第555天后一審宣判,兇手犯故意殺人罪判死緩,遇害女子母親:將申請抗訴

大風(fēng)追蹤 | 27歲海歸女子家中遇害第555天后一審宣判,兇手犯故意殺人罪判死緩,遇害女子母親:將申請抗訴

大風(fēng)新聞
2025-12-20 15:53:02
清華大學(xué)最新研究:補充這種維生素,竟能重啟抗癌T細(xì)胞,顯著抑制腫瘤生長

清華大學(xué)最新研究:補充這種維生素,竟能重啟抗癌T細(xì)胞,顯著抑制腫瘤生長

醫(yī)諾維
2025-12-20 12:47:12
高盛:未來2年房價或再跌10-30%  警告可能出現(xiàn)房價負(fù)反饋循環(huán)

高盛:未來2年房價或再跌10-30% 警告可能出現(xiàn)房價負(fù)反饋循環(huán)

財富情報局
2025-12-19 23:06:25
李平康:戴琳已經(jīng)在今天將欠潘碩的錢還清,還多給了5000多

李平康:戴琳已經(jīng)在今天將欠潘碩的錢還清,還多給了5000多

懂球帝
2025-12-20 21:14:12
深圳“日入過萬”烤雞少年塌房了!獨家配方居然是用了“肉寶王”

深圳“日入過萬”烤雞少年塌房了!獨家配方居然是用了“肉寶王”

火山詩話
2025-12-20 10:25:37
南博事件升級!關(guān)鍵人物挖出,徐前院長使出“苦肉計”確實尷尬…

南博事件升級!關(guān)鍵人物挖出,徐前院長使出“苦肉計”確實尷尬…

火山詩話
2025-12-20 16:28:41
愛潑斯坦惡魔島重磅照片全公開!首曝各國名流權(quán)貴玩樂畫面,受害者多達(dá)1200人?

愛潑斯坦惡魔島重磅照片全公開!首曝各國名流權(quán)貴玩樂畫面,受害者多達(dá)1200人?

英國報姐
2025-12-20 21:08:42
中央戲劇學(xué)院院長郝戎被查,劉燁、章子怡、靳東等為其學(xué)生,曾搭檔王志文、李冰冰演電視劇,被稱"明星導(dǎo)師"

中央戲劇學(xué)院院長郝戎被查,劉燁、章子怡、靳東等為其學(xué)生,曾搭檔王志文、李冰冰演電視劇,被稱"明星導(dǎo)師"

大風(fēng)新聞
2025-12-19 11:54:20
咸魚還是太全面了,怪不得人稱國內(nèi)黑市

咸魚還是太全面了,怪不得人稱國內(nèi)黑市

另子維愛讀史
2025-12-20 17:07:20
孫儷接送女兒上學(xué),女兒簡直跟她共用一張臉,不得不說基因真強大

孫儷接送女兒上學(xué),女兒簡直跟她共用一張臉,不得不說基因真強大

鄉(xiāng)野小珥
2025-12-20 14:03:24
【觀察】給聯(lián)盟打樣!森林狼獻(xiàn)祭流打法逼出雷霆硬傷

【觀察】給聯(lián)盟打樣!森林狼獻(xiàn)祭流打法逼出雷霆硬傷

體壇周報
2025-12-20 16:46:36
寧波大學(xué)附屬婦女兒童醫(yī)院就患兒部分尸檢報告發(fā)布情況說明

寧波大學(xué)附屬婦女兒童醫(yī)院就患兒部分尸檢報告發(fā)布情況說明

澎湃新聞
2025-12-20 21:18:12
向高市早苗示好不到24小時,張本底細(xì)被扒,父母的黑歷史也被翻出

向高市早苗示好不到24小時,張本底細(xì)被扒,父母的黑歷史也被翻出

天天熱點見聞
2025-12-20 06:08:30
火力全開擊潰世界第二!石宇奇2-0昆拉武特,劍指賽季單打第六冠

火力全開擊潰世界第二!石宇奇2-0昆拉武特,劍指賽季單打第六冠

釘釘陌上花開
2025-12-20 20:43:24
28年前直播香港回歸4位主持人,2人去世1人墮落,僅一人順利退休

28年前直播香港回歸4位主持人,2人去世1人墮落,僅一人順利退休

小熊侃史
2025-12-19 11:04:51
泰方點名調(diào)查柬“生命研究中心”,湘雅醫(yī)院火速撇清:從未合作

泰方點名調(diào)查柬“生命研究中心”,湘雅醫(yī)院火速撇清:從未合作

胡嚴(yán)亂語
2025-12-20 16:13:32
“冬天冷不冷,就看冬至”,明日冬至,冬天到底有多冷?答案來了

“冬天冷不冷,就看冬至”,明日冬至,冬天到底有多冷?答案來了

阿龍美食記
2025-12-20 03:58:15
2025-12-20 23:40:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11957文章數(shù) 142514關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

印度官員:若"臺灣有事" 印度不太可能像西方那樣回應(yīng)

頭條要聞

印度官員:若"臺灣有事" 印度不太可能像西方那樣回應(yīng)

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

2026央視跨年晚會陣容曝光,豪華陣仗

財經(jīng)要聞

求解“地方財政困難”

汽車要聞

嵐圖推進(jìn)L3量產(chǎn)測試 已完成11萬公里實際道路驗證

態(tài)度原創(chuàng)

游戲
本地
數(shù)碼
手機
公開課

新勞拉·克勞馥演員回憶《完美黑暗》項目取消經(jīng)歷

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

數(shù)碼要聞

50歲了!長虹第一臺彩電入駐中國國家博物館

手機要聞

OPPO Reno 15 Pro Mini參數(shù)曝光:天璣8450+1.5K高刷小直屏

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版