国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

強化AI編程能力迎戰(zhàn)谷歌!OpenAI發(fā)布GPT-5.2-Codex,軟件工程和網(wǎng)安一把抓

0
分享至

在發(fā)布GPT-5.2系列模型一周后,OpenAI再次出手,美東時間18日周四推出基于GPT-5.2的新一代Codex模型GPT-5.2-Codex,號稱最先進的智能體編碼模型,聚焦專業(yè)軟件工程和防御性網(wǎng)絡(luò)安全,進一步鞏固其在AI編程領(lǐng)域?qū)雀鐶emini的競爭優(yōu)勢。

OpenAI介紹,GPT-5.2-Codex在編碼性能、網(wǎng)絡(luò)安全能力和長周期任務(wù)處理上均實現(xiàn)突破。GPT-5.2-Codex在SWE-Bench Pro測試中準(zhǔn)確率達到56.4%,在Terminal-Bench 2.0測試中達到64.0%,刷新兩項基準(zhǔn)測試紀(jì)錄。該模型已于發(fā)布當(dāng)天在所有Codex界面向付費ChatGPT用戶開放,API用戶接入正在推進中。

OpenAI特別強調(diào)GPT-5.2-Codex在網(wǎng)絡(luò)安全方面的顯著提升。CEO Sam Altman提到,本月早些時候,一名安全研究人員使用上一代模型GPT-5.1-Codex-Max就發(fā)現(xiàn)并負(fù)責(zé)任地披露了React中可能導(dǎo)致源代碼暴露的漏洞。OpenAI方面認(rèn)為,新模型尚未達到"高"級別網(wǎng)絡(luò)安全能力,但公司正在為未來模型跨越這一門檻做準(zhǔn)備。

OpenAI表示,GPT-5.2-Codex周四當(dāng)天在所有Codex界面向付費ChatGPT用戶發(fā)布,正在努力在未來幾周內(nèi)安全地為API用戶啟用訪問。該司計劃通過逐步推出、部署與保護措施相結(jié)合以及與安全社區(qū)密切合作的方式,在最大化防御影響的同時降低濫用風(fēng)險。

本周四的發(fā)布延續(xù)了OpenAI在AI編程領(lǐng)域的進攻態(tài)勢。

上周發(fā)布GPT-5.2時,OpenAI就援引編碼初創(chuàng)公司的用戶體驗稱,該模型擁有“最先進的智能體編碼性能”,還披露GPT-5.2的Thinking版本在SWE編碼能力測試中創(chuàng)下歷史最高分,成為OpenAI首個性能達到或超過人類專家水平的模型。此舉被視為對谷歌Gemini 3在編碼和推理能力上獲得好評的直接回應(yīng)。

編碼性能再升級,針對大規(guī)模實戰(zhàn)場景優(yōu)化

GPT-5.2-Codex是GPT-5.2的優(yōu)化版本,專門針對Codex中的智能體編碼進行了強化。OpenAI表示,新模型在三個關(guān)鍵領(lǐng)域?qū)崿F(xiàn)改進:通過上下文壓縮提升長周期工作能力,在重構(gòu)和遷移等項目級任務(wù)上表現(xiàn)更強,以及在Windows環(huán)境中性能改善。

在基準(zhǔn)測試中,GPT-5.2-Codex在SWE-Bench Pro測試中準(zhǔn)確率達到56.4%,高于GPT-5.2的55.6%和GPT-5.1的50.8%。在Terminal-Bench 2.0測試中,GPT-5.2-Codex準(zhǔn)確率為64.0%,GPT-5.2為62.2%,GPT-5.1為58.1%。SWE-Bench Pro要求模型在給定代碼庫中生成補丁以解決實際軟件工程任務(wù),Terminal-Bench 2.0則測試AI智能體在真實終端環(huán)境中完成編譯代碼、訓(xùn)練模型和設(shè)置服務(wù)器等任務(wù)的能力。


GPT-5.2-Codex在長上下文理解、可靠的工具調(diào)用、改進的真實性和原生壓縮方面均有提升,使其成為長時間編碼任務(wù)中更可靠的合作伙伴,同時在推理過程中保持token效率。更強的視覺性能使GPT-5.2-Codex能夠更準(zhǔn)確地解讀屏幕截圖、技術(shù)圖表和用戶界面,可以將設(shè)計稿快速轉(zhuǎn)化為功能原型。


OpenAI表示,憑借這些改進,Codex能夠在大型代碼庫中進行長時間工作,保持完整上下文,更可靠地完成大規(guī)模重構(gòu)、代碼遷移和功能構(gòu)建等復(fù)雜任務(wù),即使計劃改變或嘗試失敗也不會失去追蹤。

網(wǎng)絡(luò)安全能力大幅躍升,為跨越"高"級別門檻做準(zhǔn)備

網(wǎng)絡(luò)安全成為GPT-5.2-Codex的另一個重點突破領(lǐng)域。OpenAI在核心網(wǎng)絡(luò)安全評估中觀察到,從GPT-5-Codex開始能力出現(xiàn)急劇跳躍,GPT-5.1-Codex-Max又實現(xiàn)一次大幅提升,如今GPT-5.2-Codex完成第三次跳躍。

在專業(yè)奪旗賽評估中,GPT-5.2-Codex展現(xiàn)出解決需要專業(yè)級網(wǎng)絡(luò)安全技能的高級多步驟真實挑戰(zhàn)的能力。據(jù)OpenAI的準(zhǔn)備框架評估,GPT-5.2-Codex雖然尚未達到"高"級別網(wǎng)絡(luò)安全能力,但該公司預(yù)計未來AI模型將繼續(xù)沿著這一軌跡發(fā)展,正在按照每個新模型都可能達到"高"級別的標(biāo)準(zhǔn)進行規(guī)劃和評估。

一個真實案例凸顯了新模型的防御性網(wǎng)絡(luò)安全潛力。12月11日,React團隊公布了三個影響使用React服務(wù)器組件構(gòu)建的應(yīng)用程序的安全漏洞。Stripe旗下Privy公司首席安全工程師Andrew MacPherson在使用GPT-5.1-Codex-Max與Codex CLI研究另一個名為React2Shell的嚴(yán)重漏洞時,通過引導(dǎo)Codex執(zhí)行標(biāo)準(zhǔn)防御性安全工作流程,意外發(fā)現(xiàn)了這些此前未知的漏洞并負(fù)責(zé)任地向React團隊披露。

Altman在社交平臺上披露:“上周,一名使用我們上一代(Codex)模型的安全研究人員發(fā)現(xiàn)并披露了React中可能導(dǎo)致源代碼暴露的漏洞。我相信這些模型對網(wǎng)絡(luò)安全將產(chǎn)生凈收益,但隨著它們的改進,我們正處于'真實影響階段'!


推出可信訪問計劃,為專業(yè)安全人員提供特殊權(quán)限

為平衡能力提升與安全風(fēng)險,OpenAI針對網(wǎng)絡(luò)安全能力的增強在模型層面和產(chǎn)品層面都增加了額外保護措施,包括針對有害任務(wù)和提示注入的專門安全訓(xùn)練、智能體沙箱以及可配置的網(wǎng)絡(luò)訪問。同時,公司正在進行僅限邀請的可信訪問計劃試點。

該計劃最初僅向經(jīng)過審查的安全專業(yè)人員和具有明確專業(yè)網(wǎng)絡(luò)安全用例的組織開放。符合條件的參與者將獲得使用OpenAI最強大模型進行防御性工作的權(quán)限,使其能夠開展合法的雙重用途工作,如漏洞研究或授權(quán)的紅隊測試,同時消除安全團隊在模擬威脅行為者、分析惡意軟件或壓力測試關(guān)鍵基礎(chǔ)設(shè)施時可能遇到的限制。

Altman在X上表示:"我們正在開始探索用于防御性網(wǎng)絡(luò)安全工作的可信訪問計劃。"他還在另一條帖子中為Codex招聘打廣告:"Codex變得極其出色,并將快速改進。如果你想幫助它在明年變得好100倍,團隊正在招人。保證有瘋狂的冒險,成功的可能性很大。"



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
絕了!金卡戴珊C羅般配大體檢,12年過期糖竟笑翻全網(wǎng)

絕了!金卡戴珊C羅般配大體檢,12年過期糖竟笑翻全網(wǎng)

羅氏八卦
2025-12-18 23:13:10
她長得漂亮!演技好,出道30年零緋聞,嫁小丈夫不生孩子也幸福

她長得漂亮!演技好,出道30年零緋聞,嫁小丈夫不生孩子也幸福

巧妹電影
2025-12-19 09:33:54
聰明反被聰明誤!本想為女兒鋪路的李湘,竟意外栽在了何超瓊手里

聰明反被聰明誤!本想為女兒鋪路的李湘,竟意外栽在了何超瓊手里

老吳教育課堂
2025-12-19 02:58:57
1983年嚴(yán)打后,重刑犯都被遣送大西北,最終是什么結(jié)局?

1983年嚴(yán)打后,重刑犯都被遣送大西北,最終是什么結(jié)局?

觀史搜尋著
2025-12-03 22:30:28
《水滸傳》里的“水滸”是什么意思?

《水滸傳》里的“水滸”是什么意思?

國家人文歷史
2025-12-18 15:33:26
最大分裂危機!一旦旁遮普邦獨立成功,印度離“散裝”就不遠了

最大分裂危機!一旦旁遮普邦獨立成功,印度離“散裝”就不遠了

何氽簡史
2025-12-15 23:32:08
李盛青主任:冬季補氣血冠軍!每天喝一碗大補氣血,效果勝阿膠!

李盛青主任:冬季補氣血冠軍!每天喝一碗大補氣血,效果勝阿膠!

大明愛養(yǎng)生
2025-12-18 14:28:25
美媒終于回過味:中國這哪是買石油,分明是在給俄進行“大換血”

美媒終于回過味:中國這哪是買石油,分明是在給俄進行“大換血”

古事尋蹤記
2025-12-19 07:23:52
如果繼續(xù)打下去洪森家族會不會垮掉?

如果繼續(xù)打下去洪森家族會不會垮掉?

北京作家編劇肥豬滿圈
2025-12-17 19:12:31
吳秀波成“老賴”!“國民大叔”如何成了“大輸”?

吳秀波成“老賴”!“國民大叔”如何成了“大輸”?

過了法考的新聞人
2025-12-18 16:09:19
退捐還畫,兩難自解

退捐還畫,兩難自解

呦呦鹿鳴
2025-12-17 16:01:25
廣州,已倒閉餐廳最意難平top1…

廣州,已倒閉餐廳最意難平top1…

廣州生活美食圈
2025-12-18 18:33:19
隨著12月19日的來臨 ,火箭隊傳來三條重磅消息非常值得關(guān)注!

隨著12月19日的來臨 ,火箭隊傳來三條重磅消息非常值得關(guān)注!

田先生籃球
2025-12-19 09:09:02
4000元的迪桑特,被買成了“東北省服”

4000元的迪桑特,被買成了“東北省服”

金角財經(jīng)
2025-12-18 15:55:50
夏洛特公主新照很驚艷!紅裙束發(fā)神似戴安娜,莉莉貝特太可惜了

夏洛特公主新照很驚艷!紅裙束發(fā)神似戴安娜,莉莉貝特太可惜了

大齡女一曉彤
2025-12-19 09:25:16
鄰居把排污管接我院子里,我不爭天天種菖蒲,2月后他主動賠6000

鄰居把排污管接我院子里,我不爭天天種菖蒲,2月后他主動賠6000

卡西莫多的故事
2025-12-16 10:29:36
非法集資911億元,“金融大鱷”盤繼彪終審被判無期!他還犯洗錢、偷越國(邊)境罪等,名下上市公司已被取消上市地位

非法集資911億元,“金融大鱷”盤繼彪終審被判無期!他還犯洗錢、偷越國(邊)境罪等,名下上市公司已被取消上市地位

每日經(jīng)濟新聞
2025-12-19 00:44:55
超強mini!新機官宣:12月19日,正式開售

超強mini!新機官宣:12月19日,正式開售

科技堡壘
2025-12-16 13:34:04
美國拒絕支持?東京爆發(fā)抗議,日本投票結(jié)果公布,高市:愿坐下談

美國拒絕支持?東京爆發(fā)抗議,日本投票結(jié)果公布,高市:愿坐下談

林子說事
2025-12-19 08:03:24
細(xì)思極恐!8800萬捐贈古畫拿去拍賣,3年前該院就有復(fù)制品展出…

細(xì)思極恐!8800萬捐贈古畫拿去拍賣,3年前該院就有復(fù)制品展出…

火山詩話
2025-12-18 05:50:56
2025-12-19 10:28:49
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領(lǐng)先的金融商業(yè)信息提供商
139098文章數(shù) 2651863關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

媒體:南博受贈名畫被鑒偽后撥給文物店 以6800元售出

頭條要聞

媒體:南博受贈名畫被鑒偽后撥給文物店 以6800元售出

體育要聞

紐約尼克斯,板正的球隊

娛樂要聞

絲芭放大招了!實名舉報鞠婧祎經(jīng)濟犯罪

財經(jīng)要聞

尹艷林:呼吁加快2.5億新市民落戶進程

汽車要聞

在零下30℃的考場里 凡爾賽C5 X和508L拿到了"穩(wěn)"的證明

態(tài)度原創(chuàng)

本地
旅游
時尚
公開課
軍事航空

本地新聞

云游安徽|決戰(zhàn)烽火照古今,千秋一脈看宿州

旅游要聞

番茄小鎮(zhèn)的歡樂與承諾(旅人心語)

“煙管褲”今年冬天爆火,怎么搭都時髦!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

福建艦入列后首過臺海 臺方談為何"甲板上沒有艦載機"

無障礙瀏覽 進入關(guān)懷版