国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

強化AI編程能力迎戰(zhàn)谷歌!OpenAI發(fā)布GPT-5.2-Codex,軟件工程和網(wǎng)安一把抓

0
分享至

在發(fā)布GPT-5.2系列模型一周后,OpenAI再次出手,美東時間18日周四推出基于GPT-5.2的新一代Codex模型GPT-5.2-Codex,號稱最先進的智能體編碼模型,聚焦專業(yè)軟件工程和防御性網(wǎng)絡(luò)安全,進一步鞏固其在AI編程領(lǐng)域?qū)雀鐶emini的競爭優(yōu)勢。

OpenAI介紹,GPT-5.2-Codex在編碼性能、網(wǎng)絡(luò)安全能力和長周期任務(wù)處理上均實現(xiàn)突破。GPT-5.2-Codex在SWE-Bench Pro測試中準(zhǔn)確率達(dá)到56.4%,在Terminal-Bench 2.0測試中達(dá)到64.0%,刷新兩項基準(zhǔn)測試紀(jì)錄。該模型已于發(fā)布當(dāng)天在所有Codex界面向付費ChatGPT用戶開放,API用戶接入正在推進中。

OpenAI特別強調(diào)GPT-5.2-Codex在網(wǎng)絡(luò)安全方面的顯著提升。CEO Sam Altman提到,本月早些時候,一名安全研究人員使用上一代模型GPT-5.1-Codex-Max就發(fā)現(xiàn)并負(fù)責(zé)任地披露了React中可能導(dǎo)致源代碼暴露的漏洞。OpenAI方面認(rèn)為,新模型尚未達(dá)到"高"級別網(wǎng)絡(luò)安全能力,但公司正在為未來模型跨越這一門檻做準(zhǔn)備。

OpenAI表示,GPT-5.2-Codex周四當(dāng)天在所有Codex界面向付費ChatGPT用戶發(fā)布,正在努力在未來幾周內(nèi)安全地為API用戶啟用訪問。該司計劃通過逐步推出、部署與保護措施相結(jié)合以及與安全社區(qū)密切合作的方式,在最大化防御影響的同時降低濫用風(fēng)險。

本周四的發(fā)布延續(xù)了OpenAI在AI編程領(lǐng)域的進攻態(tài)勢。

上周發(fā)布GPT-5.2時,OpenAI就援引編碼初創(chuàng)公司的用戶體驗稱,該模型擁有“最先進的智能體編碼性能”,還披露GPT-5.2的Thinking版本在SWE編碼能力測試中創(chuàng)下歷史最高分,成為OpenAI首個性能達(dá)到或超過人類專家水平的模型。此舉被視為對谷歌Gemini 3在編碼和推理能力上獲得好評的直接回應(yīng)。

編碼性能再升級,針對大規(guī)模實戰(zhàn)場景優(yōu)化

GPT-5.2-Codex是GPT-5.2的優(yōu)化版本,專門針對Codex中的智能體編碼進行了強化。OpenAI表示,新模型在三個關(guān)鍵領(lǐng)域?qū)崿F(xiàn)改進:通過上下文壓縮提升長周期工作能力,在重構(gòu)和遷移等項目級任務(wù)上表現(xiàn)更強,以及在Windows環(huán)境中性能改善。

在基準(zhǔn)測試中,GPT-5.2-Codex在SWE-Bench Pro測試中準(zhǔn)確率達(dá)到56.4%,高于GPT-5.2的55.6%和GPT-5.1的50.8%。在Terminal-Bench 2.0測試中,GPT-5.2-Codex準(zhǔn)確率為64.0%,GPT-5.2為62.2%,GPT-5.1為58.1%。SWE-Bench Pro要求模型在給定代碼庫中生成補丁以解決實際軟件工程任務(wù),Terminal-Bench 2.0則測試AI智能體在真實終端環(huán)境中完成編譯代碼、訓(xùn)練模型和設(shè)置服務(wù)器等任務(wù)的能力。


GPT-5.2-Codex在長上下文理解、可靠的工具調(diào)用、改進的真實性和原生壓縮方面均有提升,使其成為長時間編碼任務(wù)中更可靠的合作伙伴,同時在推理過程中保持token效率。更強的視覺性能使GPT-5.2-Codex能夠更準(zhǔn)確地解讀屏幕截圖、技術(shù)圖表和用戶界面,可以將設(shè)計稿快速轉(zhuǎn)化為功能原型。


OpenAI表示,憑借這些改進,Codex能夠在大型代碼庫中進行長時間工作,保持完整上下文,更可靠地完成大規(guī)模重構(gòu)、代碼遷移和功能構(gòu)建等復(fù)雜任務(wù),即使計劃改變或嘗試失敗也不會失去追蹤。

網(wǎng)絡(luò)安全能力大幅躍升,為跨越"高"級別門檻做準(zhǔn)備

網(wǎng)絡(luò)安全成為GPT-5.2-Codex的另一個重點突破領(lǐng)域。OpenAI在核心網(wǎng)絡(luò)安全評估中觀察到,從GPT-5-Codex開始能力出現(xiàn)急劇跳躍,GPT-5.1-Codex-Max又實現(xiàn)一次大幅提升,如今GPT-5.2-Codex完成第三次跳躍。

在專業(yè)奪旗賽評估中,GPT-5.2-Codex展現(xiàn)出解決需要專業(yè)級網(wǎng)絡(luò)安全技能的高級多步驟真實挑戰(zhàn)的能力。據(jù)OpenAI的準(zhǔn)備框架評估,GPT-5.2-Codex雖然尚未達(dá)到"高"級別網(wǎng)絡(luò)安全能力,但該公司預(yù)計未來AI模型將繼續(xù)沿著這一軌跡發(fā)展,正在按照每個新模型都可能達(dá)到"高"級別的標(biāo)準(zhǔn)進行規(guī)劃和評估。

一個真實案例凸顯了新模型的防御性網(wǎng)絡(luò)安全潛力。12月11日,React團隊公布了三個影響使用React服務(wù)器組件構(gòu)建的應(yīng)用程序的安全漏洞。Stripe旗下Privy公司首席安全工程師Andrew MacPherson在使用GPT-5.1-Codex-Max與Codex CLI研究另一個名為React2Shell的嚴(yán)重漏洞時,通過引導(dǎo)Codex執(zhí)行標(biāo)準(zhǔn)防御性安全工作流程,意外發(fā)現(xiàn)了這些此前未知的漏洞并負(fù)責(zé)任地向React團隊披露。

Altman在社交平臺上披露:“上周,一名使用我們上一代(Codex)模型的安全研究人員發(fā)現(xiàn)并披露了React中可能導(dǎo)致源代碼暴露的漏洞。我相信這些模型對網(wǎng)絡(luò)安全將產(chǎn)生凈收益,但隨著它們的改進,我們正處于'真實影響階段'?!?/p>


推出可信訪問計劃,為專業(yè)安全人員提供特殊權(quán)限

為平衡能力提升與安全風(fēng)險,OpenAI針對網(wǎng)絡(luò)安全能力的增強在模型層面和產(chǎn)品層面都增加了額外保護措施,包括針對有害任務(wù)和提示注入的專門安全訓(xùn)練、智能體沙箱以及可配置的網(wǎng)絡(luò)訪問。同時,公司正在進行僅限邀請的可信訪問計劃試點。

該計劃最初僅向經(jīng)過審查的安全專業(yè)人員和具有明確專業(yè)網(wǎng)絡(luò)安全用例的組織開放。符合條件的參與者將獲得使用OpenAI最強大模型進行防御性工作的權(quán)限,使其能夠開展合法的雙重用途工作,如漏洞研究或授權(quán)的紅隊測試,同時消除安全團隊在模擬威脅行為者、分析惡意軟件或壓力測試關(guān)鍵基礎(chǔ)設(shè)施時可能遇到的限制。

Altman在X上表示:"我們正在開始探索用于防御性網(wǎng)絡(luò)安全工作的可信訪問計劃。"他還在另一條帖子中為Codex招聘打廣告:"Codex變得極其出色,并將快速改進。如果你想幫助它在明年變得好100倍,團隊正在招人。保證有瘋狂的冒險,成功的可能性很大。"



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
翁帆新消息傳來,太令人驚喜了

翁帆新消息傳來,太令人驚喜了

深度報
2025-12-18 22:35:44
1976年尼克松重返北京,執(zhí)意要去周總理墓前磕頭,秘書一句話讓他瞬間淚崩

1976年尼克松重返北京,執(zhí)意要去周總理墓前磕頭,秘書一句話讓他瞬間淚崩

史海殘云
2025-12-19 14:26:17
發(fā)生概率70%,死亡人數(shù)可達(dá)1.8萬!日本政府預(yù)測東京都地震情況:火災(zāi)是最大殺手

發(fā)生概率70%,死亡人數(shù)可達(dá)1.8萬!日本政府預(yù)測東京都地震情況:火災(zāi)是最大殺手

紅星新聞
2025-12-20 17:02:14
21號冬至吃餃子,切記:4餡不上桌,福氣不進門,分別指的是什么

21號冬至吃餃子,切記:4餡不上桌,福氣不進門,分別指的是什么

阿龍美食記
2025-12-18 21:23:12
5千川軍被5萬日寇包抄,彈盡糧絕之際,16歲伙夫獻(xiàn)一計

5千川軍被5萬日寇包抄,彈盡糧絕之際,16歲伙夫獻(xiàn)一計

卡西莫多的故事
2025-12-18 10:55:25
時隔1天橫掃變翻車!決勝局15-8被逆轉(zhuǎn),劉圣書/譚寧1-2世界第七

時隔1天橫掃變翻車!決勝局15-8被逆轉(zhuǎn),劉圣書/譚寧1-2世界第七

釘釘陌上花開
2025-12-20 19:43:17
羅永浩炮轟上海電信后終于理解為何運營商要喜歡光貓撥號了

羅永浩炮轟上海電信后終于理解為何運營商要喜歡光貓撥號了

阿纂看事
2025-12-20 10:45:48
槍殺麻省理工教授、制造母校布朗大學(xué)槍案的嫌犯:曾是物理天才,被流浪漢校友舉報

槍殺麻省理工教授、制造母校布朗大學(xué)槍案的嫌犯:曾是物理天才,被流浪漢校友舉報

紅星新聞
2025-12-20 14:14:48
四川一國企原黨委書記被開除黨籍!

四川一國企原黨委書記被開除黨籍!

蘆山生活網(wǎng)
2025-12-20 19:49:38
1984年他一聲令下,把老山幾千噸炮彈當(dāng)水潑,2019年葬禮現(xiàn)場,昔日部下已是軍委副主席,含淚送別這位鐵血師長!

1984年他一聲令下,把老山幾千噸炮彈當(dāng)水潑,2019年葬禮現(xiàn)場,昔日部下已是軍委副主席,含淚送別這位鐵血師長!

史海孤雁
2025-12-17 16:50:24
停飛中國航班,拒絕中國游客,這個在東南亞小國”處處和中國作對

停飛中國航班,拒絕中國游客,這個在東南亞小國”處處和中國作對

南權(quán)先生
2025-12-20 17:01:37
流弊!里夫斯+3首輪簽!美記曝湖人將梭哈超巨

流弊!里夫斯+3首輪簽!美記曝湖人將梭哈超巨

籃球?qū)崙?zhàn)寶典
2025-12-19 23:56:00
明天開始,運勢大爆發(fā)!3生肖前程似錦,財運扎堆來

明天開始,運勢大爆發(fā)!3生肖前程似錦,財運扎堆來

人閒情事
2025-12-20 14:18:21
威金頓大贊廣東隊1人:他個人能力很強,很厲害

威金頓大贊廣東隊1人:他個人能力很強,很厲害

體育哲人
2025-12-20 18:11:20
赴日外國游客突破3900萬人次再創(chuàng)歷史新高 中國游客影響有限

赴日外國游客突破3900萬人次再創(chuàng)歷史新高 中國游客影響有限

顫抖的熊貓
2025-12-17 22:12:26
場均21+3!火箭棄將或變?nèi)餍??斯通失算了!休賽期不該放走?>
    </a>
        <h3>
      <a href=熊哥愛籃球
2025-12-20 20:46:39
龐家捐出去的寶藏書畫,是怎么得來的?

龐家捐出去的寶藏書畫,是怎么得來的?

紅星新聞
2025-12-19 22:33:14
粉絲不滿美國隊長回歸《復(fù)仇者聯(lián)盟5》:不尊重獵鷹

粉絲不滿美國隊長回歸《復(fù)仇者聯(lián)盟5》:不尊重獵鷹

3DM游戲
2025-12-19 14:27:05
爭議聲中,世界首款“女性偉哥”再獲FDA批準(zhǔn)

爭議聲中,世界首款“女性偉哥”再獲FDA批準(zhǔn)

醫(yī)學(xué)界
2025-12-19 19:47:52
1976年毛主席逝世后,派誰空降上海?葉劍英擲地有聲:我提議一人

1976年毛主席逝世后,派誰空降上海?葉劍英擲地有聲:我提議一人

春秋硯
2025-12-20 08:55:09
2025-12-20 21:00:49
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領(lǐng)先的金融商業(yè)信息提供商
139164文章數(shù) 2651879關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

司機稱轎車剎車失靈狂奔490公里 網(wǎng)友質(zhì)疑"自導(dǎo)自演"

頭條要聞

司機稱轎車剎車失靈狂奔490公里 網(wǎng)友質(zhì)疑"自導(dǎo)自演"

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

2026央視跨年晚會陣容曝光,豪華陣仗

財經(jīng)要聞

求解“地方財政困難”

汽車要聞

嵐圖推進L3量產(chǎn)測試 已完成11萬公里實際道路驗證

態(tài)度原創(chuàng)

手機
時尚
旅游
游戲
數(shù)碼

手機要聞

三星Galaxy XR的拆解揭示了非常有趣的機身結(jié)構(gòu)

真愛大牌 || 用了5年才敢說,多虧它幫我守住了發(fā)際線

旅游要聞

“鳥中大熊貓”黑鸛做客滹源景區(qū)

《三角符文》第五章開發(fā)進展良好 本地化工作已經(jīng)啟動

數(shù)碼要聞

盧偉冰今晚直播:小米17 Ultra超前劇透 不怕“泄密”

無障礙瀏覽 進入關(guān)懷版