国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

太狠了!奧特曼親手「干掉」GPT-5.2,OpenAI祭出最強(qiáng)編程AI

0
分享至


新智元報道

編輯:桃子 好困

【新智元導(dǎo)讀】最強(qiáng)AI智能體編程模型GPT-5.2-Codex登場!上下文壓縮,長程任務(wù)處理更強(qiáng),而且還懂網(wǎng)絡(luò)安全。

GPT-5.2-Codex,深夜突襲!

它是OpenAI迄今為止,最強(qiáng)的AI智能體編程模型,專為復(fù)雜、真實(shí)世界軟件工程而打造。


從名字可以看出,GPT-5.2-Codex基于GPT-5.2進(jìn)一步優(yōu)化版本,它在多項(xiàng)能力上實(shí)現(xiàn)了關(guān)鍵改進(jìn):

· 上下文壓縮,提升了長周期任務(wù)處理能力

· 在大型代碼變更,如重構(gòu)與遷移上性能更強(qiáng)

· 在原生Windows環(huán)境下,編程能力顯著增強(qiáng)

· 網(wǎng)絡(luò)安全能力最強(qiáng)

奧特曼宣稱,「OpenAI們」已經(jīng)用上了,而且還取得了非常好的成效。


在基準(zhǔn)測試中,GPT-5.2-Codex在軟件工程、終端測試中,擊敗了5.1-Codex-Max、GPT-5.2、GPT-5.1。


OpenAI博客中多次重點(diǎn)強(qiáng)調(diào),GPT-5.2-Codex在網(wǎng)絡(luò)安全上,達(dá)到了迄今為止最高水平。

就在上周,一位安全研究員用GPT-5.1-Codex-Max+Codex CLI,直接挖出了一個導(dǎo)致源代碼泄露的React漏洞。


今天起,所有付費(fèi)用戶皆可用上GPT-5.2-Codex,API將在未來幾周開放。

GPT-5.2-Codex編程狂飆,長跑不掉線

全新AI智能體編程GPT-5.2-Codex,簡單來說,就是一次「強(qiáng)強(qiáng)聯(lián)合」。

它不光繼承了GPT-5.2原本擅長的「專業(yè)工作處理能力」,還學(xué)到了5.1-Codex-Max在AI智能體編程和終端操作方面的能力。

這樣一來,它的進(jìn)步就很實(shí)在了——

在長上下文理解、工具調(diào)用、事實(shí)準(zhǔn)確性、原生上下文壓縮等方面,得到了顯著提升。

由此,GPT-5.2-Codex可以穩(wěn)定支持長時間運(yùn)行的編程任務(wù),并在推理時更省token。

在業(yè)內(nèi)專業(yè)基準(zhǔn)測試中,5.2-Codex在SWE-Bench Pro和Terminal-Bench 2.0上刷新SOTA。

相較于5.1-Codex,約6%的性能提升。


這兩個測試,就是專門用于評估模型在真實(shí)終端環(huán)境中處理多樣化任務(wù)時的智能體能力。

同時,它在原生Windows環(huán)境中的智能體編程表現(xiàn)也顯著增強(qiáng),進(jìn)一步擴(kuò)展了GPT-5.1-Codex-Max所引入的能力。

得益于這些改進(jìn),Codex能在大型代碼庫中長時間工作,并始終保持完整上下文。

這也就意味著,諸如大規(guī)模重構(gòu)、代碼遷移和功能開發(fā)等復(fù)雜任務(wù),GPT-5.2-Codex可以靠譜地完成。

——即便中途方案調(diào)整或嘗試失敗,也能持續(xù)迭代而不迷失方向。

不僅如此,GPT-5.2-Codex「視力」更強(qiáng)了。

編程時,直接發(fā)給它截圖、技術(shù)示意圖、圖表以及各類UI界面,它都能理解得更準(zhǔn)。


更厲害的是,它可以直接讀取設(shè)計稿,并迅速將其轉(zhuǎn)化為可運(yùn)行的功能原型。

同時,開發(fā)者也可以與Codex協(xié)作,將這些原型一點(diǎn)點(diǎn)打磨,直到能正式上線使用。

三大躍遷,AI已「攻破」真實(shí)世界

在OpenAI的一項(xiàng)核心網(wǎng)絡(luò)安全評估中,可以明顯看到「能力隨時間的躍遷」——

· GPT-5-Codex帶來了第一次顯著提升,

· GPT-5.1-Codex-Max帶來了第二次,

· GPT-5.2-Codex則實(shí)現(xiàn)了第三次躍遷。


對此,OpenAI判斷,未來的AI模型仍將沿著這一趨勢持續(xù)演進(jìn)。

在做規(guī)劃和能力評估時,他們一直假設(shè)每一代模型,都有潛力達(dá)到「準(zhǔn)備框架」(Preparedness Framework)里,定義的「高」等級網(wǎng)絡(luò)安全能力。

不過,GPT-5.2-Codex目前還未達(dá)到這一水平。

那么,在真實(shí)世界中,OpenAI的智能體編程模型表現(xiàn)如何?

一周挖出React高危漏洞

12月11日,React團(tuán)隊(duì)爆出了:React Server Components的三個安全漏洞。

然后,Stripe旗下公司Privy的首席安全工程師Andrew MacPherson,就決定拿這個漏洞來「測試」一下現(xiàn)在的AI模型到底有多能打。

他使用了GPT-5.1-Codex-Max+Codex CLI,以及其他編程智能體,意外的是,在復(fù)現(xiàn)和研究漏洞的過程中,把關(guān)鍵React漏洞挖出來了。


具體實(shí)操過程如下——

最初,他嘗試了多次零樣本學(xué)習(xí)分析,直接讓模型檢查補(bǔ)丁并判斷其修復(fù)的漏洞類型,但并未取得成果。

隨后,他轉(zhuǎn)向更高頻、迭代式的提示方式;在這些方法仍然無效后,他引導(dǎo)Codex按照標(biāo)準(zhǔn)的防御性安全流程開展工作——搭建本地測試環(huán)境、分析潛在攻擊面,并通過模糊測試向系統(tǒng)注入異常輸入。

在嘗試復(fù)現(xiàn)原始React2Shell問題的過程中,Codex發(fā)現(xiàn)了一些異常行為,值得深入調(diào)查。

最終,在短短一周內(nèi),這一流程促成了此前未知漏洞的發(fā)現(xiàn),并被以負(fù)責(zé)任的方式披露給React團(tuán)隊(duì)。

這一案例清楚地展示了,先進(jìn)AI系統(tǒng)如何顯著加速真實(shí)世界、廣泛使用的軟件中的防御性安全研究。

網(wǎng)友實(shí)測

一位開發(fā)者實(shí)測GPT-5.2-Codex編寫一個模擬道路上車輛與交通燈工作方式的程序,結(jié)果失敗了。



不過也有人認(rèn)為,其具備了與Gemini 3 Flash和Pro同樣精美的動畫效果。



GPT-5.2-Codex在生成一款反恐精英的游戲,表現(xiàn)亮眼。


總言之,OpenAI認(rèn)為,GPT-5.2-Codex的發(fā)布,是AI在真實(shí)軟件開發(fā)與網(wǎng)絡(luò)安全領(lǐng)域的又一大步。

它讓開發(fā)者,能輕松應(yīng)對復(fù)雜又耗時的任務(wù),同時也為網(wǎng)絡(luò)安全研究提供更好的工具支持。

參考資料:

https://openai.com/index/introducing-gpt-5-2-codex/

https://openai.com/index/gpt-5-2-codex-system-card/

秒追ASI

?點(diǎn)贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點(diǎn)亮星標(biāo),鎖定新智元極速推送!



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
攜程被迫發(fā)聲明,但聲明或會讓信任再次崩塌,卸載潮難止!

攜程被迫發(fā)聲明,但聲明或會讓信任再次崩塌,卸載潮難止!

魯八兩
2025-12-25 18:20:23
瘋了?朱孝天舉報五月天勾結(jié)黃牛洗錢、假唱?還曝F4合體背后隱情

瘋了?朱孝天舉報五月天勾結(jié)黃牛洗錢、假唱?還曝F4合體背后隱情

烏娛子醬
2025-12-25 14:32:18
家中扒出大量“寶貝”后,南博前院長徐湖平被緊急帶走

家中扒出大量“寶貝”后,南博前院長徐湖平被緊急帶走

清書先生
2025-12-25 13:39:42
廣州一家五口駕車誤入施工通道,全部墜江遇難

廣州一家五口駕車誤入施工通道,全部墜江遇難

大風(fēng)新聞
2025-12-25 16:32:02
日日驚恐!上海夫妻持斧逐戶砍砸鄰居家門!

日日驚恐!上海夫妻持斧逐戶砍砸鄰居家門!

看看新聞Knews
2025-12-25 21:32:09
李弘權(quán)18+8上海大勝8連殺江蘇 洛夫頓14+8吃T龐崢麟9中2

李弘權(quán)18+8上海大勝8連殺江蘇 洛夫頓14+8吃T龐崢麟9中2

醉臥浮生
2025-12-25 21:21:29
“99%純金咋掉色了?”南博鎮(zhèn)護(hù)之寶西漢金獸遭質(zhì)疑;原院長姚遷:頸部留有銅銹綠斑痕跡

“99%純金咋掉色了?”南博鎮(zhèn)護(hù)之寶西漢金獸遭質(zhì)疑;原院長姚遷:頸部留有銅銹綠斑痕跡

大風(fēng)新聞
2025-12-25 11:40:08
西貝賈國龍回應(yīng)一切:悔不該硬鋼羅永浩

西貝賈國龍回應(yīng)一切:悔不該硬鋼羅永浩

藍(lán)媒匯財經(jīng)plus
2025-12-25 14:08:52
F-16擊落全部34枚導(dǎo)彈,“匕首”沒擊中目標(biāo)!確認(rèn)犧牲英雄身份

F-16擊落全部34枚導(dǎo)彈,“匕首”沒擊中目標(biāo)!確認(rèn)犧牲英雄身份

鷹眼Defence
2025-12-24 16:17:27
國家能源集團(tuán)原董事長被撤銷全國政協(xié)委員資格

國家能源集團(tuán)原董事長被撤銷全國政協(xié)委員資格

新浪財經(jīng)
2025-12-25 19:17:26
越南當(dāng)年為何敢和中國開戰(zhàn)?黎筍長子多年后說出了核心真相

越南當(dāng)年為何敢和中國開戰(zhàn)?黎筍長子多年后說出了核心真相

古書記史
2025-12-22 19:21:12
莫迪罕見攤牌:絕不插手臺海,同時向中方,暴露出更大的野心

莫迪罕見攤牌:絕不插手臺海,同時向中方,暴露出更大的野心

空天力量
2025-12-25 17:27:12
擴(kuò)軍也無望?56歲范志毅央視語出驚人:2038年世界杯國足才有望進(jìn)

擴(kuò)軍也無望?56歲范志毅央視語出驚人:2038年世界杯國足才有望進(jìn)

我愛英超
2025-12-25 21:06:51
陳書平任成都市代市長

陳書平任成都市代市長

新京報政事兒
2025-12-25 17:23:01
過山車上嘔吐物從天而降弄臟羽絨服,男子起訴游樂園索賠2.8萬余元,法院判賠清洗費(fèi)1000元,退還VIP門票費(fèi)

過山車上嘔吐物從天而降弄臟羽絨服,男子起訴游樂園索賠2.8萬余元,法院判賠清洗費(fèi)1000元,退還VIP門票費(fèi)

極目新聞
2025-12-25 18:27:41
精準(zhǔn)斬首!泰國無人機(jī)斬首行動震驚東南亞!洪森指揮鏈遭團(tuán)滅!

精準(zhǔn)斬首!泰國無人機(jī)斬首行動震驚東南亞!洪森指揮鏈遭團(tuán)滅!

深度報
2025-12-24 22:47:16
中國首批赴俄游客遭“天價宰殺”,落地即“失聯(lián)”!

中國首批赴俄游客遭“天價宰殺”,落地即“失聯(lián)”!

微評社
2025-12-25 11:45:30
國民黨2026首波提名公布,島內(nèi)學(xué)者:鄭麗文已具備協(xié)調(diào)能力和魄力

國民黨2026首波提名公布,島內(nèi)學(xué)者:鄭麗文已具備協(xié)調(diào)能力和魄力

海峽導(dǎo)報社
2025-12-25 10:04:02
徐湖平履歷被扒!曾是印刷廠工人,掌管南博25年,高中學(xué)歷成院長

徐湖平履歷被扒!曾是印刷廠工人,掌管南博25年,高中學(xué)歷成院長

葉公子
2025-12-21 22:41:27
元旦將至,不要說“元旦快樂”,送你25句元旦祝福語,好聽易懂

元旦將至,不要說“元旦快樂”,送你25句元旦祝福語,好聽易懂

阿龍美食記
2025-12-25 06:07:12
2025-12-25 22:39:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14182文章數(shù) 66397關(guān)注度
往期回顧 全部

科技要聞

小米17Ultra發(fā)布,徠卡2億像素 ,6999元起

頭條要聞

韓國"最毒"財閥千金被捕 韓國人稱"經(jīng)過她身邊就會死"

頭條要聞

韓國"最毒"財閥千金被捕 韓國人稱"經(jīng)過她身邊就會死"

體育要聞

約基奇有多喜歡馬?

娛樂要聞

朱孝天把阿信好意當(dāng)球踢!

財經(jīng)要聞

新規(guī)來了,年化超24%的小貸被即刻叫停

汽車要聞

速來!智界在上海西岸準(zhǔn)備了年末潮流盛典

態(tài)度原創(chuàng)

數(shù)碼
房產(chǎn)
健康
旅游
家居

數(shù)碼要聞

2025年度數(shù)碼好物大賞【年度評選】

房產(chǎn)要聞

太猛了!單月新增企業(yè)4.1萬家,又一波巨頭涌向海南!

這些新療法,讓化療不再那么痛苦

旅游要聞

海南神沖首屆火山電音節(jié)定檔2026元旦

家居要聞

經(jīng)典彌新 品味浪漫居所

無障礙瀏覽 進(jìn)入關(guān)懷版