国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

被對手懟暴后,OpenAI 發(fā)布最強代碼模型

0
分享至


從寫代碼到「接管電腦」,GPT-5.3-Codex 正在重新定義什么叫 AI 工具人。


作者|樺林舞王

編輯|靖宇

2 月 5 日,Anthropic 在超級碗上發(fā)布的諷刺廣告,,卻被科技圈嘲笑。

現(xiàn)在,Altman 的報復來了!

當?shù)貢r間 2 月 5 日,OpenAI 發(fā)布 GPT-5.3-Codex,這款最新的代碼模型不僅在測試中名列前茅,而且能真正接管電腦,自主切換程序,完成復雜任務。

,現(xiàn)在又是 GPT-5.3-Codex,來自 Altman 的反擊,是如此迅速。

01

從「代碼助手」到「電腦管家」

傳統(tǒng)的 AI 編程工具,包括 GitHub Copilot 和之前的 Codex,本質(zhì)上都是「代碼補全器」——你寫一行,它幫你寫下一行。但 GPT-5.3-Codex 完全不同。

它能「接管」你的整臺電腦。

OpenAI 在發(fā)布會上展示的場景讓人印象深刻:Codex 不僅能寫代碼,還能運行測試、調(diào)試程序、管理數(shù)據(jù)庫、處理文件系統(tǒng),甚至能夠自主地在不同應用程序之間切換,完成復雜的多步驟任務。

一位 Hacker News 用戶的觀察很有意思:「Codex 在發(fā)現(xiàn)錯誤和小的不一致性方面非常出色,這讓我感到驚訝。Claude Code 在『原始編程』方面很好,但 Codex 在仔細、系統(tǒng)地發(fā)現(xiàn)『問題』方面是無敵的?!?/p>

說白了,這不再是一個編程工具,而是一個數(shù)字員工。

相比于之前的版本,GPT-5.3-Codex 的提升不再僅僅體現(xiàn)在代碼生成的正確率,而是在「智能代理(Agentic)」能力上的質(zhì)變。


5.3 Codex 和自家產(chǎn)品的對比|圖片來源:OpenAI

在保持相同推理深度的情況下,運行速度比GPT-5.2-Codex快了25%。同時,新模型引入了「中途轉向(Mid-turn Steering)」。你不再需要等待模型生成完畢后才反饋,可以在它運行長達數(shù)小時的任務(如重構整個代碼庫)時,隨時插入指令進行糾偏。

就在 OpenAI 發(fā)布 5.3 的同一天(甚至只相差 15 分鐘),Anthropic 發(fā)布了Claude Opus 4.6,火藥味極濃。


OpenAI 和 Anthropic 最新代碼模型的數(shù)據(jù)對比|圖片來源:AI 自制

更有趣的是,這是OpenAI第一個「自己造自己」的模型

研究團隊用 Codex 來監(jiān)控訓練過程、分析代碼質(zhì)量、提出優(yōu)化建議。AI 開始參與 AI 的誕生過程,這個循環(huán)一旦形成,進化速度將是指數(shù)級的。

02

90% 時間在編程的產(chǎn)品經(jīng)理

最能說明 Codex 影響力的,不是技術指標,而是人的工作方式改變。

OpenAI 產(chǎn)品設計負責人 Ed Bayes 的話很直接:「我現(xiàn)在 90% 的時間都在編程。一年前正好相反,可能只有 10% 的時間。」

一個產(chǎn)品設計師,現(xiàn)在大部分時間在寫代碼——這個轉變背后的邏輯很簡單:當 AI 能夠理解你的意圖并直接實現(xiàn)時,傳統(tǒng)的「產(chǎn)品-開發(fā)-測試」流水線就被壓縮了。

這種變化不只發(fā)生在 OpenAI 內(nèi)部。


兩天前 OpenAI 剛剛發(fā)布 MacOS 版的 Codex 獨立應用|圖片來源:OpenAI

The New Stack 分析師指出:「GPT-5.3-Codex 不僅僅在單個任務上更好,而是朝著能夠在現(xiàn)實世界技術工作的全譜中進行推理、構建和執(zhí)行的單一通用代理邁出了一步?!?/p>

但這也帶來了新的分工模式。

一位 Hacker News 用戶總結了 Codex 與 Anthropic Claude 的區(qū)別:「在 Codex 中,定位是一個交互式協(xié)作者:你在執(zhí)行過程中引導它,保持循環(huán),在它工作時糾正方向。而在 Opus 4.6 中,強調(diào)的是相反的:一個更自主、更智能、更深思熟慮的系統(tǒng)?!?/p>

這意味著,程序員的角色正在從「執(zhí)行者」轉向「指揮者」

03

AI Coding 大戰(zhàn)升級

Codex 的發(fā)布時間點很微妙——就在超級碗前夕,OpenAI 和 Anthropic 都準備了競爭性廣告。VentureBeat 將此次發(fā)布描述為「AI 編程戰(zhàn)爭的開場齊射」。

這不是偶然。當 AI 編程工具從「錦上添花」變成「必需品」時,這個市場的競爭就會變得異常激烈。

有 Hacker News 評論員直接警告 Anthropic:「他們最好采取重大行動,否則 OpenAI 將殺死 Claude Code?!乖掚m然說得直接,但反映了業(yè)內(nèi)的普遍判斷:Codex 這次的能力躍升,確實給競爭對手帶來了巨大壓力。

不過,Every.to 的對比測試顯示了另一個角度:「在一項調(diào)試測試中,GPT-5.3 Codex 運行了超過 8 個工具調(diào)用,逐位分析但錯過了實際問題。而 Opus 4.6 只讀了一次文檔就診斷出了問題?!?/p>

這說明,不同的 AI 編程工具正在形成差異化的優(yōu)勢:Codex 更像一個細致的執(zhí)行者,Claude 更像一個敏銳的診斷師

但無論如何,Sam Altman 的評價很能說明問題:「感覺,比基準測試顯示的更像是一個真正的進步?!?strong>當CEO用「感覺」而不是數(shù)據(jù)來描述產(chǎn)品時,往往意味著這個產(chǎn)品已經(jīng)超越了現(xiàn)有的評估體系。

這場 AI 編程戰(zhàn)爭,本質(zhì)上是在爭奪一個問題的答案:在軟件開發(fā)這個萬億美元市場中,人和 AI 的邊界到底在哪里?

Codex 給出的答案是:AI 可以做程序員能做的幾乎所有事情,人類負責告訴 AI 要做什么。這個分工模式一旦被驗證,整個軟件行業(yè)的人才需求、薪酬結構、甚至教育體系都會發(fā)生根本性改變。

現(xiàn)在的問題不再是「AI 會不會取代程序員」,而是「什么樣的程序員,不會被 AI 取代」。

*頭圖來源:OpenAI

本文為極客公園原創(chuàng)文章,轉載請聯(lián)系極客君微信 geekparkGO

極客一問

你怎么看 OpenAI 發(fā)布的最新代碼模型?


馬斯克曝光,蘋果造車時挖角特斯拉,雙倍工資免面試。

點贊關注極客公園視頻號,

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
擬并購行業(yè)獨角獸!800億市值光伏龍頭,明起停牌

擬并購行業(yè)獨角獸!800億市值光伏龍頭,明起停牌

每日經(jīng)濟新聞
2026-02-24 23:04:06
趣探:這位漂亮的米脂婆姨,有沒有龜茲血統(tǒng)?

趣探:這位漂亮的米脂婆姨,有沒有龜茲血統(tǒng)?

李未熟擒話2
2026-02-25 09:08:22
60歲繼父摟腰親吻10歲女童最新進展:涉事老年男子短視頻平臺賬號被禁止關注,內(nèi)容無法查看

60歲繼父摟腰親吻10歲女童最新進展:涉事老年男子短視頻平臺賬號被禁止關注,內(nèi)容無法查看

大風新聞
2026-02-25 21:35:03
同家族近20人在路上祭祖遇車禍,致2死多傷后又遇理賠難,多方回應

同家族近20人在路上祭祖遇車禍,致2死多傷后又遇理賠難,多方回應

大風新聞
2026-02-25 17:00:14
沖上熱搜!中秋請3天假堪比春節(jié),13天超長假期!最實用拼假攻略已備好

沖上熱搜!中秋請3天假堪比春節(jié),13天超長假期!最實用拼假攻略已備好

上觀新聞
2026-02-25 14:08:57
央企中標18億大單后離奇棄標,引出儲能項目驚天騙局

央企中標18億大單后離奇棄標,引出儲能項目驚天騙局

環(huán)球零碳
2026-02-25 19:24:43
網(wǎng)友偶遇《天天向上》主持人錢楓,頸部線條消失,身材胖到200斤

網(wǎng)友偶遇《天天向上》主持人錢楓,頸部線條消失,身材胖到200斤

師維
2026-02-25 19:43:51
大理拖車4公里1400元:車主硬剛到底,曝光換胎公司,誰都跑不了

大理拖車4公里1400元:車主硬剛到底,曝光換胎公司,誰都跑不了

離離言幾許
2026-02-25 16:13:29
小米起訴自媒體索賠500萬,賬號主體實控人為蔚來創(chuàng)始人李斌

小米起訴自媒體索賠500萬,賬號主體實控人為蔚來創(chuàng)始人李斌

新浪財經(jīng)
2026-02-25 18:49:08
疑系統(tǒng)錯誤致“欠款一千萬億”記錄,男子索賠200萬能成嗎?

疑系統(tǒng)錯誤致“欠款一千萬億”記錄,男子索賠200萬能成嗎?

紅星新聞
2026-02-25 15:02:59
蘋果新品官宣:2月24日,正式開售

蘋果新品官宣:2月24日,正式開售

科技堡壘
2026-02-24 15:01:58
上海一行人橫穿快速路被撞身亡,家屬索賠150萬,法院判決司機等無責

上海一行人橫穿快速路被撞身亡,家屬索賠150萬,法院判決司機等無責

上觀新聞
2026-02-25 18:39:10
含淚告別賽場!43歲了,已經(jīng)是個傳奇!

含淚告別賽場!43歲了,已經(jīng)是個傳奇!

德譯洋洋
2026-02-25 12:20:33
張?zhí)m撒謊風波升級!細節(jié)證明孩子非新生兒,產(chǎn)房被扒是月子中心

張?zhí)m撒謊風波升級!細節(jié)證明孩子非新生兒,產(chǎn)房被扒是月子中心

古希臘掌管月桂的神
2026-02-25 16:35:25
俄記者曝大瓜:俄軍進攻潛力耗盡,英國否定英法用核彈保護烏克蘭

俄記者曝大瓜:俄軍進攻潛力耗盡,英國否定英法用核彈保護烏克蘭

史政先鋒
2026-02-25 19:08:44
離大譜,楊瀚森紀念杯上的中國地圖缺失海南、臺灣及藏南地區(qū)

離大譜,楊瀚森紀念杯上的中國地圖缺失海南、臺灣及藏南地區(qū)

懂球帝
2026-02-25 18:59:03
60歲馬麗近照,被富豪丈夫獨寵38年,兒子成了她的驕傲

60歲馬麗近照,被富豪丈夫獨寵38年,兒子成了她的驕傲

悅君兮君不知
2026-02-24 22:45:55
星鏈大降價!馬斯克:無關競爭對手 我只想平價服務大眾

星鏈大降價!馬斯克:無關競爭對手 我只想平價服務大眾

快科技
2026-02-25 10:33:12
比亞迪連續(xù)40個月銷冠被終結

比亞迪連續(xù)40個月銷冠被終結

大象新聞
2026-02-24 09:44:05
官方通報“首都博物館觀眾留言當天就被丟進垃圾桶”

官方通報“首都博物館觀眾留言當天就被丟進垃圾桶”

閃電新聞
2026-02-25 20:08:35
2026-02-26 00:48:49
極客公園
極客公園
讓最棒的創(chuàng)新成為頭條
11824文章數(shù) 78804關注度
往期回顧 全部

科技要聞

“機器人只跳舞,沒什么用”

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

體育要聞

勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財經(jīng)要聞

上海樓市放大招,地產(chǎn)預期別太大

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

旅游
本地
手機
健康
公開課

旅游要聞

“四省人氣”匯聚單縣浮龍湖

本地新聞

津南好·四時總相宜

手機要聞

聽聞魅族手機停擺 資深魅友果斷下單了一臺魅族22:支持魅族

轉頭就暈的耳石癥,能開車上班嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版