国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GPT-5.4來了:不是更聰明,是真的能替你干活了

0
分享至

OpenAI這次是真的急了。

3月3日,GPT-5.3 Instant上線;3月5日,GPT-5.4緊跟著就來了。



兩天之內(nèi),兩個(gè)重磅模型,一個(gè)管日常聊天,一個(gè)管專業(yè)干活。這節(jié)奏,連AI自己都快跟不上了。

但這次,GPT-5.4不只是"更快更強(qiáng)"那么簡單。

它帶來了幾個(gè)真正改變游戲規(guī)則的東西:原生電腦操控、Tool Search機(jī)制

以及一個(gè)讓所有打工人都該認(rèn)真想想的數(shù)據(jù)——83%的專業(yè)任務(wù),AI已經(jīng)能做到跟人類專家一樣好,甚至更好。

一、GPT-5.4:不是更聰明,是真的能替你干活了

GPT-5.4這次有三個(gè)版本:

GPT-5.4 標(biāo)準(zhǔn)版:面向API和Codex

GPT-5.4 Thinking:帶深度推理,ChatGPT Plus用戶可用

GPT-5.4 Pro:性能拉滿,僅限Pro(200美元/月)和企業(yè)版



OpenAI自己的定義是:"面向?qū)I(yè)工作最強(qiáng)大、最高效的前沿模型。"

它把之前GPT-5.3-Codex的頂級(jí)編碼能力,整合進(jìn)了主線推理模型。以前想要最好的代碼能力和推理能力,得切換不同模型。

現(xiàn)在GPT-5.4一個(gè)模型全包了。

二、原生電腦操控:AI操作電腦,第一次超過了人類

這是GPT-5.4最大的突破。

它是OpenAI第一個(gè)支持"原生計(jì)算機(jī)使用"的模型——不是通過插件,不是通過第三方工具,而是模型本身就能操作你的電腦。

它能寫代碼來控制電腦,也能直接發(fā)出鍵盤和鼠標(biāo)指令。

在OSWorld桌面操控測試中,GPT-5.4得分75.0%,人類平均72.4%。而上一代GPT-5.2只有47.3%。



從47.3%直接跳到75.0%,不是小改進(jìn),是代際飛躍。這意味著什么?

以后讓AI幫你填表格、訂機(jī)票、在不同軟件之間搬運(yùn)數(shù)據(jù),不再是演示視頻里的未來,而是正在落地的現(xiàn)實(shí)。看到屏幕截圖,它就知道該點(diǎn)哪里、該輸入什么。

比如:GPT-5.4 可以識(shí)別瀏覽器界面的截圖,并通過基于坐標(biāo)的點(diǎn)擊與界面元素交互,以發(fā)送郵件和安排日歷事件。

也可以給它一份記錄列表,它就能使用類似 Playwright 的自動(dòng)化技術(shù)處理并提交它們到網(wǎng)頁表單。

而且,這里面的操作視頻都沒有經(jīng)過加速處理,就是GPT 5.4正常的運(yùn)行速度!

三、Tool Search:省了47%的token

以前你讓AI調(diào)用工具,得明確告訴它用哪個(gè)API、怎么調(diào)。更頭疼的是工具越多,消耗的token越多,越慢越貴。

現(xiàn)在GPT-5.4能自己去"搜索"最合適的工具和API,自動(dòng)選擇、自動(dòng)調(diào)用。

給模型一本工具目錄,讓它自己判斷需要什么,用到才加載,用不到根本不占空間。



實(shí)測效果:250個(gè)任務(wù)場景下,減少47%的token消耗,準(zhǔn)確率完全不變。

差不多省了一半的錢和一半的時(shí)間。對(duì)做AI Agent開發(fā)的同學(xué)來說,這是基礎(chǔ)設(shè)施級(jí)別的改進(jìn)。

四、Thinking模式升級(jí):思考過程,你可以實(shí)時(shí)打斷

GPT-5.4 Thinking有個(gè)很有意思的新交互方式:

當(dāng)你問一個(gè)復(fù)雜問題時(shí),模型會(huì)先給你展示一個(gè)思考大綱,告訴你它打算分幾步處理。

關(guān)鍵是——你可以在它思考的過程中隨時(shí)插嘴、調(diào)整方向。

以前是發(fā)問題→等結(jié)果→發(fā)現(xiàn)方向不對(duì)→刪掉重來,浪費(fèi)大量token和時(shí)間。

現(xiàn)在是實(shí)時(shí)協(xié)作,就像和同事討論方案一樣。這個(gè)功能目前在ChatGPT網(wǎng)頁版和Android端已上線,iOS端即將支持。

五、100萬token上下文 + 83%超越人類專家

GPT-5.4的上下文窗口達(dá)到了100萬token。什么概念?

一本40萬字的小說,它能一次性讀完并理解。一個(gè)完整的代碼庫,它能整體分析。

更重要的是,它在超長上下文中的"回憶能力"幾乎完美——那種"你在第3頁說的話到了第300頁就忘了"的問題,在GPT-5.4上大幅改善。

OpenAI用一套叫GDPval的測試來評(píng)估GPT-5.4,覆蓋了9個(gè)行業(yè)、44個(gè)職業(yè)。這些不是隨便選的——它們都是美國GDP貢獻(xiàn)超過5%的行業(yè)中,工資最高、最知識(shí)密集的崗位。

金融分析師、投資顧問、合規(guī)官員、采購經(jīng)理、機(jī)械工程師、房地產(chǎn)經(jīng)紀(jì)人……

測試結(jié)果:GPT-5.4在83%的任務(wù)中,表現(xiàn)達(dá)到或超過了人類專家水平。



也就是說,AI在法律分析、財(cái)務(wù)建模、做PPT等知識(shí)工作中,有83%的概率能做得跟人類專家一樣好甚至更好。





你沒看錯(cuò),AI操作電腦比人類平均水平還好了。

這意味著什么?不是說這些職業(yè)馬上就消失。但它說明:在這些知識(shí)型崗位中,AI已經(jīng)可以承擔(dān)大部分"標(biāo)準(zhǔn)化工作"。

六、GPT-5.3 Instant:不追求最強(qiáng),追求"不油膩"

這次OpenAI其實(shí)一周內(nèi)發(fā)了兩個(gè)模型,容易搞混。簡單理解:

GPT-5.3 Instant= 你的日常聊天助手

GPT-5.4 Thinking= 你的專業(yè)工作搭檔

GPT-5.3 Instant(3月3日上線)主打三個(gè)改進(jìn):

→ 幻覺減少26.8%(這個(gè)提升非常顯著)

→ 說話不再"油膩"了(OpenAI官方原話是"anti-cringe",終于知道大家嫌它啰嗦了)

→ 40萬token上下文窗口

簡單說,以前ChatGPT回答你一個(gè)問題,經(jīng)常加一堆"作為AI語言模型,我很高興為你回答……"這種廢話。現(xiàn)在5.3 Instant終于學(xué)會(huì)了正常說話。

兩個(gè)模型的分工很明確:日常對(duì)話用5.3 Instant,快速高效不廢話;遇到復(fù)雜任務(wù)、專業(yè)分析、寫代碼,切換到5.4 Thinking,深度推理精準(zhǔn)輸出。

寫在最后

兩天連發(fā)兩個(gè)模型,背后是OpenAI面對(duì)Claude Opus 4.6和DeepSeek V4的焦慮。

目前AI模型的第一梯隊(duì)是三足鼎立:OpenAI的GPT-5.4、Anthropic的Claude Opus 4.6、Google的Gemini 3.1 Pro。

跟Claude Opus 4.6比:

在操作電腦這件事上,GPT-5.4(75.0%)剛剛超過了Claude Opus 4.6(72.7%)。

但Reddit上的用戶反饋很有意思——即使GPT-5.4在跑分上領(lǐng)先,很多人表示不打算從Claude切換過來,因?yàn)镃laude"感覺更聰明",寫代碼的體驗(yàn)更流暢。

跑分是一回事,手感是另一回事。

價(jià)格對(duì)比(API):

→ GPT-5.4 Pro:$21/$168(每百萬token輸入/輸出)

→ Claude Opus 4.6:$5/$25

GPT-5.4真正值得關(guān)注的,不是跑分更高了,而是AI正在從"回答問題"變成"執(zhí)行任務(wù)"。

原生電腦操控 + Tool Search + 可中斷的思考模式,這三件事加在一起,意味著AI真的可以像一個(gè)員工一樣幫你干活了。

剛好,今天下午openclaw官方也宣布開始支持接入GPT-5.4了!



一個(gè)新的時(shí)代,正在加速到來。

以上,感謝看到這里,如果覺得不錯(cuò)的話,隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧!我們,下期再見。

我建了個(gè)免費(fèi)AI交流群,感興趣的朋友可以+我Lorjia0319,備注“進(jìn)群”加入,同時(shí)圍觀朋友圈日常AI干貨思考

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
全程呲大牙,咋咋呼呼,臉腫的梅婷也帶不動(dòng),偏偏還一群人吹捧

全程呲大牙,咋咋呼呼,臉腫的梅婷也帶不動(dòng),偏偏還一群人吹捧

一娛三分地
2026-02-25 21:50:03
75年得知王恩茂境況,主席大怒:怎能當(dāng)?shù)匚睍??指示分配軍?duì)

75年得知王恩茂境況,主席大怒:怎能當(dāng)?shù)匚睍??指示分配軍?duì)

老謝談史
2026-03-09 19:03:30
WTA大爆冷,衛(wèi)冕冠軍出局,澳網(wǎng)冠軍被淘汰,斯瓦泰克成功復(fù)仇

WTA大爆冷,衛(wèi)冕冠軍出局,澳網(wǎng)冠軍被淘汰,斯瓦泰克成功復(fù)仇

阿嚼影視評(píng)論
2026-03-10 18:10:19
春節(jié)婆家聚餐大姑姐狂點(diǎn),我要求AA,大姑姐:你們掙得多你們買單

春節(jié)婆家聚餐大姑姐狂點(diǎn),我要求AA,大姑姐:你們掙得多你們買單

廣西秦胖胖
2026-03-10 09:07:21
378萬年終獎(jiǎng)組長一人獨(dú)吞376萬,我僅得2萬,我交辭職報(bào)告去旅游

378萬年終獎(jiǎng)組長一人獨(dú)吞376萬,我僅得2萬,我交辭職報(bào)告去旅游

小秋情感說
2026-03-11 09:34:46
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
房價(jià)大局已定?未來近90%中國家庭,或許要經(jīng)歷這4大難關(guān)

房價(jià)大局已定?未來近90%中國家庭,或許要經(jīng)歷這4大難關(guān)

慧眼看世界哈哈
2026-03-10 14:44:07
美專家:中國人不可怕,可怕的是他們買了光刻機(jī),卻不用來造芯片

美專家:中國人不可怕,可怕的是他們買了光刻機(jī),卻不用來造芯片

世界有奇事
2026-01-13 16:34:40
不思悔改年年劈腿!郭昊文被錘前后:從威脅女方到焦慮天天哭

不思悔改年年劈腿!郭昊文被錘前后:從威脅女方到焦慮天天哭

大嘴爵爺侃球
2026-03-11 09:35:21
崩了!三分53中11+三分13%,鐵出天際,5年1.25億大合同徹底飛了

崩了!三分53中11+三分13%,鐵出天際,5年1.25億大合同徹底飛了

球童無忌
2026-03-10 19:40:23
養(yǎng)龍蝦的第一批受害者出現(xiàn)了!OpenClaw給裝慘用戶自動(dòng)轉(zhuǎn)了筆錢

養(yǎng)龍蝦的第一批受害者出現(xiàn)了!OpenClaw給裝慘用戶自動(dòng)轉(zhuǎn)了筆錢

柴狗夫斯基
2026-03-10 08:15:15
小心雨水“突襲”!接下來直沖17℃ | 天氣早知道

小心雨水“突襲”!接下來直沖17℃ | 天氣早知道

上海楊浦
2026-03-11 07:53:20
就地解散嗎?火藥耗盡后的伊朗革命衛(wèi)隊(duì)

就地解散嗎?火藥耗盡后的伊朗革命衛(wèi)隊(duì)

民間鐵血柔情
2026-03-09 06:04:26
詹?。豪锲钟忠粋€(gè)慌亂無助的客場,最后甚至為沒輸2球慶幸

詹俊:利物浦又一個(gè)慌亂無助的客場,最后甚至為沒輸2球慶幸

懂球帝
2026-03-11 04:04:05
曝許雅鈞私聯(lián)女粉,泄露大S私密出殯照,劣行曝光房貸都是小S還

曝許雅鈞私聯(lián)女粉,泄露大S私密出殯照,劣行曝光房貸都是小S還

古希臘掌管松餅的神
2026-03-11 09:50:50
“人體藝術(shù)”,絕非色情!

“人體藝術(shù)”,絕非色情!

文刀萬
2026-03-06 06:05:03
6-1!0-1!歐冠一夜太刺激:拜仁大勝,巴薩壓哨絕平,利物浦翻車

6-1!0-1!歐冠一夜太刺激:拜仁大勝,巴薩壓哨絕平,利物浦翻車

董老師看競技
2026-03-11 06:51:07
特朗普稱不會(huì)接受哈梅內(nèi)伊兒子擔(dān)任伊朗最高領(lǐng)袖,中方表態(tài)

特朗普稱不會(huì)接受哈梅內(nèi)伊兒子擔(dān)任伊朗最高領(lǐng)袖,中方表態(tài)

環(huán)球網(wǎng)資訊
2026-03-10 15:29:22
河北“二婚黃花大閨女”的瓜

河北“二婚黃花大閨女”的瓜

皮蛋兒電影
2026-02-28 13:45:08
常州將新建一所高中!位置就在…

常州將新建一所高中!位置就在…

常州大喇叭
2026-03-10 15:52:06
2026-03-11 10:44:49
珞珈AI實(shí)戰(zhàn)筆記
珞珈AI實(shí)戰(zhàn)筆記
AI科技博主 | 一人企業(yè) 探索「AI超級(jí)個(gè)體」復(fù)利商業(yè)化 分享AI工具、實(shí)用教程與副業(yè)賺錢方法
1文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

騰訊急了急了,微信絕密AI智能體首度曝光

頭條要聞

學(xué)者:"委內(nèi)瑞拉模式"在伊朗已失敗 特朗普想匆忙抽身

頭條要聞

學(xué)者:"委內(nèi)瑞拉模式"在伊朗已失敗 特朗普想匆忙抽身

體育要聞

執(zhí)教過李鐵的英國老頭,77歲又出山了

娛樂要聞

楊冪連續(xù)五年為劉詩詩慶生,劉詩詩回應(yīng)

財(cái)經(jīng)要聞

油價(jià)大轉(zhuǎn)頭?一天,從末日到曙光!

汽車要聞

豐田向左,本田向右

態(tài)度原創(chuàng)

時(shí)尚
數(shù)碼
旅游
親子
本地

看來看去這些才是適合普通人的穿搭!不花哨、不繁瑣,提氣質(zhì)

數(shù)碼要聞

2K 540Hz/720P 1000Hz:AOC“AGP277QK”顯示器將于21日上市

旅游要聞

花溪十里河灘木橋破損,修復(fù)處理正在進(jìn)行

親子要聞

孩子跳繩連跳7個(gè),取得重大突破

本地新聞

云游中國|候鳥高顏值亮相!沉浸式打卡青海濕地

無障礙瀏覽 進(jìn)入關(guān)懷版