国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GPT-5.4發(fā)布,最適合OpenClaw的天選模型登場(chǎng)了。

0
分享至

深夜凌晨2點(diǎn),我剛準(zhǔn)備睡覺。

然后,GPT-5.4,突然發(fā)布。


一下子激動(dòng)的睡不著了。

真的,這真不是我天天咋咋呼呼啥的,我真的也很少會(huì)用激動(dòng)的睡不著覺這種表述。

這是因?yàn)椋乙恢痹诘日桨娴腉PT-5.3或者GPT-5.4,來(lái)作為我的OpenClaw的首選模型。

理由特別簡(jiǎn)單,因?yàn)楝F(xiàn)代世界三十年,本質(zhì)上基層都是代碼,我們現(xiàn)在看到的關(guān)于計(jì)算機(jī)和互聯(lián)網(wǎng)的一切,幾乎都建立在代碼的基礎(chǔ)之上。

所以你可以理解為,代碼能力,在很多時(shí)候,就代表著Agent能力的一根粗壯的腿。

一個(gè)優(yōu)秀的Agent基座模型,在我的理解里,一般來(lái)說(shuō),需要三種都很強(qiáng):

代碼能力、世界知識(shí)、多模態(tài)理解。

當(dāng)你這三個(gè)都能SOTA的時(shí)候,你幾乎必然就是最牛逼的Agent模型,當(dāng)然,還有一個(gè)重要的因素,就是價(jià)格。

在過去,Claude Opus 4.6,幾乎就是Agent模型的代名詞,因?yàn)榇a、世界知識(shí)都很強(qiáng),多模態(tài)能力雖然比不過Seed 2.0和Gemini 3.1 Pro,但是在一些場(chǎng)景里面,也夠了,因?yàn)楝F(xiàn)在的Agent,跟現(xiàn)實(shí)物理交互還沒有那么多,那個(gè)已經(jīng)是具身智能的范疇了。

而我過去很喜歡的GPT-5.3-Codex,代碼能力確實(shí)強(qiáng),在做任務(wù)執(zhí)行的時(shí)候,那簡(jiǎn)直就是指哪打哪。

但是最大的問題,這玩意是一個(gè)編程特化模型啊,世界知識(shí)就是一坨屎,連GPT-5.2都不如,所以O(shè)penAI當(dāng)時(shí)也是沒辦法,為了跟Claude打一打,只能加個(gè)Codex的后綴給放出來(lái)了。

所以你會(huì)發(fā)現(xiàn),在規(guī)劃能力上,是完全比不過Claude Opus 4.6的,但是最大的問題,其實(shí)還是因?yàn)槭澜缰R(shí)的問題,就導(dǎo)致這玩意。

它說(shuō)天書,講的那些話,真的,我不是程序員出身,我看那個(gè)話,看的就真的超級(jí)費(fèi)勁。

就比如說(shuō),我讓他之前對(duì)我的一個(gè)AI熱點(diǎn)網(wǎng)站的項(xiàng)目進(jìn)行審查,主要就是review一下我的文檔規(guī)范和我整個(gè)代碼庫(kù)。

然后,這哥們寫的文檔,我尼瑪。。。


你再對(duì)比一下Claude Opus 4.6寫的。


對(duì)比起來(lái)應(yīng)該一目了然。。。

就是因?yàn)檫@玩意不說(shuō)人話,世界知識(shí)也不行,所以,只是在Codex里面用用還好,但是你要是把它接到你的OpenClaw里面,去當(dāng)做默認(rèn)模型,你就知道啥叫災(zāi)難了,這哥們幾乎沒有人味,說(shuō)起話來(lái)我想揍他。

所以我當(dāng)時(shí)試了一下,就直接棄了,還是在我的OpenClaw里面,用的Claude Opus 4.6和Sonnet 4.6,做了一下場(chǎng)景調(diào)用。

那為啥說(shuō),我很期待GPT-5.4呢。

因?yàn)椋珻laude哪都好,但是,它貴?。。?!

它真的好貴啊?。。。。?!

而且因?yàn)锳nthropic這個(gè)呆逼,它把OpenClaw給瘋了,所以我訂閱的Claude的Max Plan的額度,是完全不能給OpenClaw用的,只能在Claude Code用,你想在OpenClaw上用,只能硬接API Key用。

但是大家都知道,Claude的API有多貴,那根本不是我們這種窮逼團(tuán)隊(duì)能用的起的,小規(guī)模用用還好,大規(guī)模用那公司直接破產(chǎn)了。

之前還有一條路是用反代,把Google家的Antigravity里面的Claude額度用插件代理出來(lái),扔給OpenClaw用。


但是后面Google開始大批量封號(hào),導(dǎo)致也沒辦法用了。

我過年的時(shí)候Google賬號(hào)還被封了,被迫用AI去給Google寫了一份聲淚俱下的郵件。


我說(shuō)我錯(cuò)了,我再也不會(huì)了。

后面Google才給我解封,但是反代肯定是用不了了。

而OpenAI就不一樣了,最開始Claude瘋狂封OpenCode賬號(hào)的時(shí)候,OpenAI大手一揮,就站了出來(lái),說(shuō)我們不封,大家全力使用。


這是御三家里,唯一一個(gè)這么支持態(tài)度的,可以用第三方的工具,調(diào)用Codex的額度的。

那對(duì)OpenClaw自然也不例外了,也是幾個(gè)頂級(jí)模型里面,為數(shù)不多的,可以直接走登錄的,其他的都得用API。


真的,OpenAI這會(huì)真的是大善人。

還瘋狂的給Codex加額度。


所以啊,Claude在OpenClaw里用,好是好,但是不能用訂閱額度,只能用API,貴的一筆。

OpenAI的模型倒是可以用訂閱額度,但是GPT-5.2代碼又不行,GPT-5.3-codex又不說(shuō)人話。

你看,要多別扭有多別扭。

而這一次,GPT-5.4來(lái)了?。?!

終于把這個(gè)短板給補(bǔ)上了!

代碼能力跟GPT-5.3-Codex齊平,世界知識(shí)比GPT-5.2還要強(qiáng),還能使用訂閱額度,20刀就可以用的超級(jí)爽。

你就說(shuō),這不是最適合OpenClaw的天選模型,還有誰(shuí)是?嗯?

從今天開始,用OpenClaw的,都把默認(rèn)模型切換到GPT-5.4去,真的,信我。

回到GPT-5.4,老規(guī)矩,先看跑分。


就很爽。

先看最關(guān)鍵的幾個(gè)。

GDPval:83.0%

這個(gè)是測(cè)AI在真實(shí)工作任務(wù)中表現(xiàn)的,包括金融、法律等44種職業(yè)的知識(shí)工作。

GPT-5.4 Thinking拿了83.0%,Claude Opus 4.6是78.0%,GPT-5.3 Codex是70.9%。

在真實(shí)業(yè)務(wù)場(chǎng)景里,GPT-5.4不只是會(huì)寫代碼,它還能跟你聊業(yè)務(wù)、聊金融、聊法律、聊各種專業(yè)領(lǐng)域的東西。

而且是用人話聊,不是用天書聊。

SWE-Bench Pro:57.7%

這個(gè)是測(cè)AI解決真實(shí)軟件工程問題的,不只是Python,而是測(cè)四種編程語(yǔ)言。

GPT-5.4 Thinking拿了57.7%,GPT-5.3 Codex是56.8%。

基本持平。

這就是我最想看到的結(jié)果。

代碼能力保住了GPT-5.3 Codex的水平,世界知識(shí)又補(bǔ)上來(lái)了。

OSWorld-Verified也是,75.0%。這個(gè)是測(cè)AI操作電腦的能力的,就是讓AI像人一樣,用鼠標(biāo)點(diǎn)擊、用鍵盤輸入、在不同應(yīng)用之間切換,完成各種任務(wù)。

GPT-5.4 Thinking拿了75.0%,超過了Claude Opus 4.6的72.7%,也保持了跟GPT-5.3-Codex的持平。

而且,GPT-5.4操作電腦的速度,快的離譜。


看下這個(gè)沒有加速過的視頻,會(huì)更直觀。

ToolAthon:54.6%

這個(gè)是測(cè)AI使用工具的能力的,也就是Agent能力的核心指標(biāo)之一。

GPT-5.4 Thinking拿了54.6%,Claude Opus 4.6是44.8%。

差了將近10個(gè)點(diǎn)。

至于學(xué)術(shù)知識(shí)之類的,跟GPT-5.3-codex就沒法比了,因?yàn)镺penAI自己也知道,所以,直接當(dāng)時(shí)就沒跑。


總之,翻譯成大白話就是。

GPT-5.4 = GPT-5.3 Codex的代碼能力 + 比GPT-5.2還強(qiáng)的世界知識(shí) + 更強(qiáng)的工具使用能力 + 超級(jí)便宜的codex額度。

這四樣加在一起,就是一個(gè)完美的OpenClaw天選基座模型。

然后還有幾個(gè)很棒的特性更新:

1. 100萬(wàn)token的上下文窗口。

這是GPT-5.4的一個(gè)大升級(jí)。

之前GPT-5.3的上下文窗口是40萬(wàn)token,GPT-5.4直接翻了一倍多,到了100萬(wàn)。

這對(duì)Agent來(lái)說(shuō)太重要了。

因?yàn)锳gent在執(zhí)行任務(wù)的時(shí)候,需要保持對(duì)整個(gè)任務(wù)的上下文理解。如果上下文窗口不夠大,Agent干著干著就會(huì)忘事兒,前面說(shuō)的東西后面就不記得了。

100萬(wàn)token,基本上足夠應(yīng)對(duì)絕大部分的Agent任務(wù)了。

當(dāng)然,OpenAI也不傻,他們說(shuō),超過27萬(wàn)token之后,你的額度就算兩倍了。


不過因?yàn)镃odex給的額度實(shí)在是太多太多了,所以即使是2倍,其實(shí)也還好。

2. 原生計(jì)算機(jī)使用能力。

這個(gè)是GPT-5.4的另一個(gè)大賣點(diǎn)。

OpenAI說(shuō),GPT-5.4是他們第一個(gè)內(nèi)置原生計(jì)算機(jī)使用能力的主線模型。

它在編寫通過Playwright等庫(kù)操作計(jì)算機(jī)的代碼方面表現(xiàn)非常的出色,同時(shí)也能根據(jù)屏幕截圖發(fā)出鼠標(biāo)和鍵盤命令。

也就是代碼和視覺齊飛,我感覺,這個(gè)小龍蝦接入以后,就真的可以,直接用視覺,操控你電腦上絕大多數(shù)的軟件了,真的,原生操控,想想都激動(dòng)。

他們基于此,還發(fā)布了一個(gè)新的skills,叫playwright-interactive。

允許Codex同時(shí)以代碼和視覺的兩種方式,調(diào)試Web和Electron應(yīng)用。


網(wǎng)址在此,大家可以自行安裝。

https://github.com/openai/skills/tree/main/skills/.curated/playwright-interactive

3. 支持了工具搜索。

以前呢,當(dāng)模型被賦予工具時(shí),所有工具定義都會(huì)預(yù)先包含在提示中。

對(duì)于擁有大量工具的系統(tǒng),這可能會(huì)為每個(gè)請(qǐng)求增加數(shù)千甚至數(shù)萬(wàn)個(gè)token,而且絕大多數(shù)的時(shí)候,都毫無(wú)意義,平白無(wú)故的導(dǎo)致成本上升、響應(yīng)變慢,并在上下文中充斥模型可能永遠(yuǎn)不會(huì)使用的信息。

所以呢,這次他們也支持了工具搜索,就是GPT?5.4不再直接接收完整工具定義,而是接收一份可用工具的輕量列表以及工具搜索功能。

當(dāng)模型需要使用某個(gè)工具時(shí),它可以查找該工具的定義并在當(dāng)時(shí)將其追加到對(duì)話中。

就非常像Skills漸進(jìn)式呈現(xiàn)的方式,目的很簡(jiǎn)單,還是優(yōu)化上下文工程。

OpenAI在自己測(cè)試完以后,發(fā)現(xiàn)工具搜索配置在保持相同準(zhǔn)確率的同時(shí)將總體token使用量減少47%,這個(gè)就非常牛逼了。


GPT-5.4 Thinking大概就是這樣。

這次他們其實(shí)還發(fā)了個(gè)GPT-5.4 Pro,我就不細(xì)說(shuō)了,反正就是一切都更牛逼了,但是對(duì)于大多數(shù)人來(lái)說(shuō),太貴了,也沒啥大用,必須得200刀的Pro會(huì)員才能用。

API的整體價(jià)格還是得說(shuō)一下,雖然大家大概率用的都會(huì)是訂閱的額度。


相比于GPT-5.2,價(jià)格是漲了的,但是還是比Claude Opus 4.6,便宜不少,Claude Opus 4.6的價(jià)格是$5/$25每百萬(wàn)token(輸入/輸出),GPT-5.4只有他們一半。

目前ChatGPT已經(jīng)上線了。


Codex也已經(jīng)支持了,我自己在Codex里面粗淺體驗(yàn)了一下。


首先撲面而來(lái)的,那自然是清新沁人的人話。。。

比如我讓它去把OpenAI官網(wǎng)的視頻給扒拉下來(lái),你看看這個(gè)發(fā)言:“這種活最煩”,“省的跟Cloudflare互相折壽”。。。


還有這個(gè)。

真的,Codex的輸出,我真的能看得懂了。。。


做出來(lái)的東西,前端審美有了不錯(cuò)的進(jìn)步,但還是不如Opus 4.6和Gemini。


寫作粗略測(cè)了一下,還是一股子莫名其妙的愛用排比句的詭異的味道。

奇奇怪怪。

然后有點(diǎn)可惜的就是,我等到了凌晨6點(diǎn)多,OpenClaw目前使用Codex登錄的方式,還是沒有支持GPT-5.4。


這就導(dǎo)致,我還是沒有機(jī)會(huì)測(cè)GPT-5.4在小龍蝦上的效果。

不過估計(jì)我一覺睡醒,估計(jì)小龍蝦就支持了。

因?yàn)樯鐓^(qū)里已經(jīng)看到很多用戶在催了,而且先行官們,都普遍反饋效果很好。

坐等支持,我真的已經(jīng)迫不及待了。

又是開心的一晚。

如果你也在用OpenClaw,那記得OpenClaw支持了以后,把默認(rèn)模型切換到GPT-5.4。

如果你還沒用過OpenClaw,那正好,現(xiàn)在是一個(gè)很好的開始時(shí)機(jī)。

畢竟,有了GPT-5.4這個(gè)天選模型,體驗(yàn)只會(huì)更好。

2026年,真是瘋狂的一年啊。

睡了。

以上,既然看到這里了,如果覺得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?~謝謝你看我的文章,我們,下次再見。

>/ 作者:卡茲克

>/ 投稿或爆料,請(qǐng)聯(lián)系郵箱:wzglyay@virxact.com

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
四五十歲還出軌的女人,最后都落得啥下場(chǎng)?看完你就懂了

四五十歲還出軌的女人,最后都落得啥下場(chǎng)?看完你就懂了

風(fēng)起見你
2026-04-19 09:29:45
這才是宋美齡和繼子蔣經(jīng)國(guó)的一張真實(shí)合影,都是真人的容貌

這才是宋美齡和繼子蔣經(jīng)國(guó)的一張真實(shí)合影,都是真人的容貌

喜歡歷史的阿繁
2026-04-16 11:17:28
71年,楊勇落難無(wú)處可去,“老楊哥”說(shuō):來(lái)我這!我保你安穩(wěn)無(wú)事

71年,楊勇落難無(wú)處可去,“老楊哥”說(shuō):來(lái)我這!我保你安穩(wěn)無(wú)事

近史閣
2026-04-17 16:25:03
打破一輪游魔咒!29歲趙心童獲37萬(wàn)獎(jiǎng)金 回應(yīng):壓力太大非常困難

打破一輪游魔咒!29歲趙心童獲37萬(wàn)獎(jiǎng)金 回應(yīng):壓力太大非常困難

念洲
2026-04-19 07:39:48
爭(zhēng)議!張水華參賽不給直播鏡頭 石屏文旅遭批:在全國(guó)面前丟人了

爭(zhēng)議!張水華參賽不給直播鏡頭 石屏文旅遭批:在全國(guó)面前丟人了

念洲
2026-04-19 09:27:28
無(wú)數(shù)身價(jià)過億的大佬,都在想方設(shè)法把國(guó)內(nèi)的錢偷偷轉(zhuǎn)移到海外

無(wú)數(shù)身價(jià)過億的大佬,都在想方設(shè)法把國(guó)內(nèi)的錢偷偷轉(zhuǎn)移到海外

流蘇晚晴
2026-04-14 19:58:25
馬英九有動(dòng)作,廖繼斌發(fā)聲引質(zhì)疑,蕭旭岑一語(yǔ)道破,始作俑者出現(xiàn)

馬英九有動(dòng)作,廖繼斌發(fā)聲引質(zhì)疑,蕭旭岑一語(yǔ)道破,始作俑者出現(xiàn)

健身狂人
2026-04-18 20:31:14
不會(huì)干,你就別干了!中國(guó)勒令馬士基停運(yùn),巴拿馬的反應(yīng)很有意思

不會(huì)干,你就別干了!中國(guó)勒令馬士基停運(yùn),巴拿馬的反應(yīng)很有意思

阿腩講娛樂
2026-04-18 13:00:07
A股重寫6年前的劇本,股民:就是按照劇本走的!

A股重寫6年前的劇本,股民:就是按照劇本走的!

數(shù)據(jù)挖掘分析
2026-04-19 09:39:17
美國(guó)總統(tǒng)特朗普稱將很快發(fā)布第一批UFO文件!特朗普:我領(lǐng)導(dǎo)的政府找到了許多“非常有趣”的文件

美國(guó)總統(tǒng)特朗普稱將很快發(fā)布第一批UFO文件!特朗普:我領(lǐng)導(dǎo)的政府找到了許多“非常有趣”的文件

每日經(jīng)濟(jì)新聞
2026-04-18 11:35:50
美國(guó)終于開始害怕?比稀土更致命王牌出手了,萬(wàn)斯:中國(guó)要冷靜

美國(guó)終于開始害怕?比稀土更致命王牌出手了,萬(wàn)斯:中國(guó)要冷靜

混沌錄
2026-04-10 22:53:19
比賴清德還狂的人出現(xiàn)了,如果她當(dāng)選臺(tái)灣領(lǐng)導(dǎo)人,解放軍必定收臺(tái)

比賴清德還狂的人出現(xiàn)了,如果她當(dāng)選臺(tái)灣領(lǐng)導(dǎo)人,解放軍必定收臺(tái)

芳芳?xì)v史燴
2026-03-29 21:09:31
走馬上任!恭喜孫穎莎亮相新崗位,薪資曝光,沒想到球迷這樣評(píng)價(jià)

走馬上任!恭喜孫穎莎亮相新崗位,薪資曝光,沒想到球迷這樣評(píng)價(jià)

曹說(shuō)體育
2026-04-18 18:42:48
新勢(shì)力第一季度銷量榜:理想翻身,小鵬第九!

新勢(shì)力第一季度銷量榜:理想翻身,小鵬第九!

生活魔術(shù)專家
2026-04-19 02:52:47
貝克漢姆妻子首次回應(yīng)大兒子與家庭矛盾,稱自己是“改過自新的控制狂”:站在聚光燈下30年,一直努力保護(hù)孩子

貝克漢姆妻子首次回應(yīng)大兒子與家庭矛盾,稱自己是“改過自新的控制狂”:站在聚光燈下30年,一直努力保護(hù)孩子

魯中晨報(bào)
2026-04-17 13:28:11
79年越軍假冒我軍電臺(tái)索要坐標(biāo),通訊兵反問蕎面價(jià)格后作出個(gè)決定

79年越軍假冒我軍電臺(tái)索要坐標(biāo),通訊兵反問蕎面價(jià)格后作出個(gè)決定

睡前講故事
2026-04-15 17:56:35
曼聯(lián)擊敗切爾西有運(yùn)氣幫忙,但在運(yùn)氣之外還有海文

曼聯(lián)擊敗切爾西有運(yùn)氣幫忙,但在運(yùn)氣之外還有海文

寫球的牧子
2026-04-19 08:25:01
20年前女子帶頭圈地砌墻,其他五戶居民紛紛效仿導(dǎo)致其房屋被圍堵、屋后無(wú)路可走!20年后女子后悔砌墻,多次舉報(bào)自己違建,官方回應(yīng)

20年前女子帶頭圈地砌墻,其他五戶居民紛紛效仿導(dǎo)致其房屋被圍堵、屋后無(wú)路可走!20年后女子后悔砌墻,多次舉報(bào)自己違建,官方回應(yīng)

大風(fēng)新聞
2026-04-18 11:05:10
里程碑,哈登季后賽總得分超越“大鳥”伯德,升至歷史第13位

里程碑,哈登季后賽總得分超越“大鳥”伯德,升至歷史第13位

懂球帝
2026-04-19 08:29:36
天助國(guó)際米蘭:0-2,第2的那不勒斯遭意甲第9掀翻,落后榜首12分

天助國(guó)際米蘭:0-2,第2的那不勒斯遭意甲第9掀翻,落后榜首12分

側(cè)身凌空斬
2026-04-19 02:01:53
2026-04-19 10:28:49
數(shù)字生命卡茲克 incentive-icons
數(shù)字生命卡茲克
反復(fù)橫跳于不同的AI領(lǐng)域,努力分享一些很酷的AI干貨
501文章數(shù) 626關(guān)注度
往期回顧 全部

科技要聞

50分26秒!榮耀獲得人形機(jī)器人半馬冠軍

頭條要聞

牛彈琴:伊朗遭到特朗普"羞辱"被激怒 結(jié)果印度遭了殃

頭條要聞

牛彈琴:伊朗遭到特朗普"羞辱"被激怒 結(jié)果印度遭了殃

體育要聞

時(shí)隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細(xì)節(jié)

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車要聞

奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬(wàn)元起

態(tài)度原創(chuàng)

數(shù)碼
藝術(shù)
親子
家居
房產(chǎn)

數(shù)碼要聞

蘋果2026款Mac Studio前瞻:M5 Max/Ultra芯片,內(nèi)存最高256G

藝術(shù)要聞

鄭麗文大陸之行引發(fā)熱議,孫中山贈(zèng)對(duì)聯(lián)成焦點(diǎn)!

親子要聞

春天娃長(zhǎng)個(gè)黃金期,喝對(duì)黑豆水,消積清熱竄個(gè)子

家居要聞

法式線條 時(shí)光靜淌

房產(chǎn)要聞

官宣簽約最強(qiáng)城更!??跇鞘?,突然殺入神秘房企!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版