国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT-5.4養(yǎng)龍蝦太貴?OpenAI自己出手砍到了一折

0
分享至



最近OpenClaw可以說是火遍了大江南北。各大廠商都說自己的模型如何支持小龍蝦,唯獨沒人推薦ChatGPT。

事實上OpenAI才收購了OpenClaw。

原因就一個“貴”。

讓AI幫你完成一個稍微復雜的任務,比如自動化處理一批客戶郵件,背后可能要調(diào)用模型幾十上百次:理解意圖、檢索信息、生成草稿、校對潤色、逐封發(fā)送……如果每一步都調(diào)用滿血版GPT-5.4,一輪操作下來,飼料費(token)比蝦本身還貴。

特別是隨著OpenClaw這類agent框架的爆發(fā),AI的工作模式已經(jīng)發(fā)生了根本性轉(zhuǎn)變:從前我們向AI提問,它盯著問題想很久,然后吐出一長串文字;現(xiàn)在AI面對一個復雜任務,要將其拆解成微小步驟分步推進。每一步都調(diào)用旗艦大模型,不僅延遲讓人崩潰,成本也會高到離譜。

在這種背景下,OpenAI正式發(fā)布GPT-5.4 mini與nano兩款小型模型,并宣稱其為公司“迄今最強大的小型模型”。

麻雀雖小五臟俱全,不要小瞧這兩個小玩意,不僅GPT-5.4核心的優(yōu)勢和能力它們繼承了下來,同時還更快、更省資源,并且適合于大批量、高頻率的AI任務調(diào)用。

OpenAI貌似是覺得mini還不夠小,所以做出了更輕量的nano。

nano是GPT-5.4最輕量、最快速的版本,專為對速度和成本要求極高的任務而設(shè)計。

事實就是,用單一模型處理所有事務性價比太低,經(jīng)常陷入高射炮打蚊子的境況,不如調(diào)整成大模型決定任務方向,小模型進行大規(guī)??焖賵?zhí)行的方案。

OpenAI自家的Codex就是這么干的。

一個主模型負責理解任務意圖、拆解步驟,然后調(diào)度mini/nano級別的子agent去執(zhí)行具體的代碼修改、測試運行、結(jié)果校驗,每個子任務只消耗極低的成本。

大模型就像坐鎮(zhèn)中軍、運籌帷幄的主帥,只抓頂層戰(zhàn)略、調(diào)度全局資源。小模型則是無數(shù)支精銳輕騎,身形輕便、行動迅捷、批量奔赴前線,專一完成細分任務。

01

OpenAI為什么這么做

mini和nano在價格上確實“mini”以及“nano”。要理解OpenAI為什么押注輕量化,先看看這兩款模型到底便宜到什么程度。

mini和nano均支持 400k tokens 的上下文窗口。在輸入價格上,GPT-5.4旗艦版是2.5 美元/百萬token,mini版是0.75美元/百萬 token,nano版更是夸張,僅0.2美元/百萬token,輸入成本僅為旗艦模型GPT-5.4的8%。

而輸出價格上,GPT-5.4是15美元/百萬 token,mini版約為它的1/3(4.5 美元),nano版約為它的1/12(1.25 美元)。

換句話說,OpenAI用戶們的賬單直接砍到了零頭。



價格只是表象,真正驅(qū)動OpenAI做這件事的,是整個行業(yè)的使用趨勢已經(jīng)發(fā)生了根本性轉(zhuǎn)向。

輕量化小模型主要有調(diào)用成本低、響應快這兩大特征,不少證據(jù)表明小模型已經(jīng)成為當前AI落地最具性價比、最具增長潛力的選擇。

在OpenRouter本月度最受歡迎LLM排行榜前十中,輕量化模型占到了6個席位,它們參數(shù)量普遍集中在數(shù)十億至數(shù)百億級別,和Claude Opus這類動輒數(shù)千億甚至萬億參數(shù)的通用旗艦大模型形成鮮明的差異。

榜單Top 2席位被輕量化小模型包攬,第1名MiniMax M2.5以8.29T tokens的調(diào)用量斷層領(lǐng)跑全榜,月度漲幅高達 476%;第2名Google Gemini 3 Flash Preview,調(diào)用量也達到4.24T tokens,遠超多數(shù)通用旗艦大模型。



Hugging Face Hub的模型下載量統(tǒng)計同樣印證了這一趨勢:92.48%的下載量來自少于10億參數(shù)的模型,86.33% 為5億以下,69.83% 為2億以下。

大模型也進入了薄利多銷的時代。

1B+參數(shù)量的模型,即便包含多款輿論熱度極高的開源大模型,整體下載占比僅為7.52%,不足輕量化模型的十分之一,這說明大模型的高關(guān)注度,似乎并未轉(zhuǎn)化為真實的落地與采用。



從OpenAI自身的商業(yè)賬本來看,做小模型更是一道必答題。

今年2月底,OpenAI宣布ChatGPT全球每周活躍用戶已突破9億,付費用戶約5000 萬,付費轉(zhuǎn)化率僅約5%左右,絕大多數(shù)用戶仍停留在免費版本。這也成為其未來商業(yè)化最核心的增長空間。

絕大多數(shù)的C端付費用戶,核心使用場景是日常對話、文案潤色、信息檢索、輕量代碼編寫等高頻輕量需求。

這類場景完全不需要GPT-5.4這類旗艦大模型的極限復雜推理能力,百億級以內(nèi)的輕量化小模型足以覆蓋大部分需求,同時又能提供毫秒級響應、無排隊等待的使用體驗,完美匹配絕大多數(shù)用戶的核心訴求。

說了這么多“為什么”,接下來看看這兩款模型到底交出了怎樣的答卷——畢竟,飼料便宜了,蝦的個頭要是也縮水了,那就不叫降本增效,叫偷工減料。

02

mini、nano能力幾何

mini和nano的優(yōu)勢就只是小和便宜嗎?

No No No

根據(jù)OpenAI官網(wǎng)的一系列跑分測試,可以說它們能力表現(xiàn)也很突出。

在業(yè)內(nèi)公認最權(quán)威的AI程序員測試SWE-bench Pro 中,GPT-5.4 mini的準確率達到了54.4%,表現(xiàn)極具殺傷力,逼近滿血版GPT-5.4的57.7%。

GPT-5.4 nano的準確率為52.4%,再考慮到它極低的成本,非常適合作為快速迭代的代碼審查和輔助子agent。

以下兩張圖表看得更直觀,橫軸分別代表模型的響應時長和所用成本,縱軸均表示模型在任務中的準確率。

GPT-5.4雖然準確率穩(wěn)居第一,但是在橫軸上卻延伸了太遠,也就是不僅思考久,燒的錢還多。而nano和mini的折線則整體居于坐標圖左側(cè),標志了它們極高的性價比。



它們只是犧牲了一點點終極的邏輯上限,就換來了極快的響應速度和極低的成本。

對此,不少網(wǎng)友戲稱:小龍蝦的飼料費終于被打下來了。

的確,mini和nano未來可能會成為養(yǎng)蝦的主流API選擇。

在OSWorld-Verified(真實電腦環(huán)境操作測試)中,GPT-5.4 mini達到了72.1%的準確率,幾乎追平了滿血旗艦版的75%。



這項測試主要是讓AI像人一樣,通過看顯示器、動鼠標、敲鍵盤來使用一臺真的電腦,包括使用Chrome、Office、VS Code等軟件。

這才是OpenClaw等agent玩家最看重的指標。

過去讓AI操控電腦,AI經(jīng)常會瞎點或者反應遲鈍。mini版本的這個高分意味著,它識別按鈕、滑塊、輸入框的精度極高,在一些自動化任務上可以更加得心應手。

然而,也不是所有場景都適合用小模型。

nano模型在OSWorld-Verified上的得分僅為39.0%,甚至低于上一代GPT-5 mini的42.0%。

這意味著在需要精細操控電腦界面的復雜任務上,nano還力有不逮。

同樣,對于需要深度推理、長鏈條邏輯的高難度任務,旗艦版GPT-5.4仍然不可替代。

小模型的價值不在于取代大模型,而在于和大模型搭配使用——把對的模型放在對的位置,才是子agent架構(gòu)真正的精髓。

這也恰恰是nano和mini發(fā)布的深層意義,它們不是來搶旗艦版飯碗的,而是來幫旗艦版分擔那些“高射炮打蚊子”的活兒。

當大模型不再需要親自處理每一個瑣碎步驟,整個系統(tǒng)的效率和成本結(jié)構(gòu)都會發(fā)生質(zhì)變。

OpenAI想打的不是一場簡單的價格戰(zhàn),OpenAI內(nèi)心OS是這樣的:“我可以每個token少賺你點錢,但是我要讓你多用我的小模型,把總收入抬上去?!?/p>

典型的薄利多銷。

過去“便宜”是國產(chǎn)模型的護城河,可是這道護城河正在被填平。對普通開發(fā)者和企業(yè)用戶而言,AI可能很快就會變成各行各業(yè)用得起、跑得快的新基礎(chǔ)設(shè)施。

小龍蝦的飼料費打下來了,養(yǎng)蝦的門檻也在悄悄降低。接下來的問題是:誰能養(yǎng)出最肥的蝦?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
海底撈回應“員工因顧客投訴被強制自費買禮物”:情況屬實,一定依法對該伙伴進行賠償,已通知一千多家門店進行內(nèi)部排查

海底撈回應“員工因顧客投訴被強制自費買禮物”:情況屬實,一定依法對該伙伴進行賠償,已通知一千多家門店進行內(nèi)部排查

大象新聞
2026-04-11 19:45:04
以色列襲擊黎巴嫩被譴責,內(nèi)塔尼亞胡:“以軍是世界上最有道德的軍隊”;此前以色列對黎巴嫩發(fā)動襲擊,造成包括兒童在內(nèi)數(shù)百名平民死傷

以色列襲擊黎巴嫩被譴責,內(nèi)塔尼亞胡:“以軍是世界上最有道德的軍隊”;此前以色列對黎巴嫩發(fā)動襲擊,造成包括兒童在內(nèi)數(shù)百名平民死傷

揚子晚報
2026-04-11 11:33:21
賈平凹之女賈淺淺被調(diào)查,連米芾的芾字都不認識,引起書法界震怒

賈平凹之女賈淺淺被調(diào)查,連米芾的芾字都不認識,引起書法界震怒

潮鹿逐夢
2026-04-10 12:43:59
公安部新規(guī)落地!70歲駕照免年審真相,這件事不做駕照直接注銷

公安部新規(guī)落地!70歲駕照免年審真相,這件事不做駕照直接注銷

復轉(zhuǎn)這些年
2026-04-10 12:01:32
鹵菜店使用“四姐”二字被索賠50萬元,店主:大家都叫我四姐,為什么告我侵權(quán)

鹵菜店使用“四姐”二字被索賠50萬元,店主:大家都叫我四姐,為什么告我侵權(quán)

環(huán)球網(wǎng)資訊
2026-04-11 21:50:22
鄭麗文一聲“毛主席”,打破了國民黨一個禁忌

鄭麗文一聲“毛主席”,打破了國民黨一個禁忌

月明風清1029
2026-04-11 17:27:07
全紅嬋后續(xù):陳芋汐網(wǎng)暴案刑拘三人,對比差距大,教練組態(tài)度明顯

全紅嬋后續(xù):陳芋汐網(wǎng)暴案刑拘三人,對比差距大,教練組態(tài)度明顯

眼光很亮
2026-04-11 19:25:54
國內(nèi)套現(xiàn)7個億后,她露出了身后的美國國旗,整個家族共套現(xiàn)20億

國內(nèi)套現(xiàn)7個億后,她露出了身后的美國國旗,整個家族共套現(xiàn)20億

云舟史策
2026-04-11 07:54:43
血戰(zhàn)臺兒莊:中國參戰(zhàn)29萬人、犧牲5萬人,日軍傷亡令人難以置信

血戰(zhàn)臺兒莊:中國參戰(zhàn)29萬人、犧牲5萬人,日軍傷亡令人難以置信

冰語歷史
2026-04-11 17:05:58
理想汽車CEO李想朋友圈飆臟話后二次發(fā)聲:怒斥某日系品牌持續(xù)拉踩

理想汽車CEO李想朋友圈飆臟話后二次發(fā)聲:怒斥某日系品牌持續(xù)拉踩

快科技
2026-04-11 18:08:11
各國不吃的食物:韓國人不吃香菜,俄羅斯人不吃海參,中國人呢?

各國不吃的食物:韓國人不吃香菜,俄羅斯人不吃海參,中國人呢?

阿纂看事
2026-04-11 19:24:41
美國繞月飛船成功降落!宇航員能自己走路,隔熱罩扛住2700℃灼燒

美國繞月飛船成功降落!宇航員能自己走路,隔熱罩扛住2700℃灼燒

火星一號
2026-04-11 13:42:49
1980年,66軍炮兵團“叛亂”,鄧小平大驚:華國鋒不宜留在領(lǐng)導層

1980年,66軍炮兵團“叛亂”,鄧小平大驚:華國鋒不宜留在領(lǐng)導層

帝哥說史
2026-04-10 06:30:03
突發(fā)!巴基斯坦被激怒了!

突發(fā)!巴基斯坦被激怒了!

財經(jīng)要參
2026-04-11 16:00:03
48架F-35壓境,美日撕破臉!王毅專機直插平壤,中朝抄了美軍后路

48架F-35壓境,美日撕破臉!王毅專機直插平壤,中朝抄了美軍后路

策略述
2026-04-11 16:41:05
萬茜蹲火了

萬茜蹲火了

動物奇奇怪怪
2026-04-11 17:32:32
4月“斷網(wǎng)”風暴:“翻墻”時代迎來終局?

4月“斷網(wǎng)”風暴:“翻墻”時代迎來終局?

虔青
2026-04-11 12:28:42
美國前情報局長爆出俄烏戰(zhàn)場驚人內(nèi)幕,烏軍重新殺回紅軍城

美國前情報局長爆出俄烏戰(zhàn)場驚人內(nèi)幕,烏軍重新殺回紅軍城

史政先鋒
2026-04-11 20:44:50
剛從朝鮮回來,說點不中聽的:朝鮮的真實面目,可能讓你很意外

剛從朝鮮回來,說點不中聽的:朝鮮的真實面目,可能讓你很意外

老特有話說
2026-04-11 17:33:51
為何?;鹬皇且晾氏掳雸隹嚯y的開端?

為何?;鹬皇且晾氏掳雸隹嚯y的開端?

高博新視野
2026-04-11 08:00:18
2026-04-11 23:19:00
字母榜 incentive-icons
字母榜
讓未來不止于大。
2367文章數(shù) 8057關(guān)注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

體育要聞

換帥之后,他們從降級區(qū)沖到升級區(qū)

娛樂要聞

鄭鈞回應兒子走路:會監(jiān)督他挺直腰板

財經(jīng)要聞

從日本翻身看:這次誰能扛住高油價?

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

房產(chǎn)
數(shù)碼
藝術(shù)
家居
旅游

房產(chǎn)要聞

土地供應突然暴跌!2026??跇鞘校窬执笞?!

數(shù)碼要聞

6560萬臺!一季度全球 PC 出貨出爐,漲價下逆勢增長,背后真相扎心

藝術(shù)要聞

花6億,爛尾12年,福建一處“頂奢別墅”,野草都長到三樓了

家居要聞

復古風格 自然簡約

旅游要聞

火出圈!成都人民公園相親角被老外包圍了

無障礙瀏覽 進入關(guān)懷版