国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

首個(gè)OpenClaw龍蝦大模型排行榜來了!兩個(gè)國產(chǎn)?AI?殺進(jìn)全球前三,最省錢養(yǎng)蝦方案來了。

0
分享至

我的創(chuàng)業(yè)故事:《

大家好,我是微笑哥。

龍蝦(OpenClaw)好用,Token 太貴!

這可不是我一個(gè)人的感覺,這是全世界人民的普遍體驗(yàn),這兩天有很多朋友讓我推薦一些免費(fèi)的模型。

其實(shí)很多 API 廠商都有一些免費(fèi)的額度,或者說有一些免費(fèi)的 API 可以使用的,我都寫到了這個(gè)文檔中,想領(lǐng)取文檔的直接拉到文末。


大家都知道 Claude、ChatGpt 的 API 是最好用的,但是實(shí)在是太貴了,龍蝦又非常消耗 Token。

在群里很多深度玩小龍蝦的朋友,一天消耗幾百刀是太普遍了,這普通人誰玩得起,國外用戶也消耗不起呀。

于是很多性價(jià)比高的,中國大模型API成為了大家的首選,在全球世界上也是這樣子的,最新的排行榜也能證明。

這兩天,OpenClaw 的創(chuàng)始人,發(fā)布了一個(gè)最適合 OpenClaw 的大模型排行榜。


專門針對 OpenClaw 的基準(zhǔn)測試 PinchBench,用于評估大語言模型在 OpenClaw 任務(wù)中的表現(xiàn)。


PinchBench是專門針對OpenClaw生態(tài)設(shè)計(jì)的一套AI Agent 基準(zhǔn)測試(benchmark),主 要用來評估不同大模型在真實(shí) Agent 自動(dòng)化任務(wù)中的能力,而不僅僅是聊天能力。

它通過一系列真實(shí)任務(wù)(如工具調(diào)用、內(nèi)容生成、文件操作、多步驟任務(wù)執(zhí)行、記憶能力),評估不同大模型在自動(dòng)化任務(wù)和 Agent 執(zhí)行能力上的表現(xiàn)。

簡單說:

PinchBench 就是給 OpenClaw AI Agent “跑分”的測試,用來比較不同模型誰更適合做 Agent。

從新的跑分成績來看MiniMax-m2.1 和 kimi-k2.5 進(jìn)入了前三


第一名:Gemini 3 Flash (Google)

沒錯(cuò),又是那個(gè)主打“又快又便宜”的 Flash。它以95.1%的成功率拿下了冠軍。

這說明在 Agent(智能體)賽道,模型不需要很大,但腦子必須靈光。

第二、三名:MiniMax M2.1 & Kimi K2.5

這是最讓我熱血沸騰的地方!國產(chǎn)大模型MiniMax月之暗面(Kimi)直接包攬了全球前三的剩下兩個(gè)席位。

什么 GPT-4o、Claude 4.5,在這次的“龍蝦”任務(wù)實(shí)測中,居然都被咱們國產(chǎn)模型甩在了身后。

說實(shí)話這個(gè)成績比我想象中要好太多了。完整的排名可以從這里看:https://pinchbench.com/

在 OpenClaw 的 Agent 任務(wù)中,模型需要頻繁進(jìn)行“思考-執(zhí)行-反饋”的循環(huán),所以首字延遲(TTFT)和生成速度(TPS)至關(guān)重要。

在模型速度 minimax-m2.5 排第一;谷歌排名第二;Meta 排名第三。


在花錢這個(gè)指標(biāo)上面,我估計(jì)大家關(guān)注最多了。

如果你打算讓“小龍蝦”幫你掛機(jī)干活,API 的花費(fèi)可能直接勸退。這次國產(chǎn)模型表現(xiàn)出了極高的性價(jià)比。

最省錢:gpt-5-nanoGemini 3 Flash (谷歌的輕量版也很能打呀),輸入約 $0.1/1M tokens,輸出約 $0.4/1M tokens。

谷歌在打價(jià)格戰(zhàn),目前的單價(jià)幾乎是所有大廠里最低的。如果你是重度使用者,它是首選。

高性價(jià)比(國產(chǎn)):MiniMax M2.1 / 2.5;價(jià)格: 輸入約 ¥0.2/1M tokens(約 $0.03)。

MiniMax 的 M2 系列采用了更小規(guī)模的參數(shù)優(yōu)化,價(jià)格比 GPT-4o 便宜了接近 90%,但任務(wù)成功率卻能進(jìn)全球前三,簡直是“性價(jià)比狂魔”。

最貴的是:Claude 4.5 Opus價(jià)格: 高達(dá) $15/1M tokens 以上,雖然聰明,但成本是 Flash 模型的150 倍。

在“養(yǎng)蝦”圈,一般只把它當(dāng)成“大腦”處理極難的問題,日常跑腿(比如搜網(wǎng)頁、點(diǎn)外賣)用它簡直是燒錢。


在“養(yǎng)蝦”圈,一般只把它當(dāng)成“大腦”處理極難的問題,日常跑腿(比如搜網(wǎng)頁、點(diǎn)外賣)用它簡直是燒錢。

總和對比下來:

國外來看Gemini 3 Flash 是綜合贏家,不管是能力、速度、價(jià)格,都排在第一梯隊(duì),養(yǎng)蝦首選。

國內(nèi)來看 miniMax 成為最大贏家,不管是能力、還是速度、價(jià)格都不差,國內(nèi)用戶養(yǎng)蝦首選。

綜合對比,怎么養(yǎng)蝦最劃算?

  • 高頻任務(wù) → minimax 或 z-ai,速度快+成本低

  • 批量非實(shí)時(shí)任務(wù) →Gemini 3 Flash或 gpt-5-nano,成本更低,耐心等待即可

總結(jié):日常自動(dòng)化用速度快、成本低的國產(chǎn)模型,關(guān)鍵高精度任務(wù)則用理解能力強(qiáng)但成本高的國外模型,平時(shí)以國產(chǎn)模型為主,必要時(shí)調(diào)用高端模型,這樣既保證效率,又控制賬單開支。

我創(chuàng)建了一個(gè) OpenClaw 交流群,專門交流:

1、小龍蝦怎么玩

2、可以做哪些自動(dòng)化

3、有哪些賺錢思路

4、最新玩法案例

5、進(jìn)群就送OpenClaw 中文學(xué)習(xí)指南(已經(jīng)寫了上萬字了,還在增加)

群 完全免費(fèi),但有一個(gè)規(guī)矩:禁止發(fā)廣告,發(fā)廣告直接永久拉黑。

如果你對 AI自動(dòng)賺錢 / AI自動(dòng)干活 / AI效率工具 感興趣,可以進(jìn)來一起研究。

① 添加下方微信

② 通過后回復(fù):小龍蝦

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“余生好好走”,知名央視主持人王小丫,病床上的留言字字催淚

“余生好好走”,知名央視主持人王小丫,病床上的留言字字催淚

近史談
2026-03-31 18:57:49
重磅!4家上市公司突遭立案,24萬股民懵了,這雷爆得猝不及防

重磅!4家上市公司突遭立案,24萬股民懵了,這雷爆得猝不及防

慧眼看世界哈哈
2026-04-23 08:25:06
笑不活了!老爸首次煮魚,掀開鍋蓋,魚竟在吃蔥花,女兒反應(yīng)逗了

笑不活了!老爸首次煮魚,掀開鍋蓋,魚竟在吃蔥花,女兒反應(yīng)逗了

川渝視覺
2026-04-22 13:11:09
驚險(xiǎn)!上海地鐵48小時(shí)內(nèi)連發(fā)2起!都因這件小東西!緊急提醒→

驚險(xiǎn)!上海地鐵48小時(shí)內(nèi)連發(fā)2起!都因這件小東西!緊急提醒→

新浪財(cái)經(jīng)
2026-04-23 12:14:07
杰夫-蒂格真是語出驚人?。≈毖哉材匪咕褪荊OAT,這種表現(xiàn)從未見過

杰夫-蒂格真是語出驚人??!直言詹姆斯就是GOAT,這種表現(xiàn)從未見過

劉哥談體育
2026-04-23 18:28:31
“南航空姐”咆哮外籍乘務(wù)不懂中文,空少還原鬧劇首次曝光!這事如果發(fā)生在新加坡……

“南航空姐”咆哮外籍乘務(wù)不懂中文,空少還原鬧劇首次曝光!這事如果發(fā)生在新加坡……

新加坡眼
2026-04-23 14:39:44
火箭隊(duì) 2026 年重建方案

火箭隊(duì) 2026 年重建方案

林子說事
2026-04-23 18:14:26
悲痛!又有學(xué)生跳樓!致家長:請不要再以各種名義給孩子配手機(jī)了

悲痛!又有學(xué)生跳樓!致家長:請不要再以各種名義給孩子配手機(jī)了

華人星光
2026-04-22 10:51:54
孫宇晨九億美元灰飛煙滅,地表最強(qiáng)也難逃被收割的命運(yùn)!

孫宇晨九億美元灰飛煙滅,地表最強(qiáng)也難逃被收割的命運(yùn)!

大秦共和國
2026-04-23 13:03:21
華為Pura X Max即將開賣,別上來就買最貴的!

華為Pura X Max即將開賣,別上來就買最貴的!

搞機(jī)小帝
2026-04-24 00:08:05
泰國潑水節(jié)一名15歲少女遭軍人尾隨進(jìn)公廁性侵,監(jiān)控曝光,嫌疑人已投案自首,將被移送軍事法庭

泰國潑水節(jié)一名15歲少女遭軍人尾隨進(jìn)公廁性侵,監(jiān)控曝光,嫌疑人已投案自首,將被移送軍事法庭

揚(yáng)子晚報(bào)
2026-04-21 22:25:47
劉家成接班人?多次獅子大開口全砸手里,球迷:賣人都賣不明白

劉家成接班人?多次獅子大開口全砸手里,球迷:賣人都賣不明白

弄月公子
2026-04-23 20:48:12
水變紅至少5年 小麥附近面粉廠不收 最終誰吃了

水變紅至少5年 小麥附近面粉廠不收 最終誰吃了

原某報(bào)記者
2026-04-22 15:49:04
2026北京車展:最值得看的13款車都在這了

2026北京車展:最值得看的13款車都在這了

周哥一影視
2026-04-23 15:23:49
何潔自曝養(yǎng)家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

何潔自曝養(yǎng)家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

扒點(diǎn)半吃瓜
2026-03-10 07:00:13
人類滅絕大局已定?科學(xué)家算出人類滅絕日期,我們能僥幸存活嗎?

人類滅絕大局已定?科學(xué)家算出人類滅絕日期,我們能僥幸存活嗎?

深度解析熱點(diǎn)
2026-04-23 00:32:44
沒對比就沒傷害,人民日報(bào)4字點(diǎn)名何潤東,該尷尬的何止張凌赫?

沒對比就沒傷害,人民日報(bào)4字點(diǎn)名何潤東,該尷尬的何止張凌赫?

舊事別提
2026-04-22 17:58:49
國家衛(wèi)健委:肺癌高危人群篩查推薦使用低劑量螺旋CT,普通CT的輻射劑量是低劑量螺旋CT的3到6倍

國家衛(wèi)健委:肺癌高危人群篩查推薦使用低劑量螺旋CT,普通CT的輻射劑量是低劑量螺旋CT的3到6倍

大象新聞
2026-04-23 17:45:23
新加坡寶爸爆料:在當(dāng)鋪花$35800買勞力士手表送兒子,當(dāng)場崩潰..

新加坡寶爸爆料:在當(dāng)鋪花$35800買勞力士手表送兒子,當(dāng)場崩潰..

新加坡萬事通
2026-04-22 20:55:03
重慶警方發(fā)布警情通報(bào)

重慶警方發(fā)布警情通報(bào)

極目新聞
2026-04-23 01:13:12
2026-04-24 00:47:00
純潔的微笑 incentive-icons
純潔的微笑
12年程序員經(jīng)歷,6年副業(yè)經(jīng)歷,喜歡像寫代碼一樣寫文章,現(xiàn)在一名程序員創(chuàng)業(yè)者
488文章數(shù) 311關(guān)注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產(chǎn)品",但量產(chǎn)難預(yù)測

頭條要聞

媒體:海軍宣傳片出現(xiàn)的"新兵何劍" 傳遞了巨大信息量

頭條要聞

媒體:海軍宣傳片出現(xiàn)的"新兵何劍" 傳遞了巨大信息量

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財(cái)經(jīng)要聞

普華永道賠償10億 恒大股東見到"回頭錢"

汽車要聞

令人驚艷的奇瑞車 風(fēng)云A9可不只是樣子貨

態(tài)度原創(chuàng)

藝術(shù)
手機(jī)
親子
公開課
軍事航空

藝術(shù)要聞

吉達(dá)塔蓋到第100層,“它是沙特唯一能按期完成的大項(xiàng)目”

手機(jī)要聞

vivo X500 Pro Max被曝光:2nm工藝+5GHz,2K直屏九月發(fā)!

親子要聞

新華讀報(bào)|打乒乓球有助提高兒童注意力

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

人民海軍成立77周年 主力艦艇亮相上海

無障礙瀏覽 進(jìn)入關(guān)懷版