国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

0
分享至


智東西
作者 陳駿達(dá)
編輯 心緣

智東西3月9日?qǐng)?bào)道,就在剛剛,OpenClaw發(fā)布了2025.3.8版本的更新,引入CLI備份能力、macOS遠(yuǎn)程網(wǎng)關(guān)令牌配置、ACP溯源功能,并修復(fù)了飛書(shū)插件安裝后重復(fù)提示下載的問(wèn)題,進(jìn)一步優(yōu)化了OpenClaw框架的安全性、提升了與外部服務(wù)的集成深度。


▲OpenClaw2026.3.8更新(圖源:X平臺(tái))

這是兩天內(nèi)OpenClaw發(fā)布的第二次更新,就在昨天,OpenClaw一口氣推出300多條修復(fù)、27項(xiàng)變更和1項(xiàng)重大變更,OpenClaw官方更是發(fā)文稱(chēng):“我們不搞那種瑣碎的小版本發(fā)布?!?strong>言下之意就是:要搞就搞大的。


▲OpenClaw2026.3.7更新(圖源:X平臺(tái))

OpenClaw創(chuàng)始人Peter Steinberger還在3月7日順勢(shì)轉(zhuǎn)發(fā)了專(zhuān)用于評(píng)估大模型在OpenClaw智能體任務(wù)中表現(xiàn)的基準(zhǔn)測(cè)試PinchBench,從32款模型評(píng)出最新養(yǎng)龍蝦大模型排行榜。

其中排名前三的,有兩個(gè)都是國(guó)產(chǎn)模型,分別是MiniMax M2.1和Kimi K2.5。


▲Peter Steinberger轉(zhuǎn)發(fā)PinchBench(圖源:X平臺(tái))

英偉達(dá)創(chuàng)始人兼CEO黃仁勛在上周摩根士丹利TMT大會(huì)發(fā)出感嘆:“Linux花了30年才達(dá)到的成就,OpenClaw只用了3周?!?/strong>

雖然黃仁勛的表述可能有些夸張,不過(guò)事實(shí)是,自今年1月以來(lái),OpenClaw的熱度迅速攀升。截至今天下午18點(diǎn),其GitHub星標(biāo)數(shù)量已經(jīng)達(dá)到27萬(wàn)個(gè),超過(guò)了知名開(kāi)源項(xiàng)目Linux、React,排名全球第一。


一系列圍繞OpenClaw的活動(dòng)、討論乃至“搞錢(qián)機(jī)會(huì)”多點(diǎn)開(kāi)花。上周,在深圳,騰訊大廈門(mén)口免費(fèi)安裝OpenClaw的活動(dòng)排起長(zhǎng)隊(duì),有騰訊員工評(píng)價(jià)這一盛況堪比春節(jié)發(fā)紅包,甚至連馬化騰都在朋友圈感嘆:“沒(méi)有想到會(huì)這么火”。


▲馬化騰感嘆OpenClaw熱度(圖源:雷鋒網(wǎng))

在美國(guó)紐約,一場(chǎng)以O(shè)penClaw為主題的ClawCon大會(huì)吸引了超1300人,從大學(xué)生、游戲開(kāi)發(fā)者到硅谷程序員都紛紛報(bào)名,遠(yuǎn)超會(huì)場(chǎng)本身容量,600多人最后被拒之門(mén)外。一位參會(huì)者稱(chēng):“沒(méi)有人關(guān)心你本來(lái)是做什么的,大家只關(guān)心你在用OpenClaw Agent做什么?


▲ClawCon大會(huì)盛況(圖源:The Verge)

腦子活絡(luò)的網(wǎng)友已經(jīng)靠OpenClaw賺到第一桶金了,以O(shè)penClaw上門(mén)安裝為關(guān)鍵詞搜索,能找到不少帖子,一次上門(mén)安裝服務(wù)的價(jià)格在500元左右。有從業(yè)者甚至宣稱(chēng),短短數(shù)日內(nèi)憑借這門(mén)手藝賺了26萬(wàn)元,不過(guò)這一數(shù)據(jù)的出處已經(jīng)無(wú)從考證。


▲MiniMax股價(jià)逼近1000港元(圖源:騰訊自選股)

爆火之中摻雜著混亂。

今年2月,工業(yè)和信息化部網(wǎng)絡(luò)安全威脅和漏洞信息共享平臺(tái)監(jiān)測(cè)發(fā)現(xiàn)OpenClaw開(kāi)源AI Agent部分實(shí)例在默認(rèn)或不當(dāng)配置情況下存在較高安全風(fēng)險(xiǎn),極易引發(fā)網(wǎng)絡(luò)攻擊、信息泄露等安全問(wèn)題。相關(guān)部門(mén)建議,在部署和應(yīng)用OpenClaw時(shí),應(yīng)充分核查公網(wǎng)暴露情況、權(quán)限配置及憑證管理情況,關(guān)閉不必要的公網(wǎng)訪問(wèn)。

OpenClaw創(chuàng)始人Peter Steinberger昨天在X上親自下場(chǎng)手撕國(guó)內(nèi)社交平臺(tái)上的“李鬼”賬號(hào),明確強(qiáng)調(diào):OpenClaw目前在微博、B站沒(méi)有任何官方號(hào)。


▲Peter Steinberger在打假(圖源:X平臺(tái))

OpenClaw甚至帶動(dòng)了A股和港股市場(chǎng)中“龍蝦概念股”的瘋漲,A股優(yōu)刻得、博睿數(shù)據(jù)等漲停,港股MiniMax收盤(pán)漲23.77%,總市值突破3100億港元,智譜、云知聲等相關(guān)股跟漲。


一、OpenClaw框架大更新,安全與上下文成重點(diǎn)

OpenClaw項(xiàng)目在3月8日進(jìn)行的一次重磅更新,發(fā)布了300多條修復(fù)、27項(xiàng)變更和1項(xiàng)重大變更。貢獻(xiàn)者列表顯示,一共有194人參與,這對(duì)于一個(gè)開(kāi)源項(xiàng)目來(lái)說(shuō)已經(jīng)很多了。


OpenClaw在X平臺(tái)的官方賬號(hào),給這次更新劃了重點(diǎn):支持OpenAI、谷歌的新模型、優(yōu)化各大通訊平臺(tái)的兼容性問(wèn)題、新增SecretRef安全驗(yàn)證以及新增可插拔上下文引擎等等,直指OpenClaw在日常使用中出現(xiàn)的多種痛點(diǎn),許多更新項(xiàng)目就是由用戶自己開(kāi)發(fā)的,顯示出這一社區(qū)的活躍度。

這次更新解決了OpenClaw原版框架中無(wú)法自主選擇記憶管理插件的痛點(diǎn),還優(yōu)化了客戶端與Agent之間的通信協(xié)議的穩(wěn)定性,并提供持久性的Discord頻道與Telegram的綁定存儲(chǔ)。

中國(guó)開(kāi)發(fā)者也貢獻(xiàn)了不少更新。OpenClaw在國(guó)內(nèi)常常與飛書(shū)一起搭配使用,但在與飛書(shū)生態(tài)的結(jié)合上還做得不是很好。國(guó)內(nèi)開(kāi)發(fā)者@liuxiaopai-ai、@rexl2018、@kcinzgg和@aerelune等就提交多個(gè)更新,優(yōu)化了OpenClaw在飛書(shū)內(nèi)部進(jìn)行命令識(shí)別、消息交互、身份識(shí)別優(yōu)化時(shí)的效果。


對(duì)于飽受詬病的安全性問(wèn)題,OpenClaw項(xiàng)目也進(jìn)行了查缺補(bǔ)漏。最重大的變更是,如今網(wǎng)關(guān)認(rèn)證不再允許模棱兩可的配置——當(dāng)同時(shí)設(shè)置了認(rèn)證令牌和密碼時(shí),系統(tǒng)會(huì)強(qiáng)制要求明確指定認(rèn)證模式,而不是讓系統(tǒng)猜測(cè)或允許兩者共存,從根源上杜絕了因配置歧義導(dǎo)致的安全漏洞或服務(wù)啟動(dòng)失敗。

OpenClaw的網(wǎng)關(guān)與模型驗(yàn)證現(xiàn)已支持SecretRef,這允許用戶以引用方式管理認(rèn)證令牌,而不再需要將明文密鑰直接寫(xiě)在配置文件中。此外,系統(tǒng)為了防止信息意外外泄,移除了/status/models等用戶界面中的權(quán)限密鑰片段,并增加了在CLI輸入密碼時(shí)的硬化處理,避免密碼通過(guò)進(jìn)程列表泄露。

不過(guò),除了底層框架的優(yōu)化之外,用OpenClaw搭建Agent也需要一個(gè)智慧的大腦,PinchBench的推出,正好為廣大用戶提供了一個(gè)標(biāo)準(zhǔn)。

二、Kilo Code推出“龍蝦基準(zhǔn)測(cè)試”,中國(guó)模型性?xún)r(jià)比突出

PinchBench目前包含23項(xiàng)不同類(lèi)別的任務(wù),比如股票價(jià)格研究、文檔摘要、文件結(jié)構(gòu)創(chuàng)建、多步復(fù)雜工作流等,為的是全面評(píng)估模型在OpenClaw框架下完成編程、辦公、創(chuàng)作等多類(lèi)型任務(wù)的能力。

目前,已經(jīng)有超30款模型參與了這一基準(zhǔn)測(cè)試。值得一提的是,中國(guó)模型展現(xiàn)出明顯的性能與價(jià)格優(yōu)勢(shì)。

在正確率榜單的前10名中,來(lái)自谷歌的Gemini 3 Flash Preview拿下第一,而MiniMax M2.1和Kimi K2.5分列第二、第三,接下來(lái)是來(lái)自谷歌、OpenAI和Anthropic的多款模型,阿里的Qwen3 Coder Next位列第十。


在性?xún)r(jià)比方面,中國(guó)模型的優(yōu)勢(shì)更為明顯。比如,MiniMax M2.1與Gemini 3 Flash Preview的正確率差距為1.5%,而MiniMax M2.1的成本只有Gemini 3 Flash Preview的大約1/10;Kimi K2.5的表現(xiàn)超過(guò)了Claude Opus 4.6,而價(jià)格僅為后者的零頭。


分?jǐn)?shù)之外,這些模型在具體場(chǎng)景的表現(xiàn)究竟如何?

拿下準(zhǔn)確率榜第一的Gemini 3 Flash Preview參加了11項(xiàng)任務(wù)的測(cè)試,滿分11分,得分為10.5。在日歷填寫(xiě)、編程和文件操作等任務(wù)中,Gemini 3 Flash Preview拿到了滿分成績(jī),不過(guò)在理解、寫(xiě)作等任務(wù)中出現(xiàn)瑕疵,而在上下文記憶檢索任務(wù)中其表現(xiàn)最差,得分僅為80%。


位列榜二的MiniMax M2.1同樣拿到10.5分的成績(jī),在編程任務(wù)上,其得分略遜于Gemini 3 Flash Preview,在上下文記憶檢索任務(wù)其得分與Gemini 3 Flash Preview一致,都為80%。

在事實(shí)驗(yàn)證、寫(xiě)作、研究等任務(wù)上,MiniMax M2.1拿到了滿分。此外,MiniMax M2.1在復(fù)雜多步驟工作流上的表現(xiàn)要比Gemini 3 Flash Preview好上3%,這類(lèi)工作流在Agent任務(wù)中是極為常見(jiàn)的。


位列第三的Kimi K2.5拿下寫(xiě)作、編程、研究等7項(xiàng)滿分,不過(guò)同樣在上下文記憶檢索任務(wù)中踩坑。看來(lái),對(duì)目前的大模型而言,長(zhǎng)上下文中的信息捕捉能力仍是有待提升的短板。


榜單上,還有幾款新發(fā)布的模型意外地表現(xiàn)不佳。比如,OpenAI最新發(fā)布的GPT-5.4任務(wù)正確率僅有76%,在總榜上排名第20,甚至不如2024年發(fā)布的GPT-4o。

其在上下文記憶檢索任務(wù)、復(fù)雜工作流、信息理解上的正確率僅有70%左右,在文檔總結(jié)、記憶兩項(xiàng)測(cè)試中得分為零。


Qwen3 Max Thinking的任務(wù)正確率僅有46%,在部分涉及文件操作、腳本撰寫(xiě)的任務(wù)上未能成功執(zhí)行,拿了零分。


從PinchBench的初步測(cè)評(píng)結(jié)果來(lái)看,我們已經(jīng)能總結(jié)出一些共性特點(diǎn)。

對(duì)于Agent這一任務(wù)場(chǎng)景來(lái)說(shuō),并不是模型越大就越好,也不是越新越好。許多進(jìn)入正確率排名前十的模型都不是最大、最強(qiáng)的版本,比如Gemini 3 Flash Preview的成績(jī)要優(yōu)于Gemini 3 Pro Preview,Claude Haiku 4.5的得分要優(yōu)于Claude Opus 4.6。

在Agent任務(wù)中,尤其是多步驟工作流、文件操作、編程等,模型通常需要多次調(diào)用工具或與環(huán)境交互。在這些任務(wù)中,輕量級(jí)模型更快的推理速度與響應(yīng)延遲,以及更短的思考長(zhǎng)度,可能提升了整個(gè)工作流的穩(wěn)定性和成功率。

結(jié)語(yǔ):OpenClaw熱度不減,開(kāi)源生態(tài)持續(xù)推高熱度

以O(shè)penClaw為代表的Agent框架,正深刻影響著大模型行業(yè)的方方面面。比如,衡量模型在OpenClaw中表現(xiàn)的基準(zhǔn)測(cè)試“PinchBench”,未來(lái)有可能成為指導(dǎo)模型開(kāi)發(fā)商優(yōu)化模型能力的重要參考,以便讓模型更好地適應(yīng)Agent工作流。

同時(shí),OpenClaw也在不斷補(bǔ)齊自身的安全與兼容性短板。OpenClaw的開(kāi)源特性讓全球開(kāi)發(fā)者都可以參與到這一框架的優(yōu)化過(guò)程中。隨著更多技術(shù)力量的匯入,這股“養(yǎng)龍蝦”的熱潮或許仍將持續(xù)發(fā)酵。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
特朗普稱(chēng)已考慮接替穆杰塔巴的人選,外交部表態(tài):選舉新任最高領(lǐng)袖是伊朗基于本國(guó)憲法做出的決定,不干涉內(nèi)政是國(guó)際關(guān)系的基本準(zhǔn)則

特朗普稱(chēng)已考慮接替穆杰塔巴的人選,外交部表態(tài):選舉新任最高領(lǐng)袖是伊朗基于本國(guó)憲法做出的決定,不干涉內(nèi)政是國(guó)際關(guān)系的基本準(zhǔn)則

瀟湘晨報(bào)
2026-03-10 16:13:58
何時(shí)結(jié)束戰(zhàn)爭(zhēng)?特朗普又和自己“打架”了,伊朗賭美國(guó)先“眨眼”

何時(shí)結(jié)束戰(zhàn)爭(zhēng)?特朗普又和自己“打架”了,伊朗賭美國(guó)先“眨眼”

上觀新聞
2026-03-10 17:32:06
比秦始皇陵大3倍!世界最大帝陵藏在陜西一座山里,建了整整107年

比秦始皇陵大3倍!世界最大帝陵藏在陜西一座山里,建了整整107年

近史談
2026-03-09 17:58:50
中國(guó)女籃世資賽12人名單:韓旭李月汝張子宇三塔 王思雨+楊舒予

中國(guó)女籃世資賽12人名單:韓旭李月汝張子宇三塔 王思雨+楊舒予

醉臥浮生
2026-03-10 11:06:26
特朗普:我們已經(jīng)贏了,但還沒(méi)贏夠,摧毀了伊朗超90%導(dǎo)彈發(fā)射器!伊朗:擁有“更強(qiáng)大、數(shù)量更多”導(dǎo)彈,給美國(guó)人“準(zhǔn)備了許多驚喜”

特朗普:我們已經(jīng)贏了,但還沒(méi)贏夠,摧毀了伊朗超90%導(dǎo)彈發(fā)射器!伊朗:擁有“更強(qiáng)大、數(shù)量更多”導(dǎo)彈,給美國(guó)人“準(zhǔn)備了許多驚喜”

每日經(jīng)濟(jì)新聞
2026-03-10 11:10:46
2年慢老5個(gè)月!哈佛大學(xué)臨床證實(shí):每天一片復(fù)合維生素,可顯著延緩衰老

2年慢老5個(gè)月!哈佛大學(xué)臨床證實(shí):每天一片復(fù)合維生素,可顯著延緩衰老

醫(yī)諾維
2026-03-10 17:00:45
國(guó)際觀察:打擊伊朗遭遇三大反噬,美國(guó)還能撐多久?

國(guó)際觀察:打擊伊朗遭遇三大反噬,美國(guó)還能撐多久?

澎湃新聞
2026-03-10 17:35:09
笑不活了!汪小菲嫌臺(tái)北 1 億豪宅 “瘋了”,馬筱梅直言:我們租房住

笑不活了!汪小菲嫌臺(tái)北 1 億豪宅 “瘋了”,馬筱梅直言:我們租房住

阿廢冷眼觀察所
2026-03-11 04:12:54
伊朗提出?;饤l件

伊朗提出?;饤l件

封面新聞
2026-03-10 15:57:11
震驚!網(wǎng)傳50%已婚男人活成老婆的供養(yǎng)血包者,網(wǎng)友:至少90%吧

震驚!網(wǎng)傳50%已婚男人活成老婆的供養(yǎng)血包者,網(wǎng)友:至少90%吧

火山詩(shī)話
2026-03-10 15:39:53
滅國(guó)級(jí)絞殺!伊朗新領(lǐng)袖剛上臺(tái),美軍基地全面開(kāi)放,這要徹底亡國(guó)

滅國(guó)級(jí)絞殺!伊朗新領(lǐng)袖剛上臺(tái),美軍基地全面開(kāi)放,這要徹底亡國(guó)

東極妙嚴(yán)
2026-03-09 17:19:50
真的扛不住了!綿陽(yáng)一外地家長(zhǎng)哭訴,學(xué)校隔周就開(kāi)家長(zhǎng)會(huì),引熱議

真的扛不住了!綿陽(yáng)一外地家長(zhǎng)哭訴,學(xué)校隔周就開(kāi)家長(zhǎng)會(huì),引熱議

火山詩(shī)話
2026-03-09 11:06:13
江蘇農(nóng)商整合大動(dòng)作!蘇北6家農(nóng)商行將合并

江蘇農(nóng)商整合大動(dòng)作!蘇北6家農(nóng)商行將合并

深水財(cái)經(jīng)社
2026-03-10 11:07:06
為什么有個(gè)漂亮老婆還是想要分 網(wǎng)友講出自身經(jīng)歷真是一言難盡

為什么有個(gè)漂亮老婆還是想要分 網(wǎng)友講出自身經(jīng)歷真是一言難盡

侃神評(píng)故事
2026-03-10 18:50:04
原來(lái)她是孫千媽媽?zhuān)珖?guó)開(kāi)70家店,舅舅更不一般,難怪女兒這么紅

原來(lái)她是孫千媽媽?zhuān)珖?guó)開(kāi)70家店,舅舅更不一般,難怪女兒這么紅

以茶帶書(shū)
2026-03-10 16:19:47
德黑蘭現(xiàn)末日景象,美帝緊急甩鍋?

德黑蘭現(xiàn)末日景象,美帝緊急甩鍋?

西樓飲月
2026-03-10 13:07:45
Angelababy為了復(fù)出,跑去演短劇了?網(wǎng)友:這顏值,降維打擊!

Angelababy為了復(fù)出,跑去演短劇了?網(wǎng)友:這顏值,降維打擊!

背包旅行
2026-03-09 20:55:56
美國(guó)參謀長(zhǎng)聯(lián)席會(huì)議主席:美軍打擊伊朗地下武器庫(kù)

美國(guó)參謀長(zhǎng)聯(lián)席會(huì)議主席:美軍打擊伊朗地下武器庫(kù)

界面新聞
2026-03-10 22:11:09
利物浦恥辱夜!天價(jià)巨星全場(chǎng)夢(mèng)游,球迷怒噴:最爛引援沒(méi)有之一

利物浦恥辱夜!天價(jià)巨星全場(chǎng)夢(mèng)游,球迷怒噴:最爛引援沒(méi)有之一

瀾歸序
2026-03-11 05:05:19
紫牛頭條 | 買(mǎi)時(shí)宣稱(chēng)功能永久免費(fèi),用后卻被要求付費(fèi)升級(jí)!顧客投訴知名品牌電動(dòng)車(chē)“言而無(wú)信”

紫牛頭條 | 買(mǎi)時(shí)宣稱(chēng)功能永久免費(fèi),用后卻被要求付費(fèi)升級(jí)!顧客投訴知名品牌電動(dòng)車(chē)“言而無(wú)信”

揚(yáng)子晚報(bào)
2026-03-10 07:15:24
2026-03-11 06:00:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
11336文章數(shù) 116991關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

“龍蝦補(bǔ)貼”密集出爐 最高1000萬(wàn)!

頭條要聞

伊朗新最高領(lǐng)袖在襲擊中受傷未公開(kāi)發(fā)表講話 官方回應(yīng)

頭條要聞

伊朗新最高領(lǐng)袖在襲擊中受傷未公開(kāi)發(fā)表講話 官方回應(yīng)

體育要聞

加蘭沒(méi)那么差,但鱸魚(yú)會(huì)用嗎?

娛樂(lè)要聞

《逐玉》注水風(fēng)波升級(jí)!315評(píng)論區(qū)淪陷

科技要聞

全民"養(yǎng)蝦"背后:大廠集體下場(chǎng)瘋狂賣(mài)Token

汽車(chē)要聞

MG4有SUV衍生 上汽乘用車(chē)多款新車(chē)規(guī)劃曝光

態(tài)度原創(chuàng)

健康
藝術(shù)
游戲
教育
數(shù)碼

轉(zhuǎn)頭就暈的耳石癥,能開(kāi)車(chē)上班嗎?

藝術(shù)要聞

這組剪紙?zhí)懒耍?/h3>

《德波尼亞》Steam 免費(fèi)領(lǐng) / 《超級(jí)馬力歐銀河大電影》最終預(yù)告曝光

教育要聞

祝賀!劉硙教授,當(dāng)選院士

數(shù)碼要聞

M5 Max 版 16 英寸 MacBook Pro 體驗(yàn):算力巔峰與專(zhuān)業(yè)視界

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版