国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

用“愛(ài)馬仕”踢掉OpenClaw?但未解決最根本問(wèn)題

0
分享至


文|Lambda

編輯|曉靜

4月初,Hermes Agent 火了。這個(gè)名字直接讓人聯(lián)想到奢侈品牌愛(ài)馬仕,所以也被圈內(nèi)戲稱為“愛(ài)馬仕Agent”。

它由 Nous Research 在 2 月發(fā)布,定位是「The agent that grows with you」。核心賣點(diǎn)是一個(gè)閉環(huán)學(xué)習(xí)系統(tǒng):Agent 完成復(fù)雜任務(wù)后,自動(dòng)把經(jīng)驗(yàn)固化成 Skill,下次遇到類似任務(wù)直接復(fù)用,還能在使用過(guò)程中持續(xù)改進(jìn)。Skill 自動(dòng)生成、越用越強(qiáng)——這是 Agent 領(lǐng)域目前最有吸引力的敘事之一。

但這個(gè)敘事遮蔽了一個(gè)更基本的問(wèn)題:Skill 真的是當(dāng)前 Agent 落地的主要瓶頸嗎?

該圖片可能由AI生成
圖片由AI生成01 Skill 很性感,但它可能不是最重要的問(wèn)題

一個(gè)容易被忽略的事實(shí)是:目前公認(rèn)體驗(yàn)最好的編程 Agent 產(chǎn)品之一——Claude Code,它好用的基石并不是 Skill 的自動(dòng)進(jìn)化,而是背后大量扎實(shí)的 CLI 工具支撐。

用 GlobTool 找候選文件,用 GrepTool 定位相關(guān)代碼片段,用 FileReadTool 查看實(shí)現(xiàn)細(xì)節(jié),用 LSPTool 做代碼符號(hào)跳轉(zhuǎn)和引用分析。每一個(gè)都是確定性的、零 token 消耗的原子操作。

但人們很少為這些工具寫(xiě)故事。只要一提到 Agent 能自動(dòng)生成 Skill、還能持續(xù)進(jìn)化,整個(gè)行業(yè)立刻就興奮起來(lái)。

這個(gè)反差說(shuō)明了一件事:CLI (命令行界面)不性感,不好講故事,但它才是 Agent 能力的真正地基。

地基不牢,Skill 再會(huì)長(zhǎng),也只是長(zhǎng)在沙地上。

02 龍蝦最被人詬病的地方,Skill 自主進(jìn)化解決不了

這件事放到 OpenClaw(俗稱“龍蝦”) 身上會(huì)看得更清楚。

OpenClaw 最被人詬病的兩點(diǎn),一是 token 消耗大、賬單吃不消,二是長(zhǎng)時(shí)間工作穩(wěn)定性差、經(jīng)常失聯(lián)。乍一看是兩個(gè)問(wèn)題;往下拆,會(huì)發(fā)現(xiàn)它們經(jīng)常來(lái)自同一個(gè)源頭:Agent 在用劣質(zhì)工具——比如脆弱的瀏覽器自動(dòng)化——去完成本該由確定性工具完成的任務(wù)。

這類成本在社區(qū)里并非抽象的抱怨,而有大量具體案例。

Reddit 上有 OpenClaw 用戶提到,自己只是想自動(dòng)化 X 賬號(hào)發(fā)帖,三次嘗試就花掉了 10 美元,任務(wù)還沒(méi)真正跑通。還有人在 r/automation 里直言,現(xiàn)在很多所謂的 AI Agent 瀏覽器控制,本質(zhì)上只是「披著智能外衣的脆弱自動(dòng)化」——問(wèn)題不在模型有多笨,而在底層工具本身就不可靠。頁(yè)面一變、DOM 一改、按鈕狀態(tài)一抖,Agent 就只能一遍遍觀察、一遍遍重試、一遍遍重新規(guī)劃。

而這些「失敗但不致命」的試錯(cuò)過(guò)程,并不會(huì)因?yàn)槿蝿?wù)沒(méi)完成就免費(fèi)——每一次觀察頁(yè)面、分析狀態(tài)、決定下一步,都在繼續(xù)消耗 token。

于是,穩(wěn)定性問(wèn)題和成本問(wèn)題,其實(shí)是同一個(gè)問(wèn)題的兩面:工具越脆弱,試錯(cuò)越多;試錯(cuò)越多,token 燒得越快;任務(wù)鏈越長(zhǎng),失聯(lián)和中斷的概率也越高。

從這個(gè)角度看,Skill 自主進(jìn)化解決的是「怎么更聰明地使用一個(gè)工具」,但并沒(méi)有解決「好工具本身稀缺」的問(wèn)題。Skill 可以讓 Agent 更熟練地駕馭一匹跛腳馬,但并不能把跛腳馬變成千里馬

這才是今天很多 Agent 系統(tǒng)真正卡住的地方:不是 Skill 不夠強(qiáng),而是底下能調(diào)度的高質(zhì)量原子工具太少。

03 Skill 是對(duì)模型能力的補(bǔ)丁

Hermes 做的事情,本質(zhì)上是把 Skill 的生成和優(yōu)化自動(dòng)化——讓 Agent 從經(jīng)驗(yàn)中蒸餾知識(shí),不再需要人手寫(xiě)。這確實(shí)解決了一個(gè)真實(shí)痛點(diǎn)。

但 Skill 本身有一個(gè)更深層的問(wèn)題:它是自然語(yǔ)言驅(qū)動(dòng)的,本質(zhì)上是模型能力的延伸,或者說(shuō),是一種對(duì)模型能力的借貸。

現(xiàn)狀是,大量 Agent 在用 Skill 加上自主解題能力,完成本該由 CLI 完成的事情——比如以效率低下的瀏覽器自動(dòng)化方案查一個(gè)股票價(jià)格、下載一張圖片、提交一個(gè)表單。代價(jià)很清楚:貴、慢、不穩(wěn)定、調(diào)試難。

這里還有一個(gè)常見(jiàn)的認(rèn)知誤區(qū),可以叫做「Skill 可遷移幻覺(jué)」:很多人以為,用強(qiáng)模型寫(xiě)出來(lái)的 Skill,可以無(wú)縫遷移給弱模型用。實(shí)際上不能。Skill 是自然語(yǔ)言指令,它對(duì)模型能力有隱性依賴;模型一換,行為就可能變。CLI 則不同——它是代碼:同樣的輸入,永遠(yuǎn)給你同樣的輸出,不管底下跑的是什么模型。

二者的區(qū)別非常鮮明:

  • Skill 調(diào)試難,CLI 調(diào)試容易;

  • Skill 燒 token,CLI 近乎零消耗;

  • Skill 吃模型版本,CLI 不吃;

  • Skill 是語(yǔ)義層資產(chǎn),CLI 是執(zhí)行層資產(chǎn)。

如果把 Skill 當(dāng)成核心積累方向,本質(zhì)上是把賭注壓在模型能力的穩(wěn)定性上。至少在當(dāng)前階段,更值得積累的是高質(zhì)量 CLI。

04 當(dāng)工具和上下文足夠好時(shí),Skill 的優(yōu)先級(jí)會(huì)自然下降

上面的分析也能從 Anthropic 自己的產(chǎn)品經(jīng)驗(yàn)里得到印證。

Anthropic 的設(shè)計(jì)負(fù)責(zé)人、Cowork 產(chǎn)品的設(shè)計(jì)主導(dǎo)者 Jenny Wen 在近期訪談中提到一個(gè)細(xì)節(jié):她個(gè)人其實(shí)不怎么用 Cowork 的 Skills 功能。原因不是她否定 Skill,而是她在 Cowork 里掛載了一個(gè)文件夾,里面有自己長(zhǎng)期積累的個(gè)人筆記、一對(duì)一會(huì)議記錄、隨手想法和工作觀察。對(duì)她來(lái)說(shuō),Cowork 從這些材料里已經(jīng)學(xué)到了足夠的信息,以至于她對(duì) Skill 和 Memory 的需求都被顯著削弱了。

這并不是說(shuō) Skill 沒(méi)有價(jià)值,而是說(shuō):當(dāng)上下文管理足夠好、底層工具足夠強(qiáng)時(shí),Skill 的優(yōu)先級(jí)會(huì)自然下降。

換言之,Hermes 所強(qiáng)調(diào)的 Skill 自主進(jìn)化并不是錯(cuò),而是它解決的問(wèn)題很可能沒(méi)有想象中那么基礎(chǔ)。

05 有一件事正在悄悄發(fā)生:CLI 的使用者,從人變成了 Agent

如果說(shuō) Skill 解決的是應(yīng)用層的編排問(wèn)題,那么更底層的變化發(fā)生在 CLI 上。

過(guò)去,CLI 是為人設(shè)計(jì)的。給人用的 CLI 可以有交互提示,可以容忍模糊輸出,也可以在文檔不全的時(shí)候靠用戶自己猜——因?yàn)槿藭?huì)停下來(lái),會(huì)理解歧義,會(huì)重試,會(huì)去查文檔。

Agent 不一樣。

Agent 不睡覺(jué),不容忍歧義,會(huì)并發(fā),會(huì)在沒(méi)有預(yù)料到的時(shí)機(jī)無(wú)限重試。一個(gè)對(duì)人類來(lái)說(shuō)「勉強(qiáng)能用」的 CLI,對(duì) Agent 來(lái)說(shuō)可能就是高頻事故源。

給 Agent 用的 CLI 必須滿足一組完全不同的要求:

  • 一條命令只產(chǎn)出一個(gè)明確結(jié)果;

  • 輸出是結(jié)構(gòu)化的 JSON;

  • 錯(cuò)誤信息不僅告訴你哪里錯(cuò)了,還要告訴 Agent 下一步該怎么辦;

  • 長(zhǎng)任務(wù)必須支持異步,不能讓 Agent 傻等;

  • 接口天然支持冪等、重試和并發(fā)。

背后只有一句話:以前的軟件默認(rèn)使用者要睡覺(jué)、會(huì)分心、有耐心;現(xiàn)在 Agent 不滿足這些前提。

一旦使用者從人變成 Agent,CLI 的設(shè)計(jì)哲學(xué)就需要從頭重寫(xiě)。Agent 真正在乎的是 token 消耗、緩存命中率、幻覺(jué)控制、長(zhǎng)程穩(wěn)定性,而不是「這個(gè)命令看起來(lái)是否優(yōu)雅」。

06 瀏覽器里能看到的,都值得被 CLI 化

有一個(gè)實(shí)驗(yàn)很能說(shuō)明問(wèn)題:把 ChatGPT 的網(wǎng)頁(yè)版變成一個(gè)可以被 Agent 調(diào)用的 CLI。

做法并不神秘——通過(guò) Chrome CDP 協(xié)議直接驅(qū)動(dòng)瀏覽器,操作 DOM,填輸入框,點(diǎn)發(fā)送,等待文字出現(xiàn),再把結(jié)果抓下來(lái)。因?yàn)閺?fù)用了已有登錄態(tài),行為上和人在瀏覽器里操作沒(méi)有本質(zhì)區(qū)別。

這個(gè)實(shí)驗(yàn)背后更大的洞察是:瀏覽器里能看到的,原則上都可以被 CLI 化。

不只是 ChatGPT——Gemini、音樂(lè)生成、視頻生成、股票圖表,只要能在瀏覽器里完成的流程,都可以被代碼重復(fù)執(zhí)行,最后收斂成一條 Agent 可調(diào)用的命令。

一旦一個(gè) Web 流程被 CLI 化,它就會(huì)從「需要 Agent 一步步盯著網(wǎng)頁(yè)試錯(cuò)」的流程,變成「可并發(fā)、可異步、可冪等的原子操作」。原來(lái)要靠瀏覽器自動(dòng)化消耗大量 token 才能完成的事,被壓縮成了一條命令、一個(gè)結(jié)構(gòu)化結(jié)果。

某種意義上,這是一條很反直覺(jué)但非常現(xiàn)實(shí)的優(yōu)化路徑:節(jié)省 token 的方法,不是少讓 Agent 干活,而是先燒一點(diǎn) token,把高頻流程預(yù)制成 CLI。磨刀不誤砍柴工。

這個(gè)邏輯也不只適用于 Web。桌面應(yīng)用和手機(jī) App,本質(zhì)上都可以被逐步 CLI 化,what you see is what can cli。目前已有不少開(kāi)源項(xiàng)目在分別推進(jìn)這三個(gè)方向,只是三者之間還沒(méi)有形成統(tǒng)一的設(shè)計(jì)語(yǔ)言和引起大家足夠的重視。

07 分層才是終態(tài)

Agent 的未來(lái),除了模型本身的提升,更取決于如何處理好兩種邏輯:確定性邏輯語(yǔ)義邏輯。

前者靠 CLI,后者靠 Skill 的自適應(yīng)和進(jìn)化。Hermes 解決的是后者,但前者才是今天很多系統(tǒng)真正缺的底座。

如果把 CLI 化推到極致,會(huì)出現(xiàn)一件很反直覺(jué)的事:一類流程完全固定的任務(wù),Agent 只需要判斷任務(wù)類型、路由到對(duì)應(yīng) CLI、拿結(jié)果回來(lái)——這個(gè)過(guò)程理論上甚至不需要 LLM,幾個(gè) if-else 就夠了。你甚至可以用代碼去模擬 LLM 的輸入輸出接口,零 token、零延遲,繼續(xù)復(fù)用現(xiàn)有的 Agent 調(diào)度機(jī)制,只在真正需要判斷的地方才調(diào)用真實(shí)模型。

這有點(diǎn)像 2026 年的一場(chǎng)「代碼的文藝復(fù)興」——人們開(kāi)始重新發(fā)現(xiàn),不是所有「看起來(lái)像智能」的問(wèn)題都應(yīng)該交給模型來(lái)解決。

終態(tài)的分工應(yīng)該是三層:

  • CLI 層:確定性執(zhí)行,零 token,可并發(fā),易測(cè)試,不依賴任何模型;

  • Skill 層:上下文編排和經(jīng)驗(yàn)蒸餾,越用越強(qiáng);

  • LLM 層:提供智能,做真正需要語(yǔ)義判斷的部分。

三層不是競(jìng)爭(zhēng)關(guān)系,而是依賴關(guān)系。

今天很多系統(tǒng)的問(wèn)題在于,它們跳過(guò)了 CLI 層,直接讓 Skill 和 LLM 去兜底。結(jié)果就是:系統(tǒng)又貴又慢,穩(wěn)定性也差。正確的路徑應(yīng)該是——開(kāi)發(fā)者預(yù)制 CLI,上層應(yīng)用自動(dòng)管理 Skill,LLM 在 Skill 的輔助下使用 CLI 解決問(wèn)題。

Hermes 的出現(xiàn)不是終點(diǎn),而是一個(gè)信號(hào):Skill 層的問(wèn)題可能正在被解決,但下一個(gè)真正的戰(zhàn)場(chǎng),在 CLI 層。

Web 端、PC 端、移動(dòng)端,三大平臺(tái)系統(tǒng)性的 CLI 改造才剛剛開(kāi)始。這可能才是今天 Agent 領(lǐng)域最值得做、也最不性感,但最關(guān)鍵的事情。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
歷史首人!詹姆斯解鎖43000+12000+12000神跡 總助攻歷史第四

歷史首人!詹姆斯解鎖43000+12000+12000神跡 總助攻歷史第四

醉臥浮生
2026-04-11 10:46:50
尷尬!42歲女士許愿征婚,一男子上臺(tái)想要配對(duì),被王婆當(dāng)場(chǎng)攔下

尷尬!42歲女士許愿征婚,一男子上臺(tái)想要配對(duì),被王婆當(dāng)場(chǎng)攔下

火山詩(shī)話
2026-04-11 07:11:00
道士給弟子教針灸被認(rèn)定非法行醫(yī),累計(jì)收到10萬(wàn)罰單,算不算“小過(guò)重罰”?衛(wèi)健局:已是最低處罰標(biāo)準(zhǔn)

道士給弟子教針灸被認(rèn)定非法行醫(yī),累計(jì)收到10萬(wàn)罰單,算不算“小過(guò)重罰”?衛(wèi)健局:已是最低處罰標(biāo)準(zhǔn)

大風(fēng)新聞
2026-04-10 19:30:03
全紅嬋網(wǎng)暴風(fēng)波再升級(jí)!浙江官媒下場(chǎng)發(fā)聲,不能放縱飯圈肆意沖塔

全紅嬋網(wǎng)暴風(fēng)波再升級(jí)!浙江官媒下場(chǎng)發(fā)聲,不能放縱飯圈肆意沖塔

談史論天地
2026-04-10 12:39:46
美國(guó)雇員因薪酬入不敷出,縱火燒了10億的貨

美國(guó)雇員因薪酬入不敷出,縱火燒了10億的貨

慕容律師
2026-04-10 22:39:12
德國(guó)“大神”來(lái)華手術(shù),被「中國(guó)病歷」嚇到:“我的天...”。中國(guó)醫(yī)生卻要天天扛著

德國(guó)“大神”來(lái)華手術(shù),被「中國(guó)病歷」嚇到:“我的天...”。中國(guó)醫(yī)生卻要天天扛著

醫(yī)護(hù)健康科普
2026-04-11 09:08:37
“遲重瑞與陳麗華年輕時(shí)合影”系誤傳,照片當(dāng)事人回應(yīng):張冠李戴,有的還加上黑白濾鏡,這是對(duì)陳麗華女士的不尊重

“遲重瑞與陳麗華年輕時(shí)合影”系誤傳,照片當(dāng)事人回應(yīng):張冠李戴,有的還加上黑白濾鏡,這是對(duì)陳麗華女士的不尊重

極目新聞
2026-04-11 08:56:29
全紅嬋微博自動(dòng)回復(fù)“罵我,我會(huì)反彈回去的”!網(wǎng)友:她曾多無(wú)助

全紅嬋微博自動(dòng)回復(fù)“罵我,我會(huì)反彈回去的”!網(wǎng)友:她曾多無(wú)助

火山詩(shī)話
2026-04-11 11:06:38
爭(zhēng)議?姆巴佩被打臉+流血!主裁拒判點(diǎn)球 皇馬官方:西甲暗箱操作

爭(zhēng)議?姆巴佩被打臉+流血!主裁拒判點(diǎn)球 皇馬官方:西甲暗箱操作

我愛(ài)英超
2026-04-11 06:15:26
關(guān)于兩岸和平統(tǒng)一,鄭麗文正式表態(tài),國(guó)民黨三人罕見(jiàn)支持,不簡(jiǎn)單

關(guān)于兩岸和平統(tǒng)一,鄭麗文正式表態(tài),國(guó)民黨三人罕見(jiàn)支持,不簡(jiǎn)單

DS北風(fēng)
2026-04-10 17:16:33
曝愛(ài)爾眼科醫(yī)院院長(zhǎng)猥褻女經(jīng)理,強(qiáng)行摟抱,細(xì)節(jié)曝光,已被停職

曝愛(ài)爾眼科醫(yī)院院長(zhǎng)猥褻女經(jīng)理,強(qiáng)行摟抱,細(xì)節(jié)曝光,已被停職

180視角
2026-04-10 14:27:07
一車牌號(hào)帶8888的奔馳S450L疑似作為陪葬品下葬,官方通報(bào)

一車牌號(hào)帶8888的奔馳S450L疑似作為陪葬品下葬,官方通報(bào)

界面新聞
2026-04-10 16:53:21
美以稱伊導(dǎo)彈系統(tǒng)損毀過(guò)半但可修復(fù)

美以稱伊導(dǎo)彈系統(tǒng)損毀過(guò)半但可修復(fù)

界面新聞
2026-04-11 09:23:19
普京和澤連斯基宣布:俄烏?;?2小時(shí)!澤連斯基:愿意與普京會(huì)面,但不是在莫斯科

普京和澤連斯基宣布:俄烏?;?2小時(shí)!澤連斯基:愿意與普京會(huì)面,但不是在莫斯科

每日經(jīng)濟(jì)新聞
2026-04-10 17:29:03
時(shí)隔35年!廣東東莞樟木頭上網(wǎng)絡(luò)平臺(tái)熱搜,真相令人震驚

時(shí)隔35年!廣東東莞樟木頭上網(wǎng)絡(luò)平臺(tái)熱搜,真相令人震驚

南方健哥
2026-04-10 23:13:49
高市不演了,東京降級(jí)對(duì)華關(guān)系,向全球告狀,稱中國(guó)欠日本兩筆賬

高市不演了,東京降級(jí)對(duì)華關(guān)系,向全球告狀,稱中國(guó)欠日本兩筆賬

書(shū)紀(jì)文譚
2026-04-10 16:17:03
門(mén)店腰斬2萬(wàn)家!一線撤離、雜牌泛濫,國(guó)民快餐巨頭徹底扛不住了

門(mén)店腰斬2萬(wàn)家!一線撤離、雜牌泛濫,國(guó)民快餐巨頭徹底扛不住了

毒sir財(cái)經(jīng)
2026-04-09 16:14:36
湖南祁東沿路插了百余米的白事支架燈籠,上面印“奠” 下面掛長(zhǎng)條幅,當(dāng)?shù)孛裾郑阂讶坎鸪?>
    </a>
        <h3>
      <a href=大風(fēng)新聞
2026-04-11 10:41:08
標(biāo)120W的充電器實(shí)際功率僅22.5W,商家:120W是產(chǎn)品型號(hào)

標(biāo)120W的充電器實(shí)際功率僅22.5W,商家:120W是產(chǎn)品型號(hào)

極目新聞
2026-04-11 00:53:31
巴頓孫子走進(jìn)烏克蘭指揮中心:每一次擊殺都在大屏直播

巴頓孫子走進(jìn)烏克蘭指揮中心:每一次擊殺都在大屏直播

桂系007
2026-04-11 00:11:11
2026-04-11 11:48:49
呼呼歷史論
呼呼歷史論
分享有趣的歷史
396文章數(shù) 16802關(guān)注度
往期回顧 全部

科技要聞

阿爾忒彌斯2號(hào)成功濺落,隔熱罩驚險(xiǎn)過(guò)關(guān)

頭條要聞

"遲重瑞與陳麗華年輕時(shí)合影"熱傳 當(dāng)事女子:張冠李戴

頭條要聞

"遲重瑞與陳麗華年輕時(shí)合影"熱傳 當(dāng)事女子:張冠李戴

體育要聞

換帥之后,他們從降級(jí)區(qū)沖到升級(jí)區(qū)

娛樂(lè)要聞

浪姐7淘汰 該走的沒(méi)走,不該走的走了

財(cái)經(jīng)要聞

從日本翻身看:這次誰(shuí)能扛住高油價(jià)?

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

態(tài)度原創(chuàng)

數(shù)碼
手機(jī)
親子
本地
公開(kāi)課

數(shù)碼要聞

大疆Pocket 4官宣4月16日發(fā)布:1英寸大底+可旋轉(zhuǎn)屏幕

手機(jī)要聞

橙色版OPPO Find X9 Ultra手機(jī)渲染圖曝光

親子要聞

小朋友們?cè)谟變簣@上生活勞動(dòng)課,忙著和面、縫紉、種菜

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版