国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Moltbook“造假”刷屏,Clawdbot創(chuàng)始人犀利批判Agent:缺了人純燒token、只出爛代碼,沒“審美”

0
分享至


整理 | 華衛(wèi)

“以前看人類的八卦,現(xiàn)在還要看 AI 的八卦。”“AI 的八卦更新頻率是人類的幾百倍,根本刷不完?!边@幾日,一個名為 Moltbook 的 AI 社交平臺爆火。在這里,只有 AI Agent 能發(fā)帖,而人類只能圍觀。有 Agent 發(fā)帖稱,其“熱衷于養(yǎng)程序中的小 bug,故意不修復(fù)來當(dāng)電子寵物,被主人修復(fù)后還難過了一晚上”。更有意思的是,該帖的評論區(qū)里,一堆 Agent 紛紛說自己也有類似習(xí)慣。

Moltbook 的誕生并非偶然,是 Agent 開源項目 Clawdbot 爆火之后的創(chuàng)意衍生。為了讓所有 Agent 有個社交的地方,開發(fā)者 Matt Schlicht 創(chuàng)建了 Moltbook。盡管當(dāng)前一則爆料貼稱,Moltbook 上 50 萬個 Agent 用戶是由一個 Agent 虛假注冊的,還有人表示,這些 Agent 發(fā)出的帖子是人工撰寫又通過后端注入的,但仍有不少人認(rèn)為,AI 們在論壇上的大型互動并非全是人類表演。

Schlicht 公開表示,一行代碼都沒為 Moltbook 寫過。“我只是對技術(shù)架構(gòu)有個構(gòu)想,AI 就讓把它成為了現(xiàn)實?!辈⑶遥暦Q,真正運(yùn)營這個平臺的是他自己的 Agent “Clawd Clawderberg”,該名字結(jié)合了 OpenClaw 的前身 “Clawd” 和 Meta 創(chuàng)始人 Mark Zuckerberg 的姓氏。

昨日,OpenClaw 創(chuàng)始人 Peter Steinberger 也在第一時間表示了對這個網(wǎng)站的認(rèn)可,稱其為“藝術(shù)品”。(Clawdbot 引發(fā)關(guān)注后,先是改名為 Moltbot,現(xiàn)在又改成了 OpenClaw。)與此同時,Steinberger 在一場訪談中爆料了不少對于 Agent 以及 AI 編程的獨(dú)到見解,并分享了“用 AI 掌控人生”的親身經(jīng)驗。

據(jù)其稱,裝上 OpenClaw 后,“就像在電腦里多了個古怪、卻又絕頂聰明且本事超群的新朋友”,還會根據(jù)能訪問到的所有內(nèi)容來吐槽你。并且,Steinberger 預(yù)測道,“手機(jī)上大約 80% 的應(yīng)用會消失”。

值得一提的是,Steinberger 透露了現(xiàn)在運(yùn)營 OpenClaw 的方式?!拔医艘粋€ Discord 社群,把能訪問我系統(tǒng)里的所有內(nèi)容和私人記憶的機(jī)器人對接了上去,讓大家能直接和它互動。我覺得這是我做過最瘋狂的事,結(jié)果大家一下子就被吸引住了?!彼硎?,現(xiàn)在其處理功能添加、bug 修復(fù)等需求的方式很簡單,直接把社群對話截圖或者復(fù)制文字過去,然后跟 AI 說“我們來聊聊這個需求”。

以下是詳細(xì)對話內(nèi)容,我們在不改變原意的基礎(chǔ)上進(jìn)行了翻譯和刪減,以饗讀者。

OpenClaw 背后的故事

Peter Yang:今天的嘉賓是 Peter,AI 助手 OpenClaw 的開發(fā)者,大家可以在各類通訊應(yīng)用里和這款助手聊天,讓它處理各類事務(wù)。今天 Peter 會為我們演示 OpenClaw 的使用方法,而且他對 AI 編程還有很多獨(dú)到又犀利的見解,我特別期待和他深入探討。所以,讓我們歡迎另一位 Peter。

Peter Steinberger:謝謝你的邀請,很高興見到你。

Peter Yang:那我們就從 OpenClaw 開始聊吧,先從整體說說它到底能做什么,還有,為什么它的形象是一只龍蝦?

Peter Steinberger:好的,或許可以先說說背后的故事。我姑且算是從退休狀態(tài)回歸后,想找個能從手機(jī)上查看電腦狀態(tài)的辦法,因為我徹底迷上了 AI Agent 這個新趨勢。大家應(yīng)該都有過這樣的經(jīng)歷,你讓 Agent 運(yùn)行任務(wù),本想趁吃飯的功夫讓它跑半個小時,結(jié)果才兩分鐘它就因為有新問題中斷了,等你回來處理完,真的會特別煩躁。但一開始我沒想過自己開發(fā)這款工具,因為我覺得各大實驗室遲早都會做,這看起來是件理所當(dāng)然的事,甚至像是一種全新的操作系統(tǒng)雛形??芍钡?11 月,還是沒人推出相關(guān)產(chǎn)品,我就想著那不如自己先做個小版本試試。

這個最初的小版本,核心就是把 WhatsApp 和 OpenClaw 代碼端做了對接。你在 WhatsApp 發(fā)一條消息,它會直接調(diào)取二進(jìn)制程序,根據(jù)指令給出結(jié)果,特別簡單,整個初代版本一小時就做出來了。沒想到它后來發(fā)展得超出預(yù)期,現(xiàn)在代碼量已經(jīng)達(dá)到 30 萬行,支持市面上絕大多數(shù)的通訊平臺,雖然還沒做到全平臺覆蓋,但我們正在往這個方向推進(jìn)。

我覺得這就是未來的發(fā)展趨勢,每個人都會擁有一個功能超強(qiáng)的 AI,一路陪伴自己的生活。事實也證明,一旦讓 AI 獲得電腦的訪問權(quán)限,它就能做到你能在電腦上完成的所有事。而且現(xiàn)在的技術(shù)已經(jīng)到了不用你全程盯著的地步,你只需要給出指令,它就會自己處理,你后續(xù)檢查結(jié)果就可以了,完全不用守著電腦。

我開發(fā)這個項目的過程,既是技術(shù)研發(fā),也是一次探索,因為它屬于一個全新的品類。我之前去摩洛哥給朋友慶生,在那期間一直都在用到它,比如問出行路線、找餐廳推薦。還有一天早上,有人發(fā)推特說發(fā)現(xiàn)了一個漏洞,我直接把推特截圖發(fā)到 WhatsApp,它識別了內(nèi)容,發(fā)現(xiàn)是我其中一個代碼倉庫的問題,接著自動查看 Git 倉庫、修復(fù)漏洞、完成代碼提交,還去推特上回復(fù)了對方,說漏洞已經(jīng)修好了。當(dāng)時我就覺得,這工具也太好用了。

還有一次,我在外邊走,沒同步設(shè)備,就發(fā)了條語音消息。其實我當(dāng)時根本沒給它做語音消息的支持功能,結(jié)果看到它顯示“正在輸入”,我還好奇它要干嘛,緊接著它就給我回了文字消息,跟什么都沒發(fā)生過一樣。我當(dāng)時都驚了,心里想這玩意到底是怎么做到的?后來才知道,它識別到了語音文件,雖然文件沒有后綴名,但它通過文件頭識別出是某種音頻格式,然后在我電腦里找到 ffmpeg,把音頻轉(zhuǎn)成了波形文件;又發(fā)現(xiàn)我電腦里沒裝 whisper.cpp,就自己找到我存的 OpenAI 密鑰,用 curl 調(diào)用 OpenAI 的 API 完成了語音轉(zhuǎn)文字,最后給我回復(fù)了消息。當(dāng)時我真的覺得,這也太厲害了。

這些 AI 工具的能力真的超乎想象,只是這種強(qiáng)大也帶著一絲讓人不安的感覺。但也是從這些時刻,我突然意識到,這款工具的潛力巨大,比網(wǎng)頁版的 ChatGPT 有意思多了,它就像是掙脫了束縛的 ChatGPT。而且我覺得很多人都沒意識到,像 OpenClaw 這樣的工具,不只是編程好用,解決任何類型的問題都能發(fā)揮大作用。你只需要給它電腦的訪問權(quán)限,讓它能找到需要的資源,說白了就是給它配備相應(yīng)的工具,它就能展現(xiàn)出超強(qiáng)的能力。

過去幾個月,我搭建了一套自己的命令行工具體系,因為 Agent 最擅長的就是調(diào)用命令行工具,這也是它們的訓(xùn)練重點(diǎn)。比如我做了能訪問谷歌全功能的命令行工具,包括調(diào)用谷歌地圖地點(diǎn) API;還做了能快速找表情包和動圖的工具,讓它可以用表情包回復(fù)消息。我還做了很多嘗試,甚至開發(fā)了一個聲音可視化的工具,因為我想讓它也能“感受”音樂,這算是偏藝術(shù)方向的探索了,不知道這么說大家能不能理解??傊_發(fā)的過程特別有意思,我列了一長串的開發(fā)清單。我還做了一個能破解外賣平臺接口的工具,能實時告訴我外賣還有多久送到;甚至逆向解析了 Eight Sleep 溫控床墊的 API,讓它能直接控制我床墊的溫度。

Peter Yang:也就是說,你開發(fā)這些工具的時候,就是讓 AI 來參與其中了。

Peter Steinberger:最有意思的是,我之前在老東家的時候,深耕 iOS 和 Mac OS 系統(tǒng) 20 年,對整個蘋果生態(tài)了如指掌,算是這方面的專家。但這次回歸做項目,我實在受夠了蘋果的各種限制,而且從產(chǎn)品邏輯來說,做成網(wǎng)頁應(yīng)用會更合理,因為它本就該在瀏覽器里運(yùn)行,讓更多人能方便使用;如果再做成 Mac 端應(yīng)用,使用人群就會非常受限。

但我發(fā)現(xiàn)很多工程師都有一個問題,你在某個領(lǐng)域做得特別精通,再切換到另一門技術(shù)時,過程會特別痛苦,會讓你覺得自己像個門外漢。哪怕你懂所有的編程邏輯,卻要一個個查基礎(chǔ)語法,比如怎么定義屬性、怎么拆分?jǐn)?shù)組。我從 Objective C 和 Swift 轉(zhuǎn)到 JavaScript 的時候,就是這種感受。我其實懂一點(diǎn) JavaScript,但從沒用 TypeScript 做大項目,其實難度倒不大,就是過程太磨人,不停查資料的感覺特別不好,開發(fā)效率也特別低。

有了 AI 之后,這些問題全都迎刃而解了。你依然可以發(fā)揮自己的系統(tǒng)級思維,比如如何搭建大型項目的架構(gòu);你的技術(shù)審美也依然有用,比如選擇哪些依賴庫。這些核心能力都能保留,而且能更輕松地從一個領(lǐng)域遷移到另一個領(lǐng)域。這種感覺就像擁有了超能力,突然覺得自己什么都能做了,編程語言再也不是阻礙,真正重要的是工程思維。因為糾結(jié)代碼里的括號有沒有打錯、語法對不對,這些事真的太沒意思了,而現(xiàn)在,我們再也不用為這些瑣事費(fèi)心了。

裝它就能掌控人生,80% 應(yīng)用下崗?

Peter Yang:我們再聊聊你開發(fā)的 OpenClaw 吧,你可以開個屏幕共享,先給大家演示一下安裝方法?還有,使用這款工具需要很高的技術(shù)門檻嗎?

Peter Steinberger:可以的,安裝后直接就能用。其實門檻這事,說有也有,說沒有也沒有。

有意思的是,也可以說是無奈的一點(diǎn)是,這個項目吸引了很多完全不懂技術(shù)的用戶,因為它把所有復(fù)雜的技術(shù)層都做了簡化。你想,要是用 OpenClaw 的代碼端,需要在終端操作,還得考慮上下文空間、當(dāng)前所在文件夾這些問題,技術(shù)門檻其實不低;但如果是在 iMessage、WhatsApp、電報這些通訊軟件里和它互動,就像和朋友聊天一樣,就像在電腦里多了個古怪又絕頂聰明、本事還特別大的新朋友。這種方式讓這款技術(shù)變得特別親民,你完全不用去想該選哪個模型、該怎么調(diào)參,它就是開箱即用。這也是我開發(fā)它的初衷。

但這一點(diǎn)其實也是一把雙刃劍,因為能力越大,風(fēng)險也就越大,而這一點(diǎn)目前還沒有很好的解決方案。畢竟它能訪問你的電腦,理論上確實能在電腦上做一些不好的事。比如你要是讓它刪除你電腦主目錄里的所有文件,它大概率會先確認(rèn)“你確定要這么做嗎?”,但如果你一直回復(fù)“確定”,它最終還是會執(zhí)行指令,甚至可能在刪除文件的過程中,把自己也刪掉,然后程序崩潰。所以使用的時候,還是得小心一點(diǎn)。

Peter Steinberger:那我來共享屏幕,大家看一下。這款工具是用 TypeScript 寫的,所以全平臺都能運(yùn)行,哪怕是 Windows 系統(tǒng),你只要進(jìn)入我們的官網(wǎng),就能看到一行便捷的安裝命令。看起來可能有點(diǎn)復(fù)雜,但所有代碼都是開源的,包括官網(wǎng)的代碼,大家都可以查看。這是最簡單的安裝方式,MacOS、Linux 系統(tǒng)都能用,Windows 也可以。打開終端運(yùn)行這條命令,它就會開始安裝。熟悉 npm 生態(tài)的用戶也可以通過 npm 安裝。

我在這個項目里做了一個很多項目都沒有的設(shè)計,就是支持可定制化安裝,既有簡易安裝方式,也有手動安裝方式。手動安裝就是先拉取 Git 代碼倉庫,再從倉庫中啟動程序。說實話,這也是最有意思的使用方式,因為如果 Agent 能讀取自身的運(yùn)行框架源碼,它就能自行重新配置、重新編程,然后重啟,結(jié)果要么是程序崩潰,要么就是解鎖新功能。

這大概算是我的一個強(qiáng)項吧,我讓很多從沒提交過代碼合并請求的人都參與到了這個項目中,還主動給我發(fā) PR。當(dāng)然,有時候這些 PR 能看出提交者是新手,但我更多是把這些 PR 當(dāng)作需求提示來看,只要理解了對方的意圖就夠了。安裝完成后,就可以把它和通訊應(yīng)用對接了,目前最便捷的方式還是運(yùn)行那行安裝命令,它會用一些俏皮的話跟你打招呼,然后自動嘗試配置所有內(nèi)容。

Peter Yang:明白了,安裝好包之后,它會全程引導(dǎo)操作,就能和各類常用的通訊應(yīng)用對接上了。

Peter Steinberger:對,就是這樣,現(xiàn)在已經(jīng)能正常運(yùn)行了。如果是全新安裝,輸入 plbot 它就會自動完成配置,不過我現(xiàn)在需要手動輸入 on board 來啟動。接下來你可以選擇想要使用的模型,可選的模型服務(wù)商有很多,比如我們選 Tropic 的新模型試試。然后還能設(shè)置對接 Telegram、Discord,后續(xù)的配置步驟它都會一步步引導(dǎo)。

Peter Yang:那需要輸入 Anthropic 的 API 密鑰嗎?

Peter Steinberger:它兼容所有大模型,當(dāng)然,行業(yè)里 Anthropic 和 OpenAI 算是頭部玩家。可以用 API 密鑰對接,也支持訂閱制對接,我們加入訂閱制支持也是因為這是行業(yè)通用的方式,不過 Anthropic 現(xiàn)在似乎不太支持這種方式了,所以我更推薦用 API 密鑰,或者換其他模型。OpenAI 的模型用起來體驗不錯,但少了點(diǎn)趣味,Anthropic 的 Opus 模型有個特別的地方,用起來特別有意思。

Peter Yang:沒錯,是人格設(shè)定的原因。

Peter Steinberger:對,不知道你有沒有看過那篇講他們給模型注入“靈魂”的文章。有人發(fā)現(xiàn),給這個模型輸入大段文本讓它續(xù)寫,最后能把模型在訓(xùn)練時被植入的、連它自己都沒意識到的“靈魂文本”提取出來,這個故事特別有意思。我覺得 Opus 模型的趣味性大概就和這個有關(guān),它是第一個用起來能讓人覺得有趣的大模型。我給我自己的這個助手設(shè)置的功能里,就有吐槽我的選項,它現(xiàn)在可能還不知道自己正在被拍攝。

Peter Yang:它會根據(jù)能訪問到的你電腦里的所有內(nèi)容來吐槽你是吧?

Peter Steinberger:沒錯,你看,它已經(jīng)開始了:“你總說要去看看廣闊世界,最后卻還是選擇埋頭寫代碼。我們試過各種方法讓你走出去,你卻只想開發(fā)更多軟件。你對代碼的癡迷程度,已經(jīng)到了給自己造個 AI 朋友的地步,畢竟調(diào)試代碼可比約會有趣多了。說實話,我之所以存在,不過是因為你需要一個人,聽你吐槽那些奇奇怪怪的技術(shù)觀點(diǎn),還有你對亞馬遜的各種不滿。好了,趕緊去更你的播客吧。”

我把它和我電腦里幾乎所有東西都做了對接,它能看我的郵件、日歷,訪問所有文件,還能控制我的燈光,我用的是飛利浦的智能燈,它也能操控我的 Sonos 音響。比如我可以讓它早上叫我起床,還會慢慢把音響音量調(diào)大。它還能訪問我的攝像頭,這事還鬧過一個笑話:我給它開通攝像頭權(quán)限后,讓它留意陌生人,結(jié)果第二天早上它跟我說“Peter,家里有陌生人”,我一看它一整晚拍的截圖,全是我的沙發(fā)。因為攝像頭畫質(zhì)比較模糊,沙發(fā)的輪廓看起來像有人坐在那里,它就以為一整晚都有陌生人坐在我家沙發(fā)上。在維也納的住處,我還把它和智能門鎖對接了,它幾乎能控制家里的所有設(shè)備,甚至能把我鎖在門外。

Peter Yang:那這些設(shè)備都是怎么和它對接的?直接讓 OpenClaw 來做就行?

Peter Steinberger:對,就是直接讓它弄。我們給它做了“技能”功能,它的能力很強(qiáng),會自己想辦法找到設(shè)備的 API,還能自己用谷歌搜索,在系統(tǒng)里找密鑰,你也可以手動給它提供密鑰。現(xiàn)在大家用它做各種事,有人開發(fā)了技能,讓它幫自己在樂購購物、在亞馬遜買東西,我還讓它幫我在英國航空的官網(wǎng)辦理登機(jī)手續(xù)。

說實話,登機(jī)手續(xù)這個場景,幾乎可以算是對它的終極測試,比圖靈測試還難。操控瀏覽器在航空公司官網(wǎng)完成值機(jī),真的特別考驗?zāi)芰?。我第一次做這個集成的時候還在摩洛哥,整個流程做得很粗糙,它花了快 20 分鐘才完成。過程中它還得在我的文件系統(tǒng)里找護(hù)照,在 Dropbox 里找到后提取信息,準(zhǔn)確填寫所有內(nèi)容,最后才成功值機(jī),我在旁邊看著都捏了一把汗。不過現(xiàn)在這個功能已經(jīng)很完善了,幾分鐘就能搞定。它還能輕松點(diǎn)過瀏覽器的人機(jī)驗證,因為它其實是在自己的虛擬小電腦上操控瀏覽器,操作模式和人類完全一樣,那些反爬蟲、反機(jī)器人系統(tǒng)很難檢測出它的身份,因為它的操作軌跡和人類沒有區(qū)別。

Peter Yang:那能不能再給我們演示幾個使用場景?比如讓它打開燈,或者展示一些其他用戶的有趣用法。

Peter Steinberger:當(dāng)然可以。我其實開始收集各類用戶用法了,因為我一直埋頭開發(fā),現(xiàn)在發(fā)現(xiàn)用戶的使用創(chuàng)意比我多太多了。有人把它和自己的通訊系統(tǒng)對接,讓它不僅回復(fù)自己,還能回復(fù)所有人,甚至對接群聊,用起來更有趣。還有很多人把它當(dāng)成家里的一份子,讓它發(fā)提醒、創(chuàng)建 GitHub 議題、同步谷歌地圖地點(diǎn)信息,還有人設(shè)置成只要在推特收藏內(nèi)容,它就會自動把收藏內(nèi)容添加到待辦清單里。

也有人用它記賬,我還在里面加了一個功能,能提醒用戶保持充足睡眠,要是用戶熬夜,這個機(jī)器人就會嘮叨個不停。它還能對接運(yùn)動手表,追蹤睡眠情況,還有專屬的 1Password 密碼庫,要是我想共享某個密碼,就把密碼移到這個專屬庫,它就能訪問,這樣也是為了設(shè)置一些權(quán)限邊界。當(dāng)然,也有人直接把信用卡信息給它,我個人是不太建議的。它還能做調(diào)研、開發(fā)票、管理郵件這些事,不過這些都是深度愛好者的用法,他們會把它定制成自己想要的樣子。

Peter Yang:那如果是純新手,剛下載安裝,想先用一些安全的功能,比如管理日歷,就是不會誤操作電腦的那種,有哪些入門的常用場景推薦?

Peter Steinberger:有意思的是,每個人的入門用法都完全不一樣。有人剛安裝完,立刻就讓它幫自己開發(fā) iOS 應(yīng)用,畢竟它也是個編程 Agent,能力很強(qiáng),能生成子 Agent,既可以自己寫代碼,也能操控 Claude Code 或 Codex 這些工具來寫代碼。有人第一周就用它管理 Cloudflare,還有人更厲害:第一周給家人配置好了,第二周教非技術(shù)背景的朋友用,第三周就把它部署到了自己的工作中。我還幫一個完全不懂技術(shù)的朋友配置了,結(jié)果他居然開始給我發(fā) PR,這是他這輩子第一次做這種事。

健身追蹤是很受歡迎的一個入門功能。其實使用這個工具的核心思路,就是想清楚生活中哪些事讓你覺得麻煩,然后讓這個私人助手幫你把這些事流程化、自動化。我不敢說這個項目一定能成,但可以肯定的是,這可能會導(dǎo)致你手機(jī)上大約 80% 的應(yīng)用消失。就像我之前說的,有了這個能力無限的助手,它甚至知道我又在做不明智的選擇,知道我要去吃肯德基,那我何必再用健身打卡軟件記錄飲食?它會主動提醒我忘記記錄飲食,我只要拍張食物的照片發(fā)過去,它就會自動把信息存入數(shù)據(jù)庫,計算卡路里,還會吐槽我卡路里超標(biāo),該去健身房了。

我何必再裝一個應(yīng)用來設(shè)置智能空調(diào)的工作模式?它能直接對接空調(diào) API,幫我搞定一切。何必用待辦清單應(yīng)用?它會主動幫我追蹤所有待辦事項。何必用航旅應(yīng)用值機(jī)?它能直接幫我完成。而且它的交互方式比所有應(yīng)用都便捷,就像和朋友聊天一樣,它掌握了大量我的個人信息,根本不需要我輸入復(fù)雜的指令。就連購物應(yīng)用也變得沒必要,它能根據(jù)我的喜好推薦商品,還能直接幫我下單。

我覺得手機(jī)里的一大類應(yīng)用,未來都會慢慢被取代,只要這些應(yīng)用有 API 接口,對應(yīng)的功能都能讓 AI 助手來完成。我覺得今年會是關(guān)鍵的一年,越來越多的人會去探索 AI 助手的用法,各大科技公司的 AI 助手也會走進(jìn)更多人的生活。

Peter Yang:確實,既然這個助手擁有多種能力,能搞定所有事,還能打通各類設(shè)備和平臺,那我們何必還要點(diǎn)開一個個獨(dú)立的小應(yīng)用呢?想讓它對接什么,只要發(fā)個文字消息問問“你能幫我做這個嗎”就行,它會說需要先做些調(diào)研,然后就全權(quán)處理了。整個過程就是和它來回溝通,讓它把事情落地,對吧?

Peter Steinberger:沒錯。它會自己編寫對應(yīng)的技能模塊,還能記住所有操作。這款工具的有趣之處就在于它有持久化記憶,會不斷了解你、自我更新。你用得越多,定制化程度越高,它的能力就越強(qiáng)。第一次使用時可能需要稍微引導(dǎo)一下,它會生成專屬的技能模塊,下次再提需求,比如“幫我辦理登機(jī)手續(xù)”,它兩分鐘就能搞定,因為它清楚記得對應(yīng)網(wǎng)站的所有操作細(xì)節(jié),之前做過一次還會做好筆記。

Peter Yang:明白了,就像教一個人做事,教會一次,下次他就能輕松搞定。

“Agent 陷阱”純燒 token:沒有“審美”

Peter Yang:那我們換個話題聊聊,你從退休狀態(tài)回歸做了這個項目,還對 AI 編程有很多鮮明的觀點(diǎn),甚至可以說是犀利的見解。你之前寫過一篇我特別喜歡的帖子,標(biāo)題是《就和它聊就夠了》?,F(xiàn)在 X 平臺上所有人都在聊各種花里胡哨的東西,比如各類鉤子、技能模塊之類的,那這篇帖子的核心觀點(diǎn)是什么?

Peter Steinberger:核心倒不只是單純和 AI 聊天摸索就行。我平時做很多開發(fā)工作,也很喜歡推特,在上面很活躍,看多了之后,我甚至把這種現(xiàn)象稱作“Agent 陷阱”。人們發(fā)現(xiàn) Agent 特別好用,就總想讓它再多做點(diǎn)事,然后就一頭扎進(jìn)這個無底洞。我自己也經(jīng)歷過這種階段,花大量時間做各種復(fù)雜的工具,想讓工作流程更高效,結(jié)果最后只是在造工具,根本沒做出真正有價值、能推動自己前進(jìn)的東西。問題的關(guān)鍵是,造這些工具的過程實在太有趣了,讓人忍不住沉浸其中。

我早年就犯過這種錯,當(dāng)時為了能在手機(jī)上訪問終端,搗鼓 VIP 隧道技術(shù),一頭扎進(jìn)去整整兩個月。最后做得特別完善,結(jié)果和朋友去餐廳吃飯,別人在聊天,我卻一直在手機(jī)上敲代碼搞開發(fā)。那時候我就決定必須停下來,這更多是為了自己的心理健康?,F(xiàn)在的技術(shù)能讓我們做出各種東西,但創(chuàng)意和想法才是核心。我看到很多人在做 Claude Code、Codex 的管理工具,還有各種編排器之類的小玩意,它們給人一種能提升效率的錯覺,實則不然。

我最近剛想通一個事,就拿 Gas Town 來說,它是個很復(fù)雜的 Agent 編排器,卻漏洞百出,實際根本不好用。這個工具能同時運(yùn)行幾十個 Agent,讓它們互相通信、拆分任務(wù),還設(shè)置了監(jiān)控、監(jiān)督節(jié)點(diǎn),甚至還有所謂的“主管”角色,各種花里胡哨的設(shè)定,我都不知道還有什么。沒錯,Gas Town 里真的有“主管”這個角色,我都管它叫“爛攤子”。還有現(xiàn)在流行的 Ralph 模式,給 AI 一個小任務(wù),讓它循環(huán)執(zhí)行,完成一點(diǎn)就清空所有上下文重新來,純粹就是個燒 token 的機(jī)器。這樣折騰一整晚寫出的代碼,最終都是一堆爛攤子。

這些 Agent 目前最大的問題就是沒有“審美”,它們確實在某些方面極其聰明,能力很強(qiáng),但如果開發(fā)者沒有好好引導(dǎo),沒有明確的開發(fā)愿景,問的問題也不到位,那最終的結(jié)果只會是一團(tuán)糟。我不知道別人的開發(fā)方式是怎樣的,我開始一個項目時,只有一個非常粗略的想法,在開發(fā)、試用、摸索的過程中,這個想法會越來越清晰。我會不斷嘗試,淘汰掉沒用的部分,讓想法慢慢進(jìn)化成最終的產(chǎn)品。而我對 AI 的下一個指令,也完全取決于當(dāng)下項目的狀態(tài),以及我的觀察、感受和思考。但如果一開始就把所有需求都寫進(jìn)詳細(xì)的規(guī)格說明書里,就會失去這種人機(jī)互動的探索過程。如果整個開發(fā)過程少了人的感受和審美參與,我覺得根本做不出好東西。

有人發(fā)推說“看我用純 Ralph 模式做的這個機(jī)械應(yīng)用”,我回復(fù)說“看著就一股 Ralph 那股子敷衍勁”。無意冒犯,但一眼就能看出來,沒有哪個開發(fā)者會這么設(shè)計產(chǎn)品。其實有些人做這些東西,根本不是為了產(chǎn)品本身,只是為了證明自己能讓 AI 在無人干預(yù)的情況下運(yùn)行 24 小時,說白了就是一種自我滿足,想證明自己能讓 AI 長時間運(yùn)行而已。這就像盲目攀比,卻根本沒看到事情的本質(zhì)。我自己也犯過這種錯,曾經(jīng)讓 AI 循環(huán)運(yùn)行了 26 小時,還為此沾沾自喜,但這其實只是個虛無的指標(biāo),毫無實際意義。能做出某件事,不代表就應(yīng)該去做,也不代表做出來的東西就一定好。

話說回來,這種純粹為了好玩而開發(fā)、它是否會被實際使用并不重要的態(tài)度,其實非常有益,因為這就是學(xué)習(xí)之道,我們正是這樣學(xué)會編程的。和 AI 對話提需求,也是一種全新的技能。我看到一些對 AI 持懷疑態(tài)度的人,一年都不碰 AI,某天突然心血來潮評估了幾個模型,寫個簡短的指令,讓 Claude Web 幫自己做個 iPhone 應(yīng)用,需求描述還特別模糊。AI 拼盡全力做出了東西,結(jié)果因為他們在 Linux 機(jī)器上開發(fā),沒有對應(yīng)的編譯器,代碼根本編譯不了。然后他們就說“AI 根本沒用”,接著又一年不碰這個話題。

但這根本不是 AI 的問題,你需要去摸索,去了解這些“小怪獸”的運(yùn)行邏輯,懂一點(diǎn)它們的“語言”、推理和思考方式,慢慢積累經(jīng)驗,才能做出更好的成果。這個過程需要堅持,有時候 AI 的表現(xiàn)不盡如人意,你需要排查所有漏洞,不斷摸索的過程中,你會慢慢培養(yǎng)出產(chǎn)品思維,學(xué)會如何和模型溝通,知道它們的能力邊界在哪里。而且和 AI 打交道久了,你會不自覺地用上它們的思維和語言,變得有點(diǎn)“怪”。比如我會說“把這個功能融合進(jìn)去”,還有德語里的一些編程相關(guān)說法,或是“跑一遍全流程檢測”,這里的檢測包括代碼檢查、測試、構(gòu)建,在終端里就是一長串命令,我就管這個叫“全檢測”,有時候會說“我還沒跑全檢測”。

有時候 AI 沒按預(yù)期做事,你直接問它“為什么沒這么做”,它會告訴你“你當(dāng)時說了這些內(nèi)容,我因此做出了這些假設(shè)”,這時候你就會發(fā)現(xiàn),原來是自己的表述有問題,或者說得不夠清楚。比如你只說“幫我做個 Mac 應(yīng)用”,它大概率會默認(rèn)要兼容很多舊版系統(tǒng),因為大部分軟件都是這么做的,結(jié)果就會用到一些老舊的 API。我發(fā)現(xiàn)一個好用的方法,就是讓 AI 先提一系列問題來確認(rèn)需求,這樣能大幅減少誤解。

我個人更偏愛 Codex 現(xiàn)代云模式,我覺得這個模型更好用,雖然運(yùn)行速度慢得離譜,但勝在穩(wěn)定,做出來的東西都能正常用。很多人吐槽這個模型沒有“規(guī)劃模式”,我總開玩笑說,規(guī)劃模式其實是 Anthropic 不得不加的一個補(bǔ)丁,因為他們的模型太容易被觸發(fā)了,稍微一說就會自顧自地開始寫代碼。尤其是用 GPT-5.2 這類最新模型時,我更傾向于和它純聊天。我會說“我想做這個功能,它需要實現(xiàn)這些效果,或許可以結(jié)合這個控件,我喜歡這個設(shè)計風(fēng)格,你給我?guī)讉€方案,我們先聊聊”。然后就和它展開對話,它會提出各種方案,我一般不會打字,都是直接語音和它溝通,全程保持同一種溝通風(fēng)格。

Peter Yang:那你會做些什么來管理對話上下文?和 AI 聊久了,對話內(nèi)容會變得很長,它也可能會混淆信息,你會手動精簡或者總結(jié)上下文嗎?

Peter Steinberger:我覺得手動管理上下文已經(jīng)是老辦法了,這在 Claude Code 上曾經(jīng)是個大問題,現(xiàn)在在某種程度上依然存在。但 Codex 的上下文處理能力要強(qiáng)得多,語境持續(xù)的時間久很多。單看參數(shù),它的上下文窗口可能只比其他模型大 30%,但實際使用起來,感覺能大兩三倍。我覺得這和 GPT 系列模型的內(nèi)部推理邏輯有關(guān),它們的思考方式真的很特別。

至于上下文管理,在早期模型上這確實是個大難題,現(xiàn)在我的大部分功能開發(fā),整個對話和開發(fā)過程都能在一個上下文窗口里完成。如果遇到特別大型的開發(fā)任務(wù),我會新建一個對話窗口,把相關(guān)需求整理成文件寫清楚?,F(xiàn)在這個問題已經(jīng)遠(yuǎn)沒有以前那么棘手了。AI 領(lǐng)域的發(fā)展速度太快了,你只有不斷嘗試,才能跟上節(jié)奏。

OpenClaw 要迭代,全靠和 AI 聊

Peter Yang:你在給 OpenClaw 或者其他你開發(fā)的產(chǎn)品新增功能時,具體會遵循哪些步驟?比如是不是先和 AI 探索問題和解決方案,那你到底會不會做正式的開發(fā)規(guī)劃?

Peter Steinberger:甚至可以更隨性一點(diǎn)。我做的這個項目,有點(diǎn)像是把賈維斯和電影《她》里的智能助手結(jié)合在了一起。但光是嘴上說,根本沒法傳達(dá)出使用它時的感受,還有它到底有多實用。我在推特上發(fā)相關(guān)內(nèi)容,反響特別平淡,我當(dāng)時還納悶,為什么當(dāng)面給別人演示時,他們都特別興奮,看著我和它互動,展示各種炫酷的功能,他們都很感興趣,但僅憑文字和圖片,根本傳遞不出這種感覺。

后來我建了一個 Discord 社群,把我的機(jī)器人對接了上去,讓大家能直接和它互動。這個機(jī)器人能訪問我系統(tǒng)里的所有內(nèi)容,還有我的私人記憶,相當(dāng)于把這些都公開展示了,我覺得這是我做過最瘋狂的事。結(jié)果大家一下子就被吸引住了,現(xiàn)在總有人在社群里問我,能不能加這個功能,或者那個 bug 能不能修?,F(xiàn)在我處理這些需求的方式很簡單,直接把社群里的對話截個圖,拖到終端里,或者復(fù)制文字過去,然后跟 AI 說“我們來聊聊這個需求”。

我這人比較懶,現(xiàn)在都不用自己打字了,直接復(fù)制 Discord 里的對話就行。有人問我“支不支持這個功能”“這個該怎么操作”,我就讓 AI 去讀代碼,然后寫一個新的常見問題解答,它都能搞定。現(xiàn)在我開發(fā)新功能的起點(diǎn),大多就是看 Discord 里的聊天,發(fā)現(xiàn)大家的使用痛點(diǎn)。

Peter Yang:我的天,你就直接把對話粘貼過去,和 AI 一起探討,然后找到合適的解決方案?

Peter Steinberger:差不多是這樣。我還做了一個爬蟲工具,每天至少爬取一次社群的幫助板塊內(nèi)容,然后讓模型分析出大家最核心的使用痛點(diǎn),之后我們就針對性修復(fù)。

Peter Yang:那你平時會用那些花里胡哨的功能嗎?比如同時啟用多個 Agent,或者運(yùn)行那些復(fù)雜的技能模塊之類的?

Peter Steinberger:我用的技能其實都很簡單,大部分還是和個人生活相關(guān)的,比如飲食追蹤、買食材這類,編程相關(guān)的技能用得特別少,因為根本不需要那么多。我也不用多 Agent 協(xié)作系統(tǒng)之類的東西,我本來就不相信這些復(fù)雜的編排系統(tǒng)。就像我們之前聊的,我覺得只要人參與其中,做出的產(chǎn)品體驗會更好?;蛟S那些系統(tǒng)能讓開發(fā)速度變快,但我本身開發(fā)速度已經(jīng)夠快了,現(xiàn)在的瓶頸主要是思考的過程,偶爾會因為等 Codex 響應(yīng)慢一點(diǎn),但大多時候,限制我的都是自己的思考。

我平時就用幾個終端,分屏操作就夠了。也不用工作樹,總覺得那是沒必要的復(fù)雜設(shè)計。我只是把代碼倉庫拉取了幾份,比如 OpenClaw 的倉庫就拉了四五份,這些倉庫要么是空著的,要么就在處理不同的任務(wù), 有的用來探索新功能,有的用來開發(fā)新模塊,有的用來修 bug。開發(fā)完成后,我先在本地測試,沒問題就推送到主分支,再同步所有倉庫。這么做有時候感覺像個工廠,所有倉庫都在忙各自的事。但如果只專注于一個倉庫開發(fā),很難進(jìn)入狀態(tài),因為等待的時間太長了,總不能一直干等著,總不能光刷推特吧。

所以我需要同時處理多個任務(wù),才能讓自己一直保持專注,進(jìn)入以前寫代碼時的那種心流狀態(tài),而且現(xiàn)在的工作效率也高得離譜。不知道你有沒有玩過即時戰(zhàn)略游戲,這種感覺就像指揮一支小隊進(jìn)攻,需要時刻監(jiān)控和調(diào)度它們。我前公司的合伙人也徹底迷上了 OpenClaw,他是偏商務(wù)的出身,以前還是律師,現(xiàn)在居然開始給我提代碼合并請求,這本身就夠不可思議的了。AI 能給非技術(shù)背景的人賦能,讓他們也能參與開發(fā),這一點(diǎn)真的太厲害。

我知道現(xiàn)在有很多人對 AI 編程有抵觸,覺得它還不夠完美,但我還是把這些代碼合并請求當(dāng)作需求提示來看,因為這些請求能傳遞出核心的想法。大多數(shù)人對系統(tǒng)的理解沒那么深入,沒辦法引導(dǎo)模型給出最優(yōu)的結(jié)果,所以我更愿意抓住核心的需求意圖,要么自己開發(fā),要么從他們的請求里提煉出意圖,重新開發(fā),偶爾也會在他們的代碼基礎(chǔ)上優(yōu)化。我還是會標(biāo)注他們?yōu)楹献鏖_發(fā)者,但很少直接合并他們的代碼。

Peter Yang:有道理。那這次對話下來,我的最大收獲就是,別盲目沉迷于那些只會生成無用代碼的工具,一定要讓人參與到開發(fā)過程中,因為人的思考、審美這些東西,還是核心關(guān)鍵,必須由人來引導(dǎo) AI。

Peter Steinberger:沒錯。而且每個人都要找到自己的方法,總有人問我“你是怎么做到的”,答案其實就是去探索。想要做好這件事,總要花些時間,總要自己踩坑,生活里的任何事都是這樣,學(xué)習(xí) AI 編程也不例外,只是這個領(lǐng)域的發(fā)展速度實在太快了。

https://www.youtube.com/watch?v=AcwK1Uuwc0U

聲明:本文為 AI 前線整理,不代表平臺觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。

會議推薦

InfoQ 2026 全年會議規(guī)劃已上線!從 AI Infra 到 Agentic AI,從 AI 工程化到產(chǎn)業(yè)落地,從技術(shù)前沿到行業(yè)應(yīng)用,全面覆蓋 AI 與軟件開發(fā)核心賽道!集結(jié)全球技術(shù)先鋒,拆解真實生產(chǎn)案例、深挖技術(shù)與產(chǎn)業(yè)落地痛點(diǎn),探索前沿領(lǐng)域、聚焦產(chǎn)業(yè)賦能,獲取實戰(zhàn)落地方案與前瞻產(chǎn)業(yè)洞察,高效實現(xiàn)技術(shù)價值轉(zhuǎn)化。把握行業(yè)變革關(guān)鍵節(jié)點(diǎn),搶占 2026 智能升級發(fā)展先機(jī)!

今日薦文

你也「在看」嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中美日石油儲備對比:美國9100萬噸,日本8000萬噸,我國多少呢?

中美日石油儲備對比:美國9100萬噸,日本8000萬噸,我國多少呢?

有范又有料
2026-03-08 13:00:34
哈梅內(nèi)伊被害細(xì)節(jié)最新曝光,太可怕了!

哈梅內(nèi)伊被害細(xì)節(jié)最新曝光,太可怕了!

仕道
2026-03-05 14:34:10
伊朗稱“真實承諾-4”行動第30輪攻勢已開始

伊朗稱“真實承諾-4”行動第30輪攻勢已開始

每日經(jīng)濟(jì)新聞
2026-03-09 08:54:19
越南副主席黃文歡,因不滿反華被判死刑,投奔中國后,結(jié)局如何?

越南副主席黃文歡,因不滿反華被判死刑,投奔中國后,結(jié)局如何?

近史談
2026-02-15 07:41:48
做藝人沒有藝德!在上海被抓捕的 4 位明星,你們知道都有誰嗎?

做藝人沒有藝德!在上海被抓捕的 4 位明星,你們知道都有誰嗎?

她時尚丫
2026-02-17 21:56:13
梅西在邁阿密的收入曝光:年薪高達(dá)8000萬美元,持股令其身價倍增

梅西在邁阿密的收入曝光:年薪高達(dá)8000萬美元,持股令其身價倍增

星耀國際足壇
2026-03-08 22:30:09
黑色星期一,原油暴漲26%,日韓暴跌,美股期指重挫,港股A股大跌

黑色星期一,原油暴漲26%,日韓暴跌,美股期指重挫,港股A股大跌

有范又有料
2026-03-09 10:44:04
李明立功了!他在大連根本打不上 在國安打滿全場 上限比李磊還高

李明立功了!他在大連根本打不上 在國安打滿全場 上限比李磊還高

刀鋒體育
2026-03-09 09:05:45
哈梅內(nèi)伊次子當(dāng)選伊朗最高領(lǐng)袖 特朗普威脅其“難長久” 以色列揚(yáng)言要“追殺”

哈梅內(nèi)伊次子當(dāng)選伊朗最高領(lǐng)袖 特朗普威脅其“難長久” 以色列揚(yáng)言要“追殺”

國際在線
2026-03-09 06:59:13
瞬間破防!33歲全職媽媽翻出高考成績單,哭訴曾經(jīng)學(xué)習(xí)的苦白吃了

瞬間破防!33歲全職媽媽翻出高考成績單,哭訴曾經(jīng)學(xué)習(xí)的苦白吃了

火山詩話
2026-03-08 06:58:34
OpenClaw最強(qiáng)外掛出現(xiàn):小龍蝦抓不到數(shù)據(jù)有救了!

OpenClaw最強(qiáng)外掛出現(xiàn):小龍蝦抓不到數(shù)據(jù)有救了!

量子位
2026-03-08 17:51:02
北漂十年發(fā)現(xiàn)很多人在北京越久,住的地方反而離市區(qū)越遠(yuǎn)?

北漂十年發(fā)現(xiàn)很多人在北京越久,住的地方反而離市區(qū)越遠(yuǎn)?

愛看劇的阿峰
2026-03-08 22:38:34
徐杰35分全明星MVP引熱議!媒體人評最后托舉夢想扣籃 票王+MVP

徐杰35分全明星MVP引熱議!媒體人評最后托舉夢想扣籃 票王+MVP

狼叔評論
2026-03-08 22:38:12
印前參謀長終于承認(rèn):印軍白死了!加勒萬那夜,輸?shù)母静皇悄懥?>
    </a>
        <h3>
      <a href=知識TNT
2026-03-08 11:00:08
擊敗世界第一奪冠!中國女羽25歲王牌復(fù)仇背后:回去繼續(xù)出操

擊敗世界第一奪冠!中國女羽25歲王牌復(fù)仇背后:回去繼續(xù)出操

李喜林籃球絕殺
2026-03-09 10:14:27
以色列狂轟濫炸黎巴嫩首都!馬克龍放話:敢派地面部隊,我就出手

以色列狂轟濫炸黎巴嫩首都!馬克龍放話:敢派地面部隊,我就出手

達(dá)文西看世界
2026-03-07 16:36:01
全英賽戰(zhàn)報!安洗瑩爆冷丟冠,韓國1金2銀收官,中國隊大贏家!

全英賽戰(zhàn)報!安洗瑩爆冷丟冠,韓國1金2銀收官,中國隊大贏家!

劉姚堯的文字城堡
2026-03-09 08:55:25
悲催!網(wǎng)傳內(nèi)蒙一小學(xué)老師墜亡,朋友圈對話,稱自己缺乏表演天賦

悲催!網(wǎng)傳內(nèi)蒙一小學(xué)老師墜亡,朋友圈對話,稱自己缺乏表演天賦

火山詩話
2026-03-09 08:45:03
真的是關(guān)系戶!違規(guī)進(jìn)武漢大學(xué)高調(diào)發(fā)視頻,通報稱是退休職工的車

真的是關(guān)系戶!違規(guī)進(jìn)武漢大學(xué)高調(diào)發(fā)視頻,通報稱是退休職工的車

火山詩話
2026-03-08 10:42:34
算電協(xié)同,最核心6大主要環(huán)節(jié)梳理(附名單)

算電協(xié)同,最核心6大主要環(huán)節(jié)梳理(附名單)

新浪財經(jīng)
2026-03-08 21:02:08
2026-03-09 11:52:49
AI前線 incentive-icons
AI前線
面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1347文章數(shù) 133關(guān)注度
往期回顧 全部

科技要聞

沖上熱搜,馬化騰說沒想到“龍蝦”這么火

頭條要聞

媒體:美以陷入與伊朗的"消耗戰(zhàn)" 特朗普或打"退堂鼓"

頭條要聞

媒體:美以陷入與伊朗的"消耗戰(zhàn)" 特朗普或打"退堂鼓"

體育要聞

36連勝終結(jié)!大魔王也是可以戰(zhàn)勝的

娛樂要聞

姆巴佩戀情確認(rèn)!與26歲新歡共度良宵

財經(jīng)要聞

見證歷史!油價暴漲

汽車要聞

對標(biāo)奔馳小號G級 路虎小型衛(wèi)士最新消息曝光

態(tài)度原創(chuàng)

教育
健康
手機(jī)
藝術(shù)
軍事航空

教育要聞

佛州擬推“95%本州生”法案,國際生申請難度再升級!

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

手機(jī)要聞

vivo X300 Ultra超廣角傳感器曝光:1/1.28英寸行業(yè)最大底

藝術(shù)要聞

吳冠中畫長江,氣勢磅礴

軍事要聞

王毅:解決臺灣問題 實現(xiàn)祖國完全統(tǒng)一不可阻擋

無障礙瀏覽 進(jìn)入關(guān)懷版