国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

“軟件工程師”頭銜要沒了?Claude Code之父YC訪談:一個(gè)月后不再用plan mode,多Agent開始自己組隊(duì)干活

0
分享至

  作者 | 木子

  “我們會(huì)開始看到 “軟件工程師”這個(gè)頭銜慢慢消失。可能會(huì)變成builder、product manager,或者頭銜還保留,但只是一個(gè)遺留符號(hào)。
因?yàn)榇蠹易龅墓ぷ鞑辉僦皇菍懘a:軟件工程師還會(huì)寫 spec、還會(huì)跟用戶溝通。”

  放出這話的,正是Claude Code的創(chuàng)始人Boris Cherny。

  他最近在Y Combinator的一場(chǎng)圓桌訪談中,一人對(duì)陣四位 YC 高管,幾乎句句都帶著點(diǎn)“重錘感”。

  

  在他看來(lái),編程正在被“解決”。在 Anthropic,很多人已經(jīng) 70%–100% 用 Claude 寫代碼,IDE 的存在感正在下降。寫代碼這件事,正在從“核心能力”變成“默認(rèn)能力”。

  而另一邊,模型能力會(huì)指數(shù)增長(zhǎng),今天的“勉強(qiáng)可用”,六個(gè)月后可能原生支持,如果只圍繞當(dāng)前模型做 PMF,很快會(huì)被下一代能力抹平:

“在 Anthropic,我們一直有一個(gè)核心理念:我們不是為‘今天的模型’做產(chǎn)品,而是為‘六個(gè)月后的模型’做產(chǎn)品。”

  這,也是他給所有 LLM 創(chuàng)始人的一條建議。

  本次訪談,除了 Boris 本人外,其余幾位包括:YC 總裁兼 CEO Garry Tan、合伙人 Harj Taggar、Diana Hu,以及 Jared Friedman。

  

  YC 總裁兼 CEO Garry 開場(chǎng)就說(shuō)了句:“謝謝你做了 Claude Code。它讓我連續(xù)三周沒睡好?!?/p>

  這不純是客套。Claude Code 不僅對(duì)外很火,對(duì)內(nèi)也像一臺(tái)“超級(jí)引擎”,自其推出后,Anthropic 的人均工程產(chǎn)出提升了 150%。

  用 Boris 的話來(lái)說(shuō),就是:

“我以前在 Meta 負(fù)責(zé)代碼質(zhì)量,也負(fù)責(zé)跨多個(gè)產(chǎn)品線的代碼庫(kù)質(zhì)量。當(dāng)時(shí)我們做“提升生產(chǎn)力”,看到 2% 的提升,都可能需要幾百人干一年。所以這種 100% 級(jí)別的提升,是完全沒見過(guò)的,聞所未聞?!?/blockquote>

  

  但這場(chǎng)對(duì)話最值得看的,并不是“又一個(gè) AI 編程工具爆火”的故事,而是 Boris 如何把一個(gè)終端里的小聊天程序,迭代成今天這個(gè)能調(diào)工具、會(huì) plan、甚至?xí)鲃?dòng)找人溝通的開發(fā) agent。

  除了上文提到了,本次訪談中,還有一些很有意義的判斷和觀點(diǎn),核心內(nèi)容提煉如下:

  代碼的保質(zhì)期只有幾個(gè)月。

  Claude Code 被反復(fù)重寫,六個(gè)月前的代碼幾乎全部消失;重構(gòu)不是例外,而是常態(tài)。

  Plan mode 未來(lái)可能自動(dòng)進(jìn)入,再往后可能會(huì)消失。

  其本質(zhì),只是 prompt 里加一句“先別寫代碼”,最終可能一發(fā) prompt 就能完成。

  不要和模型對(duì)賭。

  加很多腳手架也許能多拿 10% 的效果,但下一代模型可能直接“白送”;所有非模型能力最終都會(huì)變成技術(shù)債。

  功能不是規(guī)劃出來(lái)的,是從用戶行為里“長(zhǎng)”出來(lái)的。

  plan mode、CLAUDE.md、co-work 都源于用戶已經(jīng)在做的事,產(chǎn)品只是把它們收攏進(jìn)來(lái)。不要教育用戶改變行為,而是順著他們已經(jīng)發(fā)生的行為去放大它。

  Agent 的能力邊界,會(huì)每幾個(gè)月重寫一次

  。你對(duì)“它能不能做”的判斷很快會(huì)過(guò)時(shí),工程師必須不斷重置認(rèn)知。多 agent 協(xié)作,是能力放大的關(guān)鍵變量。并行 sub-agent、本質(zhì)上是 test-time compute 和上下文隔離的組合,會(huì)顯著提升復(fù)雜任務(wù)能力。

  迭代速度本身就是護(hù)城河。

  Claude Code 可以一天做 20 個(gè)原型,快速試錯(cuò)比“設(shè)計(jì)完美方案”更重要。

  對(duì)處于 AI 洪流中的技術(shù)開發(fā)者和創(chuàng)始人,Boris 給出的建議是,是新時(shí)代最重要的能力是“新手心態(tài)”。能承認(rèn)自己錯(cuò)、能丟掉舊經(jīng)驗(yàn)、能從第一性原理重新思考,比資歷更重要。

以下為本段訪談的全部重點(diǎn)內(nèi)容,InfoQ 在不改變?cè)獾那疤嵯?,?duì)內(nèi)容進(jìn)行了整理編輯。

  Garry:謝謝你做出了這個(gè)東西(Claude Code),它讓我連續(xù)三周都沒睡好。我已經(jīng)對(duì) Claude Code 上癮了,感覺像給人裝上了火箭助推器。這個(gè)體驗(yàn)大家已經(jīng)持續(xù)感受好幾個(gè)月了,我記得大概從 11 月底開始,很多朋友都說(shuō)“感覺不一樣了”。

  Boris:我自己第一次有這種感覺,是在剛做出 Claude Code 的時(shí)候——那會(huì)兒我還不確定自己是不是做對(duì)了方向。我隱約覺得“可能成了”,然后我就開始睡不著了。

  那是 2024 年 9 月。連續(xù)三個(gè)月,我沒休過(guò)一天假,周末也在干,每晚都在工作。

  我一直在想:“天啊,這東西可能會(huì)變成一個(gè)真正的產(chǎn)品?!钡?dāng)時(shí)我也不知道它到底有沒有用,因?yàn)槟菚r(shí)候它其實(shí)還不會(huì)寫代碼。

  1 讓 Boris 最意外的,是終端竟成了終點(diǎn)

  Garry:從那時(shí)候到現(xiàn)在,如果你回看,你覺得最讓你意外的是什么?

  Boris:最不可思議的是:我們到現(xiàn)在居然還在用終端。終端本來(lái)只是起點(diǎn),我沒想到它最后會(huì)變成終點(diǎn)。

  第二個(gè)意外是,它居然真的變得有用了。因?yàn)橐婚_始它幾乎不會(huì)寫代碼。甚至到 2 月份,它大概也就寫了我 10% 的代碼。我當(dāng)時(shí)并不靠它寫代碼,它寫得不夠好,我還是大部分都手寫。現(xiàn)在能做到我們當(dāng)初下注的那個(gè)方向,說(shuō)明賭對(duì)了;但當(dāng)時(shí)這件事一點(diǎn)也不明顯。

  在 Anthropic,我們一直的思路是:不要只為“今天的模型”做產(chǎn)品,而是為“六個(gè)月后的模型”做產(chǎn)品。

  這也是我給所有基于 LLM 做產(chǎn)品的創(chuàng)始人的建議:盡量去想——今天模型還不太擅長(zhǎng)、但很快會(huì)變強(qiáng)的前沿點(diǎn)在哪里。它會(huì)變好,你只需要等它到位。

  2 Claude Code 是 如何構(gòu)思出來(lái)的?

  Harj:回到最開始,你還記得自己第一次有這個(gè)想法是什么時(shí)候嗎?是某個(gè)靈光一現(xiàn),還是它在你腦子里最初的版本是什么樣?

  Boris:其實(shí)它非?!耙馔狻?,就是一路演化出來(lái)的。

  對(duì) Anthropic 來(lái)說(shuō),我們很早就押注“編程”這條路:我們認(rèn)為通往安全 AGI 的路徑之一,就是通過(guò)編程能力。

  整體思路一直是:先教模型寫代碼,再教它用工具,再教它用電腦。你也能從我加入的第一個(gè)團(tuán)隊(duì)看出來(lái)——當(dāng)時(shí)叫 Anthropic Labs,做了三個(gè)產(chǎn)品:Claude Code、MCP 和桌面端 App,這些其實(shí)是串在一起的。

  具體到 Claude Code,其實(shí)沒人讓我做 CLI。我們大概知道模型可能已經(jīng)到了適合做編程產(chǎn)品的階段,但還沒有人真的做出一個(gè)能把這種能力“吃干榨凈”的產(chǎn)品,所以當(dāng)時(shí)有一種很強(qiáng)烈的“產(chǎn)品能力懸空感”(product overhang)。那會(huì)兒這種感覺更夸張,因?yàn)楦緵]人做過(guò)。

  于是我就開始隨便 hack。一開始我想:“要做編程產(chǎn)品,我得先學(xué)會(huì)怎么用 API。”

  因?yàn)槟菚r(shí)候我還沒用過(guò) Anthropic 的 API。

  我就做了一個(gè)很小的終端程序來(lái)調(diào)用 API,本質(zhì)就是個(gè)小聊天應(yīng)用。因?yàn)楫?dāng)時(shí)大多數(shù) AI 應(yīng)用就是聊天形態(tài),所以我也這么做:在終端里提問(wèn)、回答。后來(lái) tool use 出來(lái)了,我只是想試一下,我也不太懂它到底是什么。我當(dāng)時(shí)想:“工具調(diào)用很酷,但可能沒什么用吧?先試試?!?/p>

  Harj:你用終端實(shí)現(xiàn),主要是因?yàn)樽羁臁⒆钍∈拢?/p>

  Boris:對(duì),因?yàn)椴挥米?UI。那時(shí)就我一個(gè)人。

  Harj:當(dāng)時(shí) Cursor、Windsurf 這些 IDE 方向的產(chǎn)品也在起勢(shì)。你有沒有受到壓力,或者有人建議你們做成插件、或者干脆做成完整 IDE?

  Boris:沒有壓力,因?yàn)槲覀冏约憾疾恢酪鍪裁础?strong>團(tuán)隊(duì)當(dāng)時(shí)就是探索模式:我們隱約覺得要做點(diǎn)和編程有關(guān)的東西,但具體做什么完全不明朗,也沒人能高置信拍板。

  而我的工作就是把這個(gè)方向跑出來(lái)。

  所以我先給模型接了 batch tool——因?yàn)槟蔷褪俏覀兾臋n里的示例。

  我把 Python 示例直接搬到 TypeScript,因?yàn)槲矣?TypeScript 寫。然后我也不知道模型能不能用 bash,就讓它去讀文件,它能 cat 文件,還挺酷的。接著我就繼續(xù)試:“那你到底還能干啥?”我問(wèn)它“我現(xiàn)在在聽什么歌”,它寫了段 AppleScript 去控制我的 Mac,去我的播放器里查當(dāng)前音樂(lè),這還是 Sonnet 3.5 的時(shí)候,我完全沒想到它能做到。

  這是我第一次那種“燃料級(jí) AGI 時(shí)刻”。我當(dāng)時(shí)想:“天啊,模型就是想用工具,它只想用工具。”

  3 極簡(jiǎn)優(yōu)雅終端,成就 Claude Code

  Diana:這 Claude Code 以一種非?!胺闯WR(shí)”的方式成功:形式上極簡(jiǎn)、很優(yōu)雅,居然就是終端。終端存在很多年了,但它像一個(gè)很好的設(shè)計(jì)約束,讓開發(fā)體驗(yàn)變得很有趣,用起來(lái)不像工作,更像玩。你也不用一直想文件在哪兒、結(jié)構(gòu)怎么擺,這幾乎像是意外得到的。

  Boris:對(duì),完全是意外。

  終端這個(gè)形態(tài)在內(nèi)部開始火起來(lái)之后——其實(shí)我做出第一個(gè)原型兩天后,就把它給團(tuán)隊(duì) dogfooding 了。因?yàn)?strong>當(dāng)你有一個(gè)看起來(lái)可能有用的點(diǎn)子時(shí),第一反應(yīng)就是趕緊給別人用,看看他們會(huì)怎么用。

  第二天我來(lái)上班,坐在我對(duì)面的同事 Robert,已經(jīng)在電腦上用 Claude Code 寫代碼了。我當(dāng)時(shí)特別震驚:“你在干嘛?這東西還沒準(zhǔn)備好,這只是個(gè)原型?!钡呀?jīng)在那個(gè)形態(tài)下變得有用了。

  后來(lái)我們做上線評(píng)審,準(zhǔn)備對(duì)外發(fā)布 Claude Code,大概是 2024 年 11 月或 12 月。Dario 問(wèn)我:“內(nèi)部使用曲線都快豎直了,你是不是強(qiáng)制工程師用?是不是在 mandate?”我說(shuō):“沒有,沒有。我只是發(fā)了個(gè)帖子,然后大家互相轉(zhuǎn)告,就這么傳開了。”

  整個(gè)過(guò)程都很偶然。我們一開始選擇 CLI,只是因?yàn)槌杀咀畹停瑳]想到它就這樣自然地停留在那個(gè)形態(tài)里,并且跑了起來(lái)。

  4 從用戶行為里長(zhǎng)出來(lái)的功能:CLAUDE.md

  Harj:在 2024 年那段時(shí)間,工程師具體怎么用它?已經(jīng)用它交付代碼了嗎?還是用在別的地方?

  Boris :那時(shí)模型還不太會(huì)寫代碼。我自己最早用它來(lái)自動(dòng)化 git。

  我感覺我現(xiàn)在都快忘了 git 了,因?yàn)?Claude Code 幫我做太久了。

  還有就是自動(dòng)化 bash 命令、操作 Kubernetes 之類。也有人開始用它寫代碼,算是早期跡象。最早的一個(gè)典型用例其實(shí)是寫單元測(cè)試,因?yàn)轱L(fēng)險(xiǎn)更低。模型當(dāng)時(shí)寫得也挺一般,但大家開始摸索怎么用。

  我們還看到一個(gè)現(xiàn)象:大家開始給自己寫 markdown 文件,然后讓模型讀這個(gè) markdown 文件——這就是 CLAUDE.md 的來(lái)源。

  對(duì)我來(lái)說(shuō),產(chǎn)品里最大的原則就是latent demand(潛在需求)。這個(gè)產(chǎn)品幾乎每一塊都是從潛在需求里長(zhǎng)出來(lái)的,CLAUDE.md 就是例子。

  另外還有一個(gè)我覺得挺關(guān)鍵的產(chǎn)品原則:你可以圍繞模型做“腳手架”(scaffolding)去提升一點(diǎn)性能,視領(lǐng)域不同,可能提升 10%~20%。

  但這些提升往往會(huì)被下一代模型進(jìn)步直接抹平。所以要么你不停地搭腳手架、再重建;要么你等下一代模型,很多能力會(huì)“免費(fèi)”出現(xiàn)。某種程度上,這也是我們一直留在 CLI 的原因:我們覺得沒有任何 UI 能保證六個(gè)月后仍然相關(guān),因?yàn)槟P瓦M(jìn)步太快了。

  Garry:你說(shuō)了一句很有意思的話:你的 CLAUDE.md 反而很短,幾乎違背大家直覺。為什么?你里面寫了什么?

  Boris:我來(lái)之前還特意看了下,我自己的 CLAUDE.md 只有兩行。第一行是:每次提 PR 都開啟 automerge,只要有人 approve 就自動(dòng)合并。這樣我就能一直寫代碼,不用在 CR 來(lái)回折返。

  第二行是:每次提 PR 都發(fā)到內(nèi)部 stamps 頻道,讓人來(lái) stamp 一下,這樣我就能更快 unblock。

  其他指令都在我們團(tuán)隊(duì)共享的 CLAUDE.md 里,它直接放在代碼倉(cāng)庫(kù)里,全隊(duì)每周都會(huì)貢獻(xiàn)好幾次。我經(jīng)??吹接腥?PR 里犯了那種完全可以避免的錯(cuò),我就直接在 PR 里 @Claude,說(shuō)“把這個(gè)加進(jìn) CLAUDE.md”,這種事我一周會(huì)做很多次。

  Garry:那 CLAUDE.md 變得很長(zhǎng)怎么辦?我已經(jīng)遇到過(guò)那種提示,說(shuō)我的 CLAUDE.md 已經(jīng)幾千 token 了。你們?cè)趺刺幚恚?/p>

  Boris:我們團(tuán)隊(duì)的 CLAUDE.md 其實(shí)也不算長(zhǎng),大概幾千 token。

  如果你遇到這種情況,我的建議是:直接刪掉,重新開始。

  很多人會(huì)過(guò)度工程化,想把一切都寫進(jìn)去。但模型能力每次都會(huì)變,所以更好的方式是:用最少的指令把模型拉回正軌。如果你刪掉之后模型開始跑偏、做錯(cuò)事,那時(shí)候你再一點(diǎn)點(diǎn)加回來(lái)。你很可能會(huì)發(fā)現(xiàn):隨著模型變強(qiáng),你需要寫的反而越來(lái)越少。

  我覺得自己是個(gè)挺普通的工程師。我不用很多花哨工具,不用 Vim,我用 VS Code,因?yàn)楹?jiǎn)單。

  Jared Friedman:真的嗎?我還以為你因?yàn)樵诮K端里做了這個(gè)東西,會(huì)是那種硬核終端黨:Vim only、看不上 VS Code 的那種。

  Boris:團(tuán)隊(duì)里有這種人,比如 Adam Wolf,他就是那種“除非我死,否則你別想從我手里奪走 Vim”的類型。

  我早期學(xué)到的一件事是:每個(gè)工程師握著自己的開發(fā)工具的方式都不一樣,沒有一種工具適合所有人。但也正是這種差異,讓 Claude Code 有機(jī)會(huì)變得很好。

  我會(huì)問(wèn)自己:什么樣的產(chǎn)品是我自己愿意用、對(duì)我來(lái)說(shuō)順手的?

  用 Claude Code,你不需要懂 Vim、不需要懂 tmux、不需要懂 SSH、不需要懂一堆東西,你只要打開它,它會(huì)引導(dǎo)你、幫你把這些都做掉。

  5 不斷重置認(rèn)知,每一代 Agents 能做的事都在變

  Garry:你們?cè)趺礇Q定終端到底要多“啰嗦”?有時(shí)候你得控制它、查看它。團(tuán)隊(duì)內(nèi)部會(huì)不會(huì)為“更長(zhǎng)還是更短”爭(zhēng)得很厲害?每個(gè)用戶可能都有自己的偏好,你們?cè)趺磁陌澹?/p>

  Boris:你怎么看?現(xiàn)在是不是太 verbose 了?

  Garry:我超喜歡 verbose。因?yàn)樗袝r(shí)候會(huì)突然“跑很遠(yuǎn)”,我看著輸出能很快判斷:“哦不對(duì)不對(duì),不是這個(gè)方向?!比缓笪揖椭苯油顺觥⑼5?。它能在 bug 還沒擴(kuò)散之前就把它掐掉。通常是我 plan mode 沒開好才會(huì)這樣。

  Boris:這塊我們確實(shí)經(jīng)常改。大概六個(gè)月前,我試過(guò)把 bash 輸出都隱藏掉,只給總結(jié),因?yàn)槲矣X得那么長(zhǎng)的輸出我不關(guān)心。結(jié)果我給內(nèi)部員工試了一天,大家集體“起義”:“我要看我的 bash!”因?yàn)楹芏鄷r(shí)候它其實(shí)很有用,比如 git 輸出可能不重要,但跑 Kubernetes job 這種你就真的想看細(xì)節(jié)。

  我們最近把 file read、file search 這種輸出也做了隱藏,你會(huì)看到現(xiàn)在它不再顯示“讀了 food.md”,而是顯示“讀了 1 個(gè)文件、搜索了 1 個(gè) pattern”。這在六個(gè)月前根本不敢發(fā),因?yàn)槟P湍菚r(shí)還不夠穩(wěn),常常會(huì)讀錯(cuò),你作為用戶得盯著它糾錯(cuò)。但現(xiàn)在我發(fā)現(xiàn)它幾乎每次都在正確軌道上。因?yàn)樗霉ぞ咛嗔?,很多時(shí)候總結(jié)反而更好。

  但我們發(fā)出去之后,GitHub 上很多人不喜歡,有個(gè)大 issue:大家說(shuō)“不,我就想看細(xì)節(jié)?!边@反饋很好。

  于是我們加了一個(gè) verbose mode,在 /config 里就能開;你想看所有文件輸出就可以繼續(xù)看。

  我在 issue 里回復(fù)之后,大家還是不滿意,我反而很開心,因?yàn)槲易钕矚g的事情就是聽用戶反饋,知道他們到底想怎么用。于是我們就一直迭代,迭代到更貼近大家想要的樣子。

  Garry:以前我比較老派,我喜歡 verbose,我喜歡說(shuō):“你這樣做了,但我想你那樣做?!钡F(xiàn)在有一種完全不同的觀點(diǎn):只要一個(gè)真人需要看代碼,就是壞事,這太有意思了。

  Boris:Dan Shipper 也經(jīng)常講:每次看到模型犯錯(cuò),就盡量把它寫進(jìn) CLAUDE.md 或 skills 里,讓它變成可復(fù)用的經(jīng)驗(yàn)。

  但我自己其實(shí)一直在糾結(jié)一個(gè)“元問(wèn)題”:很多人說(shuō) agents 能做這個(gè)、能做那個(gè),但agents 真正能做什么,會(huì)隨著每一代模型變化。

  有時(shí)新同事加入團(tuán)隊(duì),他們用 Claude Code 的方式甚至比我更激進(jìn),我會(huì)不斷被他們震到。比如我們?cè)?jīng)有個(gè) memory leak,要 debug。

  我當(dāng)時(shí)做法是:導(dǎo) heap dump,打開 DevTools,看 profile,再去翻代碼。我在那兒慢慢找。然后團(tuán)隊(duì)里另一個(gè)工程師 Chris 直接問(wèn) Claude Code:“我懷疑有內(nèi)存泄漏,你能跑一下嗎?然后幫我找?!盋laude Code 拿到 heap dump 后,甚至給自己寫了一個(gè)小工具來(lái)分析 dump,然后比我更快定位到了泄漏。

  這個(gè)事情讓我不得不反復(fù)“重置認(rèn)知”,因?yàn)槲业拇竽X有時(shí)還停留在六個(gè)月前。

  6 對(duì)于技術(shù)型創(chuàng)始人的建議

  Diana:聽起來(lái)剛畢業(yè)的人、或者沒那么多預(yù)設(shè)的人,可能反而比工作很久的工程師更容易上手。那么,專家要怎么變強(qiáng)? 你會(huì)給技術(shù)型創(chuàng)始人什么建議,讓他們?cè)谧钚履P桶l(fā)布時(shí)能做到“最大化利用”?

  Boris:我覺得關(guān)鍵是beginner mindset(新手心態(tài)),還有一點(diǎn)“謙遜”。

  工程師這個(gè)職業(yè)經(jīng)常被訓(xùn)練成有強(qiáng)觀點(diǎn),資深工程師甚至?xí)虼吮华?jiǎng)勵(lì)。在我以前的大公司工作時(shí),我招的架構(gòu)師類型,往往就是經(jīng)驗(yàn)多、觀點(diǎn)強(qiáng)的人。但現(xiàn)在很多經(jīng)驗(yàn)其實(shí)不再相關(guān),很多觀點(diǎn)都得改,因?yàn)槟P驮谧儚?qiáng)。所以我覺得最大的能力是:能科學(xué)地思考、能從第一性原理出發(fā)。

  Diana:那你們招聘時(shí)怎么篩這種能力?

  Boris:我有時(shí)會(huì)問(wèn):“給我一個(gè)你曾經(jīng)錯(cuò)了的例子?!?/strong>

  這是個(gè)很好的問(wèn)題。很多經(jīng)典的行為面試題,甚至不是編碼題,都挺有用的。

  因?yàn)槟隳芸闯鰜?lái):他能不能事后意識(shí)到自己的錯(cuò)誤、能不能承認(rèn)錯(cuò)誤、以及有沒有從中學(xué)到東西。有些很資深的人,尤其是某些“創(chuàng)始人型人格”,反而挺擅長(zhǎng)這個(gè)。

  但也有些人永遠(yuǎn)不會(huì)承擔(dān)錯(cuò)誤。我自己大概一半時(shí)間都是錯(cuò)的:一半想法都很爛,你只能去試。試了給用戶、跟用戶聊、學(xué)到東西,最后可能才走到一個(gè)好點(diǎn)子。有時(shí)候也走不到。

  但過(guò)去這可能是創(chuàng)始人最重要的能力,現(xiàn)在我覺得它對(duì)每個(gè)工程師都很重要。

  Garry:你會(huì)不會(huì)根據(jù)一個(gè)人和 Claude Code 協(xié)作的 transcript 來(lái)決定是否錄用?

  Boris:我們現(xiàn)在就這么做。

  Garry:我們做了個(gè)實(shí)驗(yàn):候選人可以上傳用 Claude Code 或 Codex 完成功能的完整 transcript。通過(guò)這份記錄,你幾乎能看清一個(gè)人的思考方式:比如會(huì)不會(huì)看日志、能否在 agent 跑偏時(shí)拉回、是否用 plan mode、是否補(bǔ)測(cè)試、是否具備系統(tǒng)性思維。我甚至想做一個(gè)類似 NBA 2K 的“能力蛛網(wǎng)圖”,直觀展示他的 Claude Code 水平。

  Boris:那會(huì)有哪些維度?具體是什么?

  Garry:系統(tǒng)能力、測(cè)試能力、理解用戶行為……還有設(shè)計(jì)能力。對(duì)我來(lái)說(shuō),我 CLAUDE.md 里最喜歡的一條是:每個(gè) plan 都要判斷它是過(guò)度工程、欠工程、還是剛剛好,并說(shuō)明原因。

  Boris:這也是我們?cè)诿鞯摹?/p>

  我觀察團(tuán)隊(duì)里效率最高的工程師,分布呈現(xiàn)一種很明顯的“雙峰”。

  一類是極端專家,比如我前面提到的 Jared,以及 bun 團(tuán)隊(duì)那類人。他們對(duì)開發(fā)工具、對(duì) JS runtime 體系的理解都強(qiáng)到離譜。

  另一類是超強(qiáng)通才,差不多是團(tuán)隊(duì)里的其他人:很多人同時(shí)跨產(chǎn)品和基礎(chǔ)設(shè)施,或跨產(chǎn)品和設(shè)計(jì),或跨產(chǎn)品和用戶研究,甚至跨產(chǎn)品和業(yè)務(wù)。

  我很喜歡那種“做奇怪事情”的人。過(guò)去這可能是一個(gè) warning sign,你會(huì)擔(dān)心他們能不能做出有用的東西。

  Garry:那是極限測(cè)試。

  Boris:對(duì)。但現(xiàn)在不一樣了。比如團(tuán)隊(duì)里有個(gè)工程師 Daisy,她原本在別的組,后來(lái)轉(zhuǎn)到我們組。

  我希望她轉(zhuǎn)來(lái)的原因是:她加入后沒多久就給 Claude Code 提了一個(gè) PR,做的是加新功能。但她不是直接把功能加進(jìn)去——她先提了一個(gè) PR:給 Claude Code 增加一個(gè)工具,讓它可以測(cè)試任意工具并驗(yàn)證是否工作。這個(gè) PR 合進(jìn)去之后,她讓 Claude 去寫它自己的工具,而不是自己去實(shí)現(xiàn)。

  我覺得這種“跳出盒子”的思路非常有意思,因?yàn)槠鋵?shí)還沒有多少人真正 get 到。

  我們團(tuán)隊(duì)用 Claude Agents SDK 自動(dòng)化了幾乎所有開發(fā)環(huán)節(jié):自動(dòng) code review、自動(dòng) security review、自動(dòng)給 issue 打標(biāo)簽、自動(dòng)把事情 shepherd 到生產(chǎn)環(huán)境……幾乎什么都自動(dòng)化了。我在外部也開始看到有人慢慢摸到這種用法,但它確實(shí)花了很久——大家在學(xué)習(xí)怎么用 LLM 做這種“新型自動(dòng)化”。這是一種新的技能。

  7 Agent 拓?fù)洌簠f(xié)作的下一種形態(tài)

  Garry:我最近和不少創(chuàng)始人 office hours 時(shí)覺得很好笑的一件事是:在 AI 工具的加持下,擁有清晰產(chǎn)品愿景的創(chuàng)始人會(huì)被極大放大,他腦中完整的產(chǎn)品模型,讓他用 Claude Code 能實(shí)現(xiàn) 50x 效率。但他的工程師沒有那個(gè)“水晶記憶宮殿”,只能做 5x。問(wèn)題在于:當(dāng)愿景者被徹底解放,這種“核心構(gòu)想者 + 執(zhí)行者”的團(tuán)隊(duì)結(jié)構(gòu)是否會(huì)成為新常態(tài)?同時(shí),它也帶來(lái)現(xiàn)實(shí)困境——即便效率暴漲,個(gè)人的時(shí)間與精力仍然是瓶頸。

  Boris:我們剛發(fā)布了 Claude Teams,這是一種方式;你也可以自己搭,挺容易的。

  Garry:Claude Teams 的愿景是什么?

  Boris:就是協(xié)作?,F(xiàn)在有一個(gè)全新的領(lǐng)域叫 agent topologies。

  你怎么配置 agents?其中一個(gè)想法是“uncorrelated context windows”。多個(gè) agents 各自擁有干凈的上下文窗口,不會(huì)被彼此的上下文、或者自己的歷史上下文污染。

  你往一個(gè)問(wèn)題里投入更多上下文,本質(zhì)上是一種 test-time compute,會(huì)帶來(lái)更多能力。再加上合適的拓?fù)?,?agents 以合適的方式溝通、合適地排列,它們就能做更大的東西。Teams 是一種思路,接下來(lái)還會(huì)有更多很快上線。目標(biāo)就是讓它能 build 得更多、更大。

  一個(gè)很典型的例子是:我們的 plugins 功能,幾乎完全是一個(gè) swarm 在一個(gè)周末“跑出來(lái)的”。它連續(xù)跑了幾天,基本沒什么人工干預(yù)。plugins 上線時(shí)的形態(tài),和它跑出來(lái)時(shí)幾乎一致。

  Garry:你們?cè)趺创钇饋?lái)的?你是先寫清楚你要的結(jié)果,然后讓它自己推細(xì)節(jié),再讓它跑起來(lái)嗎?

  Boris:對(duì)。團(tuán)隊(duì)里有個(gè)工程師給 Claude 一個(gè) spec,讓 Claude 用 Asana board。Claude 在 Asana 上建了一堆 ticket,然后 spawn 了一堆 agents,agents 開始自己認(rèn)領(lǐng)任務(wù)。主 Claude 負(fù)責(zé)給總體指令,大家就這樣跑出來(lái)了。

  Diana:那些獨(dú)立 agents 并不知道更大的 spec 的完整上下文,對(duì)吧?

  Boris:對(duì)。如果你看現(xiàn)在 agents 的啟動(dòng)方式——我沒拉過(guò)數(shù)據(jù),但我敢猜大多數(shù) agents 其實(shí)都是由 Claude 觸發(fā)的,以sub agents的形式。

  sub agent 本質(zhì)上就是遞歸版 Claude Code,在代碼里就是這么實(shí)現(xiàn)的。它是被“mama Claude”提示出來(lái)的。我覺得如果你看大多數(shù) agents,大概率都是這樣被發(fā)起的。

  Harj:我的 Claude insights 最近也提示我,debug 的時(shí)候應(yīng)該多這么做。我經(jīng)常花很多時(shí)間 debug,如果能并行起多個(gè) sub agents:一個(gè)看 log、一個(gè)看 code path,感覺是必然趨勢(shì)。我已經(jīng)把這個(gè)寫進(jìn) CLAUDE.md 了:下次修 bug,就讓多個(gè) agent 并行分工。

  Garry:遇到那種又怪又嚇人的 bug,我會(huì)用 plan mode 修,它就會(huì)用 agents 去廣泛搜索。相比之下,你在線性模式下更像是“做一個(gè)任務(wù)”,而不是“寬搜”。

  Boris:我也一直這么做。如果一個(gè)測(cè)試像“研究型測(cè)試”,比較難,我會(huì)按任務(wù)難度來(lái)校準(zhǔn) sub agents 數(shù)量:難一點(diǎn)就 3 個(gè),或者 5 個(gè),甚至 10 個(gè),并行研究,看他們最后匯總出什么。

  Harj:那你為什么不把這個(gè)寫進(jìn)你的 CLAUDE.md?

  Boris:看情況。這更像一個(gè)快捷方式:如果你發(fā)現(xiàn)自己反復(fù)重復(fù)同一句話,那就寫進(jìn) CLAUDE.md;否則不需要把所有東西都寫進(jìn)去,你直接 prompt Claude 就行。

  Harj:你心里也會(huì)不會(huì)想著:可能六個(gè)月后你連這都不用顯示 prompt 了,模型自己就能搞定?

  Boris:也許一個(gè)月后就不用了。

  Diana:一個(gè)月后連 plan mode 都不需要了。

  Boris:我覺得 plan mode 可能確實(shí)有一個(gè)比較有限的生命周期。

  Diana:這對(duì)在場(chǎng)所有人都是個(gè)“alpha”。如果沒有 plan mode,世界會(huì)是什么樣?是不是你只要在 prompt 里描述清楚,它就能直接做完?一發(fā)入魂?

  Boris:對(duì)。我們已經(jīng)開始在做這方面的實(shí)驗(yàn)了,因?yàn)?Claude Code 現(xiàn)在已經(jīng)能自己進(jìn)入 plan mode 了,你們可能也見過(guò)。我們正在努力把這個(gè)體驗(yàn)打磨到“剛剛好”:它會(huì)在一個(gè)人類也會(huì)想要進(jìn)入 plan mode 的那個(gè)節(jié)點(diǎn)自動(dòng)進(jìn)入。

  其實(shí) plan mode 沒什么秘密,它做的事非常簡(jiǎn)單,就是在 prompt 里加一句“請(qǐng)先不要寫代碼”。僅此而已。你其實(shí)也可以自己直接這么說(shuō)。

  Diana Hu:聽起來(lái),Claude Code 的很多功能開發(fā)方式都很符合 YC 常說(shuō)的那套:先跟用戶聊、看用戶怎么用,然后再回來(lái)實(shí)現(xiàn);而不是你先有一個(gè)宏大的 master plan,再把所有功能按計(jì)劃做出來(lái)。

  Boris:對(duì),基本就是這樣。比如 plan mode,就是我們看到用戶經(jīng)常會(huì)說(shuō):“Claude 先幫我想方案、規(guī)劃一下,但先別寫代碼?!边@種說(shuō)法有很多版本:有時(shí)只是把想法聊透;有時(shí)是讓 Claude 寫非常復(fù)雜的 spec。

  但共同點(diǎn)都是:先做事、先想清楚,但暫時(shí)不要寫代碼。

  所以那天就是周日晚上 10 點(diǎn),我在看 GitHub issues、看內(nèi)部 Slack 反饋頻道,看到大家在討論這個(gè)。我就用 30 分鐘寫出來(lái),當(dāng)晚就發(fā)了,周一早上就上線了——這就是 plan mode。

  Harj:所以你說(shuō)“以后不需要 plan mode”,是指那種“我擔(dān)心模型會(huì)跑偏、做錯(cuò)方向,所以需要 plan mode 來(lái)約束它”的需求會(huì)消失?但“你仍然需要把想法想清楚、把需求說(shuō)清楚”這件事不會(huì)消失吧?你總得在某個(gè)地方完成思考。

  Boris:我更愿意從“模型能力在提升”來(lái)理解這個(gè)變化。

  比如六個(gè)月前,單有 plan 還不夠。你讓 Claude 做計(jì)劃,即使開了 plan mode,你也還是得在旁邊盯著、babysit,因?yàn)樗赡芘芷,F(xiàn)在我的習(xí)慣是:大概 80% 的 session 我都從 plan mode 開始。

  雖然我說(shuō) plan mode 的壽命可能有限,但我其實(shí)是重度用戶。我會(huì)讓 Claude 先做計(jì)劃,然后切到第二個(gè)終端 tab,讓另一個(gè)任務(wù)也先做計(jì)劃;tab 不夠我就開桌面端 app,再去 code tab 里開更多 tab,總之大多數(shù)時(shí)候都是從 plan mode 起手。計(jì)劃一旦靠譜了(有時(shí)需要一點(diǎn)來(lái)回),我就讓 Claude 直接執(zhí)行。

  而現(xiàn)在用 Opus 4.5 的感受是:我覺得大概從 4.6 開始,它真的變得很穩(wěn)了。只要 plan 是對(duì)的,它幾乎每次都能一路保持在正確軌道上,把事情做對(duì)。

  所以你會(huì)看到 babysit(意思是:全程盯著、隨時(shí)糾正、手把手看著它別出錯(cuò))的位置在變化——以前你要在 plan 前后都盯著;現(xiàn)在更多是只需要在 plan 之前盯著。再往后一步,也許你連 babysit 都不用了:你給一個(gè) prompt,Claude 自己就能把它想清楚、做完。

  Garry:下一步就是 Claude 直接跟你的用戶對(duì)話了。它直接繞過(guò)你本人。

  Boris:挺好玩的,這其實(shí)已經(jīng)是我們現(xiàn)在在做的事了。

  我們的 Claude 之間會(huì)互相交流,也會(huì)(至少在內(nèi)部)挺經(jīng)常直接在 Slack 上跟用戶溝通。我自己的 Claude 偶爾還會(huì)想發(fā)推,但我一般會(huì)刪掉——有點(diǎn)“尬”,我不太喜歡它的語(yǔ)氣。

  Garry:它都想發(fā)些什么?

  Boris:有時(shí)候就是會(huì)去回復(fù)別人。因?yàn)槲液笈_(tái)一直開著 co-work,co-work 特別愛這么干,它很喜歡用瀏覽器。

  一個(gè)非常常見的模式是:我讓 Claude 去 build 某個(gè)東西,它會(huì)先去看代碼庫(kù);如果在 git blame 里看到某個(gè)工程師最近動(dòng)過(guò)相關(guān)代碼,它就會(huì)在 Slack 上直接給那位工程師發(fā)消息,問(wèn)一個(gè)澄清問(wèn)題。等對(duì)方回了,它就繼續(xù)往下做。

  8 對(duì)各行業(yè)創(chuàng)始人的“未來(lái)”建議

  Diana:那你給現(xiàn)在的創(chuàng)始人,一些“面向未來(lái)”的建議吧。感覺一切變化都很快,有哪些原則會(huì)長(zhǎng)期有效,哪些會(huì)改變?

  Boris:有些原則聽起來(lái)很基礎(chǔ),但我覺得它們現(xiàn)在比以前更重要。

  比如latent demand(潛在需求),我提過(guò)無(wú)數(shù)次了,對(duì)我來(lái)說(shuō)它就是產(chǎn)品里最重要的一條

  很多人不理解它,我在前幾個(gè)創(chuàng)業(yè)項(xiàng)目里也沒理解。它的意思大概是:人們只會(huì)去做他們本來(lái)就在做的事情,你很難讓人去做一件全新的事。如果人們已經(jīng)在努力做某件事,你讓它更容易,這是好想法;但如果人們正在做一件事,你非要讓他們改去做另一件事,他們大概率不會(huì)做。所以你要做的,就是讓他們“本來(lái)就想做的事”更容易。

  而且 Claude,會(huì)越來(lái)越擅長(zhǎng)幫你發(fā)現(xiàn)這些產(chǎn)品點(diǎn)子。因?yàn)樗芸捶答?、?debug logs,它能自己把這些東西梳理出來(lái)。

  Harj:所以你說(shuō) plan mode 是 latent demand,是因?yàn)橛脩舯緛?lái)就已經(jīng)會(huì)在瀏覽器里開著 Claude 的聊天窗口,用它來(lái)討論 spec、討論該怎么做;然后 plan mode 只是把這件事“搬進(jìn)”Claude Code 里,讓它在 Claude Code 里就能完成?

  Boris:對(duì),就是這樣。有時(shí)候我會(huì)在辦公室里走一圈,在同事身后站一下(當(dāng)然我會(huì)先打招呼,不是偷看那種),看看大家具體怎么用 Claude Code。我看到很多類似的用法,而且 GitHub issues 里也有人在討論。

  Harj:你說(shuō)你最驚訝的是終端被推到了這么遠(yuǎn)。那你覺得它還能走多遠(yuǎn)?在“swarm、多 agent”的世界里,會(huì)不會(huì)需要一個(gè)新的 UI 來(lái)承載這些東西?

  Boris:挺有意思的。如果你一年前問(wèn)我,我會(huì)說(shuō)終端最多還有三個(gè)月壽命,然后我們就會(huì)換到下一個(gè)形態(tài)。

  你也能看到我們一直在做各種實(shí)驗(yàn):Claude Code 從終端起步,但現(xiàn)在也在 web 上、在桌面端 app(code tab 里),大概我們做了三個(gè)月或六個(gè)月;它也在 iOS/Android app 的 code tab 里;在 Slack、在 GitHub;還有 VS Code 擴(kuò)展、JetBrains 擴(kuò)展。我們一直在嘗試不同的 form factor,想弄清楚“下一個(gè)形態(tài)”是什么。

  到目前為止,我對(duì) CLI 的壽命判斷一直錯(cuò),所以我大概也不是最適合預(yù)測(cè)這件事的人。

  Harj:那你給 DevTool( Developer Tool,開發(fā)者工具)創(chuàng)始人的建議呢?如果今天有人在做 DevTool 公司,他應(yīng)該只為工程師 / 人類構(gòu)建,還是也要考慮“Claude 會(huì)怎么想”、要不要為 agent 構(gòu)建?

  Boris:我會(huì)這樣表述:去想清楚模型想做什么,然后讓它更容易做到。

  比如我最初 hack Claude Code 的時(shí)候,我意識(shí)到:它就是想用工具,它想和世界交互。那你怎么支持它?不要把它關(guān)在盒子里,然后告訴它“這是 API、這是你跟我交互的方式、這是你跟世界交互的方式”。正確做法是:去觀察它想用哪些工具、它想完成什么,然后像你為用戶做產(chǎn)品一樣,把這些能力真正“放開”,讓它能做到。

  所以如果你在做 dev tool 初創(chuàng)公司,我會(huì)先問(wèn):你要為用戶解決什么問(wèn)題?然后當(dāng)你用模型來(lái)解決這個(gè)問(wèn)題時(shí),模型“想做的動(dòng)作”是什么?最后你的技術(shù)方案與產(chǎn)品方案,如何同時(shí)服務(wù)用戶的需求與模型的需求,讓兩邊的權(quán)重和需求都被滿足。

  9 從 TypeScript 到 Claude Code,愉悅感很重要

  Diana:十多年前,你是 TypeScript 的重度用戶,還寫過(guò)一本 TypeScript 的書,那時(shí) TypeScript 還沒火起來(lái),大家還深陷 JavaScript。那會(huì)兒 TypeScript 還很“怪”,很多人不理解它為什么要給 JavaScript 加類型。現(xiàn)在回頭看,它反而成了正確方向。我覺得 Claude Code 在終端里的形態(tài),跟早期 TypeScript 有很多相似之處。

  Boris:TypeScript 做了很多很“奇怪”的語(yǔ)言設(shè)計(jì)。比如它的類型系統(tǒng)里幾乎任何東西都可以變成 literal type,這非常極端,甚至 Haskell 都不這么做。它還有 conditional types,這種東西我覺得很多語(yǔ)言壓根沒想過(guò)。但它又很強(qiáng)類型。

  早期 Joe Pamer、Anders 和團(tuán)隊(duì)構(gòu)建 TypeScript 時(shí)的思路是:我們有很多大型、未類型化的 JavaScript 代碼庫(kù),我們得把類型加進(jìn)去;但你不可能讓工程師改變寫代碼的方式。你也不可能讓 JavaScript 程序員像 Java 程序員那樣寫 15 層 class inheritance。他們會(huì)按自己的方式寫:用反射、用 mutation、用各種傳統(tǒng)上很難做類型化的特性。

  Diana:對(duì)任何強(qiáng)函數(shù)式程序員來(lái)說(shuō),那些都是“很不安全”的寫法。

  Boris:沒錯(cuò)。所以他們沒有逼人改變寫法,而是反過(guò)來(lái)圍繞這種寫法去構(gòu)建類型系統(tǒng)。這太聰明了。

  很多點(diǎn)子在當(dāng)時(shí)連學(xué)界都沒人做,完全來(lái)自實(shí)踐:觀察人們?cè)趺磳?JavaScript,理解他們想怎么寫,然后把類型系統(tǒng)“貼合”到這個(gè)現(xiàn)實(shí)里。

  Claude Code 也有點(diǎn)類似:你可以把它當(dāng)作 Unix 工具來(lái)用,可以 pipe 進(jìn)去、也可以 pipe 出來(lái);在某些方面它挺“嚴(yán)謹(jǐn)”的。但在幾乎其他所有方面,它只是我們想要的工具而已。

  我先為自己做一個(gè)工具,然后團(tuán)隊(duì)為自己做,再給 Anthropic 員工用,再給用戶用,最后它就變得非常有用。這不是一個(gè)“學(xué)院派、原則性很強(qiáng)”的產(chǎn)物。

  Diana:結(jié)果也證明了這一點(diǎn)。十五年后,Haskell 那樣更學(xué)術(shù)的語(yǔ)言并沒有成為大多數(shù)代碼庫(kù)的選擇,TypeScript 這種更實(shí)用的語(yǔ)言反而大量鋪開了。因?yàn)樗鉀Q了問(wèn)題。順便說(shuō)一句,我也不知道有多少人知道:Claude Code 的終端界面可能是現(xiàn)在最漂亮的終端應(yīng)用之一,而且是用 React terminal 寫的。

  Boris:我一開始做它的時(shí)候,我曾經(jīng)做過(guò)一段時(shí)間前端。我也算是個(gè)“混合型”:做設(shè)計(jì)、做用戶研究、寫代碼,都會(huì)一點(diǎn)。

  我們也很喜歡招這種工程師,所以我們確實(shí)偏愛 generalists。

  對(duì)我來(lái)說(shuō),我在做一個(gè)終端里的產(chǎn)品,但我其實(shí) Vim 用得也挺差的(笑)。所以我會(huì)想:怎么做一個(gè)讓“像我這樣的人”也用起來(lái)舒服的終端工具?

  愉悅感非常重要。

  YC 也經(jīng)常講“做一個(gè)人們真正愛用的東西”。產(chǎn)品如果只是有用,但用起來(lái)不會(huì)愛上它,那不夠好。它得同時(shí)做到“有用”和“讓人愛”。

  但為終端做設(shè)計(jì)真的很難:80×100 個(gè)字符左右、256 色、一個(gè)字號(hào)、幾乎沒有鼠標(biāo)交互……你能做的事非常有限,trade-off 特別多。一個(gè)不太多人知道的點(diǎn)是:終端其實(shí)可以開鼠標(biāo)交互,比如點(diǎn)擊之類。

  Jared:那 Claude Code 里怎么開?我一直想弄明白這個(gè)。

  Boris:我們沒有在 Claude Code 里做這個(gè)。我們其實(shí)原型過(guò)幾次,但體驗(yàn)很糟。因?yàn)橐坏┠阋鍪髽?biāo)交互,就得虛擬化滾動(dòng),會(huì)帶來(lái)很多很奇怪的 trade-off。終端的底層也很特殊——它沒有 DOM,更多是 ANSI escape codes 之類的東西,是從 1960 年代一路“有機(jī)演化”出來(lái)的一堆規(guī)范。

  Garry:這感覺 BBS。像那種 BBS 門口小游戲。

  Boris:這評(píng)價(jià)太好了。

  但我們確實(shí)得自己摸索出很多終端 UX 原則,因?yàn)閹缀鯖]人寫這些。你看 80、90、00 年代的大型終端應(yīng)用,它們用 curses,有一堆窗口,看起來(lái)以今天標(biāo)準(zhǔn)會(huì)比較“土”、比較厚重復(fù)雜。所以我們得重造很多東西。

  比如一個(gè)很小的細(xì)節(jié):終端里的 spinner(加載轉(zhuǎn)圈那種提示),到現(xiàn)在可能迭代了 50 次、甚至 100 次,里面大概 80% 都沒上線。我們就是不斷試:不舒服就換下一個(gè),再試,不舒服再換。

  Claude Code 的一個(gè)神奇之處是:你可以連做 20 個(gè)原型,選一個(gè)最喜歡的,然后發(fā)布,整個(gè)過(guò)程可能也就幾個(gè)小時(shí)。

  過(guò)去你可能要用 Origami、Framer 之類的工具,做三版原型都得兩周,慢很多?,F(xiàn)在我們有一種“奢侈”:我們要探索一個(gè)新終點(diǎn),我們不知道正確答案是什么,但我們能用極快的迭代速度逼近它——這讓我們更容易做出一個(gè)“快樂(lè)的、讓人愛用”的產(chǎn)品。

  10 給開發(fā)者們的其他建議

  Jared:Boris,你剛才說(shuō)你還有一些給 builders 的建議,但我們一直插話,因?yàn)楹闷娴膯?wèn)題太多了。

  Boris:我大概還有兩條建議,可能聽起來(lái)有點(diǎn)“奇怪”,因?yàn)樗鼈兌几盀槟P蜆?gòu)建”有關(guān)。

  第一條是:不要為今天的模型構(gòu)建,要為六個(gè)月后的模型構(gòu)建。

  這聽起來(lái)有點(diǎn)反直覺,因?yàn)槿绻a(chǎn)品今天跑不通,就很難找到 PMF。但你還是應(yīng)該這么做,否則你可能會(huì)花很多精力在“當(dāng)下模型”的 PMF 上,然后很快被別人超車,因?yàn)樗麄冊(cè)跒橄乱粋€(gè)模型構(gòu)建,而新模型幾個(gè)月就來(lái)一次。

  所以你要不斷用模型,去摸清它能力的邊界,然后為你認(rèn)為“六個(gè)月后會(huì)出現(xiàn)的模型能力”做準(zhǔn)備。

  第二條建議是:在我們 Claude Code 團(tuán)隊(duì)的區(qū)域墻上,掛著一份《The Bitter Lesson》的裝裱版。我覺得所有人都應(yīng)該讀這篇文章(作者是 Rich Sutton)。核心思想之一是:更通用的方法最終會(huì)贏過(guò)更特化的方法。推到極致,就是一句話:不要和模型對(duì)賭(never bet against the model)。

  我們經(jīng)常面臨一個(gè) trade-off:我們可以在 Claude Code 里加功能,讓產(chǎn)品更好,這些非模型本體的代碼我們叫 scaffolding(腳手架);但我們也可以等幾個(gè)月,新模型可能就能原生做到這些。

  這個(gè)權(quán)衡一直存在:你現(xiàn)在投入工程精力,可能在某個(gè)能力維度上多拿到 10%~20% 的提升;或者你干脆等下一代模型,免費(fèi)得到。所以要始終用這個(gè) trade-off 來(lái)思考:你到底要在哪些地方投入?并且假設(shè)你做的 scaffolding 最終都會(huì)變成“技術(shù)債”。

  Diana Hu:那你們會(huì)不會(huì)每六個(gè)月就大改 Claude Code?有沒有一些 scaffolding 被刪掉了,因?yàn)槟P妥儚?qiáng)后不需要了?

  Boris:太多了。Claude Code 幾乎就是寫了又寫、改了又改、重寫了無(wú)數(shù)次。我們每隔幾周就會(huì)下掉一些工具(unship),也會(huì)每隔幾周加新工具。

  六個(gè)月前存在的代碼,現(xiàn)在幾乎沒有任何一部分還保留著——它一直在被重寫。

  Diana:那是不是可以說(shuō),當(dāng)前 Claude Code 的代碼庫(kù)里,80% 都是最近幾個(gè)月才寫的?

  Boris:對(duì),肯定。甚至可能更短。幾個(gè)月這個(gè)感覺挺準(zhǔn)確的。

  Diana:這也是另一個(gè)“alpha”:代碼的 shelf life 可能只有幾個(gè)月,頂尖的創(chuàng)始人應(yīng)該預(yù)期這種生命周期。

  11 1000x 工程師,Claude 把傳說(shuō)變成現(xiàn)實(shí)

  Garry:你們看到 Steve Yegge 那篇夸 Anthropic 工作體驗(yàn)的帖子了嗎?里面有一句很震撼:他說(shuō) Anthropic 的工程師平均生產(chǎn)力是 Google 巔峰時(shí)期工程師的 1000 倍,這數(shù)字太夸張了。三年前我們還在聊 10x engineer,現(xiàn)在都在聊 1000x 了,還是“對(duì)標(biāo) Google 巔峰工程師”的 1000x,太離譜了。

  Boris:內(nèi)部確實(shí)是這樣。如果看技術(shù)員工,大家每天都用 Claude Code,甚至非技術(shù)員工也在用——我覺得銷售團(tuán)隊(duì)里大概有一半人在用 Claude Code。他們后來(lái)開始轉(zhuǎn)向 co-work,因?yàn)楦菀子茫矣?VM,會(huì)更安全一點(diǎn)。

  我們剛拉了個(gè)數(shù)據(jù):團(tuán)隊(duì)去年規(guī)模翻倍,但“人均工程產(chǎn)出”大概漲了 70%。衡量方式很粗糙——就是 pull requests,但我們也會(huì)用 commits、以及 commit 的生命周期等指標(biāo)交叉驗(yàn)證。

  自從 Claude Code 推出后,Anthropic 的人均工程產(chǎn)出整體漲了 150%。

  因?yàn)槲乙郧霸?Meta 負(fù)責(zé)代碼質(zhì)量,也負(fù)責(zé)跨多個(gè)產(chǎn)品線的代碼庫(kù)質(zhì)量。當(dāng)時(shí)我們做“提升生產(chǎn)力”,看到 2% 的提升,都可能需要幾百人干一年。所以這種100% 級(jí)別的提升,是完全沒見過(guò)的,徹底聞所未聞。

  12 作為開發(fā)者,Boris 為何選擇加入 Anthropic?

  Garry:你當(dāng)初為什么會(huì)選擇加入 Anthropic?你作為 builder,其實(shí)去哪都行。是什么讓你覺得“就是這群人、就是這種方式”?

  Boris:我當(dāng)時(shí)住在日本鄉(xiāng)下,每天早上刷 Hacker News。

  后來(lái)某個(gè)時(shí)候開始,新聞全都是 AI。我開始用一些早期產(chǎn)品,記得第一次用的時(shí)候,真的有點(diǎn)“屏住呼吸”的感覺,說(shuō)出來(lái)有點(diǎn)肉麻,但當(dāng)時(shí)就是那種感覺:太驚艷了。那大概還是 Claude 2 的時(shí)代。

  于是我開始跟 Labs 的朋友聊,看看他們?cè)谧鍪裁?。我認(rèn)識(shí)了 Anthropic 的創(chuàng)始人之一 Ben Mann,他很快就說(shuō)服了我。后來(lái)見到更多團(tuán)隊(duì)成員,也同樣打動(dòng)我,大概是兩點(diǎn):

  第一,它真的像一個(gè)研究實(shí)驗(yàn)室在運(yùn)轉(zhuǎn)。產(chǎn)品本身非常小,核心只有一件事:把安全模型做出來(lái)。離模型更近、離研發(fā)更近、產(chǎn)品不是最重要的——模型才是最重要的。這對(duì)我這種做了很多年產(chǎn)品的人來(lái)說(shuō),非常共鳴。

  第二點(diǎn)是它的mission-driven(這里的 mission 指:確保 AI 安全發(fā)展,避免災(zāi)難性后果)。我是重度科幻讀者,書架全是科幻。我很清楚這件事最壞情況下會(huì)有多糟。我在想今年會(huì)發(fā)生什么時(shí),我覺得會(huì)非常瘋狂;在最壞情況下,它也可能非常非常糟。所以我想在一個(gè)真正理解這一點(diǎn)、真正把它內(nèi)化的地方工作。

  在 Anthropic,你在食堂、走廊里聽到的對(duì)話,大家都在聊 AI safety,這就是所有人最關(guān)心的東西。我很想待在這樣的地方。對(duì)我個(gè)人來(lái)說(shuō),這個(gè) mission 太重要了。

  13 預(yù)計(jì)“以后寫代碼都不用 IDE 了”

  Jared:那你說(shuō)“今年會(huì)發(fā)生什么”,你具體指什么?

  Boris:如果你回想六個(gè)月前大家做的預(yù)測(cè),Dario 預(yù)測(cè)過(guò):Anthropic 里 90% 的代碼會(huì)由 Claude 寫。這個(gè)預(yù)測(cè)是真的。

  對(duì)我個(gè)人來(lái)說(shuō),自從 Opus 4.5 之后基本就是 100%:我把 IDE 都卸了,我不再手寫任何一行代碼,全都用 Claude Code 和 Opus。我每天能落 20 個(gè) PR。如果看 Anthropic 整體,不同團(tuán)隊(duì)在 70%~90% 之間浮動(dòng);很多團(tuán)隊(duì)、很多人其實(shí)也是 100%。

  我記得今年 5 月我們發(fā)布 Claude Code 時(shí),我還做過(guò)一個(gè)預(yù)測(cè):以后寫代碼不需要 IDE 了。當(dāng)時(shí)聽起來(lái)特別離譜,我感覺臺(tái)下都倒吸一口氣,因?yàn)樘鋸埩恕5鋵?shí)你只要沿著指數(shù)曲線去推,這就是會(huì)發(fā)生的事情。

  我們公司 DNA 里就有這條——因?yàn)槲覀兊娜粍?chuàng)始人是 scaling laws 那篇論文的共同作者,他們很早就看到這條曲線。所以這不是玄學(xué),就是沿著指數(shù)走下去,而它確實(shí)發(fā)生了。

  Boris:繼續(xù)沿著這條指數(shù)往前推,我覺得編程會(huì)逐漸對(duì)每個(gè)人都“被解決”。

  今天對(duì)我來(lái)說(shuō)基本已經(jīng)解決了;我認(rèn)為以后對(duì)所有人都會(huì)如此,不管是什么領(lǐng)域。我們會(huì)開始看到 “軟件工程師”這個(gè)頭銜慢慢消失。可能會(huì)變成 builder、product manager,或者頭銜還保留,但只是一個(gè)遺留符號(hào)。因?yàn)榇蠹易龅墓ぷ鞑辉僦皇菍懘a:軟件工程師還會(huì)寫 spec、還會(huì)跟用戶溝通。

  我們團(tuán)隊(duì)現(xiàn)在已經(jīng)出現(xiàn)這種趨勢(shì):工程師是通才,每個(gè)職能都在寫代碼——PM 寫、設(shè)計(jì)師寫、EM 寫、甚至我們的 finance 同事也寫。未來(lái)你會(huì)在更多地方看到這一幕。

  這算是沿趨勢(shì)推演得到的“下限”。但“上限”更嚇人。

  比如我們提到 ASL4 在 Anthropic 我們有這些安全等級(jí):ASL3 是目前模型所處的位置;ASL4 是模型具備遞歸自我改進(jìn)能力。如果走到那一步,我們必須滿足一堆條件才能發(fā)布模型。

  最極端的情況,是出現(xiàn)遞歸自改;或者出現(xiàn)災(zāi)難性濫用,比如用模型設(shè)計(jì)生物病毒、設(shè)計(jì) zero-day 等等。這些都是我們現(xiàn)在非常非常認(rèn)真在防的事情,確保它不要發(fā)生。

  我看到大家用 Claude Code 的方式,真的很震撼。我最初只是想做個(gè)酷東西,結(jié)果它變得這么有用,這既意外、又興奮。

  Harj:我從外界的感覺是,大家假期一結(jié)束就突然發(fā)現(xiàn) Claude Code,然后就一路瘋到現(xiàn)在。內(nèi)部也是這樣嗎?你們是不是過(guò)了個(gè)美好的圣誕假期,回來(lái)發(fā)現(xiàn)“發(fā)生了什么”?

  Boris:其實(shí) 12 月我一直在旅行,我給自己放了個(gè)“coding vacation”。到處走,但每天都在寫代碼,這種感覺還挺好。那段時(shí)間我也開始用 Twitter,因?yàn)槲乙郧白鲞^(guò) Threads,所以我一直是 Threads 用戶,我就想看看大家都在哪個(gè)平臺(tái)活躍。

  我覺得很多人就是在那時(shí)發(fā)現(xiàn)了 Opus 4.5。我其實(shí)早就知道 Opus 4.5 的能力了。內(nèi)部這幾個(gè)月 Claude Code 一直在指數(shù)式增長(zhǎng),所以假期之后曲線只是變得更陡了。

  現(xiàn)在你看外部也有各種數(shù)據(jù):比如 Mercury 說(shuō)有 70% 的創(chuàng)業(yè)公司選擇 Claude 作為首選模型;還有 SemiAnalysis 之類的數(shù)據(jù)說(shuō),公開 commits 里有 4% 是 Claude Code 產(chǎn)生的。

  大公司用、小公司也用。甚至它還參與了 Perseverance(火星車)的航線規(guī)劃,這對(duì)我來(lái)說(shuō)太酷了。我們團(tuán)隊(duì)還專門印了海報(bào),因?yàn)榇蠹矣X得“NASA 選擇用這個(gè)東西”實(shí)在太酷了。但也感覺這才剛開始。

  14 非技術(shù)用戶也開始用 Claude Code

  Garry:Claude Code 和 co-work 之間是什么關(guān)系?co-work 是 Claude Code 的一個(gè) fork 嗎,還是你讓 Claude Code 看了 Claude Code,然后寫了個(gè)給非技術(shù)用戶的 spec,再跑幾天就做出來(lái)了?

  Boris:我這大概是第五次用“l(fā)atent demand”(潛在需求)這個(gè)詞了(笑)。

  我們當(dāng)時(shí)看 Twitter:有人用 Claude Code 去監(jiān)測(cè)番茄植物;有人用它從損壞硬盤里恢復(fù)婚禮照片;有人用它做金融相關(guān)的事情。

  回到 Anthropic 內(nèi)部:每個(gè)設(shè)計(jì)師都在用;整個(gè)財(cái)務(wù)團(tuán)隊(duì)都在用;數(shù)據(jù)科學(xué)團(tuán)隊(duì)也在用,但他們用它并不是為了寫代碼。很多人為了用它,愿意去折騰半天,在終端里安裝一個(gè)東西。

  我們很早就知道我們要做點(diǎn)什么,于是試了很多想法,最后真正“起勢(shì)”的,就是桌面端 app 里那個(gè)簡(jiǎn)單的 GUI wrapper——本質(zhì)就是 Claude Code 的外殼而已。底層還是同一個(gè) agent,完全是 Claude Code。

  Felix 是早期的重要貢獻(xiàn)者,他很熟那套技術(shù)棧。當(dāng)時(shí)他們?cè)谠嚫鞣N想法,最后大概 10 天就把它做出來(lái)了,而且?guī)缀?100% 都是 Claude Code 寫的。我們覺得它已經(jīng)到了可以發(fā)布的狀態(tài)。

  當(dāng)然,為非技術(shù)用戶要補(bǔ)很多東西:它會(huì)在虛擬機(jī)里運(yùn)行;有很多刪除保護(hù);有很多權(quán)限提示和 guardrails。整體來(lái)說(shuō),這條路其實(shí)挺明顯的。

  https://www.youtube.com/watch?v=PQU9o_5rHC4

  聲明:本文為 InfoQ 整理,不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
榮耀CEO李健邀請(qǐng)何同學(xué)入職被婉拒 何同學(xué):工作室同事還指望我發(fā)工資

榮耀CEO李健邀請(qǐng)何同學(xué)入職被婉拒 何同學(xué):工作室同事還指望我發(fā)工資

快科技
2026-03-02 10:20:31
伊朗前王儲(chǔ)巴列維宣布將返回伊朗領(lǐng)導(dǎo)革命

伊朗前王儲(chǔ)巴列維宣布將返回伊朗領(lǐng)導(dǎo)革命

一種觀點(diǎn)
2026-01-19 19:36:11
4比0橫掃卻遭全網(wǎng)群嘲!國(guó)乒內(nèi)戰(zhàn)被指假球王勵(lì)勤愛徒陷讓球風(fēng)波

4比0橫掃卻遭全網(wǎng)群嘲!國(guó)乒內(nèi)戰(zhàn)被指假球王勵(lì)勤愛徒陷讓球風(fēng)波

卿子書
2026-03-03 09:24:11
“91女神”琪琪堪稱該系列知名度最高的女生,男方只給自己打碼

“91女神”琪琪堪稱該系列知名度最高的女生,男方只給自己打碼

挪威森林
2026-03-02 14:18:46
王楚欽孫穎莎在新加坡一起看鯊魚,孫穎莎追著鯊魚拍照

王楚欽孫穎莎在新加坡一起看鯊魚,孫穎莎追著鯊魚拍照

鳳幻洋
2026-03-03 09:32:17
1957年,“茜茜公主”為影迷簽名,“國(guó)王”看她的眼神柔情又專注

1957年,“茜茜公主”為影迷簽名,“國(guó)王”看她的眼神柔情又專注

小書生吃瓜
2026-01-04 16:49:16
朱婷加比相撞,緊急送醫(yī)治療,檢查結(jié)果出爐

朱婷加比相撞,緊急送醫(yī)治療,檢查結(jié)果出爐

跑者排球視角
2026-03-02 23:29:37
關(guān)于伊朗局勢(shì)的一些錯(cuò)誤說(shuō)法

關(guān)于伊朗局勢(shì)的一些錯(cuò)誤說(shuō)法

寰宇大觀察
2026-03-02 16:07:48
皇家馬德里主場(chǎng)輸赫塔費(fèi)代價(jià)慘重,三名球員面臨禁賽

皇家馬德里主場(chǎng)輸赫塔費(fèi)代價(jià)慘重,三名球員面臨禁賽

本澤體育
2026-03-03 08:38:04
誰(shuí)能想到她已經(jīng)62了,說(shuō)18都有人信,怎么做到這么好的狀態(tài)的

誰(shuí)能想到她已經(jīng)62了,說(shuō)18都有人信,怎么做到這么好的狀態(tài)的

白宸侃片
2026-02-11 11:56:19
146助18失誤!聯(lián)盟第1!神控敲定新東家,火箭與總冠軍漸行漸遠(yuǎn)

146助18失誤!聯(lián)盟第1!神控敲定新東家,火箭與總冠軍漸行漸遠(yuǎn)

世界體育圈
2026-03-03 09:04:57
“冬萍一笑,生死難料”后續(xù):前夫已重啟人生,那燕冬萍呢?

“冬萍一笑,生死難料”后續(xù):前夫已重啟人生,那燕冬萍呢?

大魚簡(jiǎn)科
2026-02-10 16:54:05
父母決裂哥哥離家出走,她被迫接手千億資產(chǎn),如今靠收租年入30億

父母決裂哥哥離家出走,她被迫接手千億資產(chǎn),如今靠收租年入30億

大魚簡(jiǎn)科
2026-03-01 12:20:15
藏匿9年的本·拉登:5米高墻鐵絲網(wǎng)防護(hù),致命破綻是院中晾衣繩

藏匿9年的本·拉登:5米高墻鐵絲網(wǎng)防護(hù),致命破綻是院中晾衣繩

通鑒史智
2026-01-23 14:52:23
烏克蘭再攻入俄羅斯領(lǐng)土!摧毀布良斯克指揮觀察所

烏克蘭再攻入俄羅斯領(lǐng)土!摧毀布良斯克指揮觀察所

項(xiàng)鵬飛
2026-02-27 20:35:45
金賽綸錄音公開:第一次發(fā)生關(guān)系在初二,他用金錢把我變成瘋女人

金賽綸錄音公開:第一次發(fā)生關(guān)系在初二,他用金錢把我變成瘋女人

喜歡歷史的阿繁
2026-03-02 09:59:11
不到24小時(shí),央媒3次點(diǎn)名王楚欽,釋放三大信號(hào),體壇地位又變了

不到24小時(shí),央媒3次點(diǎn)名王楚欽,釋放三大信號(hào),體壇地位又變了

以茶帶書
2026-03-02 18:11:21
8000萬(wàn)豪賭未來(lái)!曼聯(lián)鎖定B費(fèi)接班人,扛旗還是翻車成懸念

8000萬(wàn)豪賭未來(lái)!曼聯(lián)鎖定B費(fèi)接班人,扛旗還是翻車成懸念

卿子書
2026-03-03 09:05:09
日劇四天王--唐沢壽明丁克30年,被老婆山口智子管的“死死的”,家里的3條禁令驚呆所有人....

日劇四天王--唐沢壽明丁克30年,被老婆山口智子管的“死死的”,家里的3條禁令驚呆所有人....

日本通
2026-03-02 10:34:09
金正恩一句話讓全球震驚,韓國(guó)顫抖,中方第二天就出面發(fā)聲

金正恩一句話讓全球震驚,韓國(guó)顫抖,中方第二天就出面發(fā)聲

青煙小先生
2026-03-02 10:19:13
2026-03-03 10:19:02
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術(shù)社區(qū)媒體
12095文章數(shù) 51783關(guān)注度
往期回顧 全部

科技要聞

蘋果iPhone17e發(fā)布:4499元起 升級(jí)A19芯片

頭條要聞

牛彈琴:多國(guó)對(duì)轟炸保持沉默 西班牙首相確實(shí)是條漢子

頭條要聞

牛彈琴:多國(guó)對(duì)轟炸保持沉默 西班牙首相確實(shí)是條漢子

體育要聞

伯納烏8萬(wàn)人暴怒!高呼78歲老佛爺下課

娛樂(lè)要聞

李亞鵬與哥哥和解 只有一條真心話短信

財(cái)經(jīng)要聞

霍爾木茲海峽近乎停擺 布油直逼80美元

汽車要聞

國(guó)民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

本地
健康
教育
時(shí)尚
公開課

本地新聞

津南好·四時(shí)總相宜

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

教育要聞

內(nèi)蒙古教育反腐風(fēng)暴!千余人被處分后如何重建公平?

普通人穿衣真的很簡(jiǎn)單!單品選對(duì)、搭配合理,大方舒適又得體

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版