国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

撕開Claude Code真相:讓它好用的98.4%,是工程不是AI

0
分享至


新智元報道

編輯:元宇

【新智元導讀】當普通人還在鉆研「最強提示詞咒語」時,硅谷頂級實驗室已經把AI基建跑成了生產線。

你還在ChatGPT的聊天框里反復調prompt?

最近,一位X用戶發(fā)了條推文,開頭就是一個驚呼:頭部大廠偷偷在用的Claude Code項目模板外泄!

這已經不是寫提示詞了。這是AI工程基礎設施。


整套打法圍繞一個文件「CLAUDE.md」展開,而它的核心原則只有三條:

每次Claude犯錯→你加一條規(guī)則;每次你重復自己→你加一個工作流;每次出bug→你加一道護欄。


這樣做,是要把項目經驗沉淀成它每次啟動都會讀取的長期上下文和自動化約束。

整個架構,像是一家AI公司的崗位編制:CLAUDE.md是入職手冊,skills/是工作SOP,hooks/是合規(guī)部,docs/是公司章程,tools/是后勤組,src/才是真正出活的業(yè)務部門。


你不再是在和AI聊天了,而是在構建一個了解你代碼倉庫的AI。

最瘋狂的部分是,你只需要配置一次,Claude就會自動審查代碼,并按指令重構、強制執(zhí)行架構規(guī)則、撰寫發(fā)布說明、從技能中運行工作流、記住過去錯誤等。

而且它會越用越聰明。

大多數人,都是打開ChatGPT,寫提示詞,復制粘貼,反復;而在這套打法下,你只需要打開終端,跑一個skill代碼已交付。

這等于是在自己的代碼庫里養(yǎng)了一隊AI同事。

這條推文背后,傳遞的是這個時代正在悄悄翻篇的一個小信號,大多數人可能還沒反應過來。

一張不算泄露的「泄露截圖」

撕開一個真相

@ai_rohitt曬出來的這張截圖,是Anthropic官方文檔里公開推薦的Claude Code標準范式。


CLAUDE.md是Claude Code在每次會話開始時自動讀取的項目記憶文件。

.claude/skills/和.claude/hooks/是官方支持的擴展機制。

這些都是社區(qū)已經討論了幾個月的公開做法,并不是什么人偷出來的「內部模板」。

但它之所以能讓一些資深開發(fā)者主動轉發(fā),說明它得到了一些天天用Claude的開發(fā)者們的認同。

其中相當一部分人,可能這兩天才意識到原來它還能這么用。

而硅谷頂級團隊,已經把這件事跑成了生產線。

第一個例子,是OpenAI Frontier團隊。

OpenAI官方披露的Frontier團隊實驗中,一個從空repo起步的內部beta,在約5個月內由Codex生成了約100萬行代碼和約1500個PR;團隊從3人擴展到7人,人工不直接寫代碼。

帶隊的Ryan Lopopolo在后續(xù)訪談中進一步提到,這套工作流已經接近「0 人工代碼、0 人工 review」的極限形態(tài)。

他認為與其節(jié)省token,不如利用模型極高的并發(fā)能力和極低的成本來代替人類有限且昂貴的同步注意力。

第二個例子,是Stripe內部的自動化代碼代理系統(tǒng)Minions。

Stripe內部的Minions每周生成并推動超過1300個PR合并,這些代碼從頭到尾由AI生成,但仍經過人工review。

這里還有一對數據:1.6%vs98.4%,它來自Mohamed bin Zayed AI大學VILA-Lab發(fā)表的一篇論文。


https://arxiv.org/pdf/2604.14228

研究者系統(tǒng)性扒了Claude Code v2.1.88版本51.2萬行TypeScript源碼,給出的結論是:只有1.6%是AI決策邏輯,剩下的98.4%是確定性的工程基礎設施。

具體說就是權限網關、上下文管理、工具路由、錯誤恢復這四類。

這組數字不是說模型只貢獻1.6%的能力,而是說明Claude Code作為產品,大量復雜度不在模型本身,而在權限、上下文、工具路由、恢復機制等確定性工程基礎設施上。

@ai_rohitt那張圖里的CLAUDE.md/skills/hooks結構,就是普通開發(fā)者也能搭一套的「入門版基建」,它和OpenAI、Stripe那套生產級架構是同一種范式,只是規(guī)模小得多。

CLAUDE.md暴露的秘密

過去3年,所有人都在問「GPT什么時候能更聰明」「Claude什么時候出新版本」。

但真正在生產環(huán)境跑通AI編程的團隊,他們更關心的可能根本不是這個,而是如何讓AI記住自己上次踩過的坑,怎么讓AI在動手前先看一眼項目的架構約束,怎么讓AI犯錯的時候自己被工具擋住。

CLAUDE.md正是這一切的承載體。

Anthropic官方對它的定義只有一句:

一個markdown文件,放在項目根目錄,Claude Code在每次會話開始時自動讀取。


https://code.claude.com/docs/en/memory

聽上去很簡單,圍繞它展開的那幾層結構,才是它真正厲害的部分。

CLAUDE.md是項目大腦。

架構決策、命名約定、測試要求、那些反復踩過的坑,都堆在這里。它是AI每次啟動時第一眼看到的「員工手冊」。

.claude/skills/是可復用工作流。

Claude Code的創(chuàng)建者Boris Cherny在社區(qū)里反復強調一句話:「如果你每天做某件事超過一次,把它變成skill或command?!?/p>

一個skill就是一段可執(zhí)行的方法論。Code review、生成commit message、寫發(fā)布說明,這些都不該是每天手敲提示詞的活,應該是skill調一下就出結果。

.claude/hooks/是自動護欄。

這是最關鍵的部分。它不依賴AI自己判斷,由確定性代碼在AI犯錯之前就擋住它。這就是為什么敢讓AI「無人監(jiān)督」地跑,因為出錯的邊界由hooks卡死了。

docs/decisions/是架構決策記錄。

讓AI不僅知道代碼「是什么」,還知道代碼「為什么是這樣」。

這一項最容易被忽略,但也是AI協(xié)作最大的杠桿點。

tools/和src/是執(zhí)行層。

這套架構真正值得注意的地方,不在于某個開發(fā)者搞出了一個漂亮目錄,而是越來越多獨立團隊正在收斂到同一個方向:把模型放進一套由上下文、工具、權限、評估和反饋循環(huán)組成的harness里。

GitHub上已經能看到不少類似項目:

rohitg00的awesome-claude-code-toolkit、diet103的claude-code-infrastructure-showcase、affaan-m的everything-claude-code,都在圍繞agents、skills、hooks、rules、MCP configs等組件搭建Claude Code的工程化工作環(huán)境。

這說明,真正成熟的AI編程工作流,不是只靠一個更強的模型,也不是只靠一條更長的prompt,而是把模型嵌入一套可復用、可約束、可恢復、可審計的工程系統(tǒng)里。

至于具體目錄結構,各家實現并不完全相同。

OpenAI實驗室的極限實驗

2026年2月11日,OpenAI官方博客發(fā)了一篇文章:《Harness engineering: leveraging Codex in an agent-first world》。


https://openai.com/index/harness-engineering/

Anthropic圍繞這個概念重新調整了Claude Code的架構思路;Martin Fowler的網站把它凝練成一個公式:「Agent=Model+Harness?!?/p>

Harness這個詞來自馬術。它指的是馬的整套挽具,韁繩、馬嚼子、馬鞍、籠頭。

一匹馬可以跑得很快很有力,但它自己不知道往哪兒走:整套挽具決定了它的方向。

類比到AI編程:模型本身能力很強,但它不知道在你的代碼庫里該往哪兒走。Harness就是你為它造的方向盤+剎車+導航。

OpenAI Frontier團隊那個「100萬行0人工」的實驗,本質就是把Harness做到極致。

他們的關鍵工程實踐包括以下幾條。

層級架構強約束。

從Types到Config到Repo到Service到Runtime到UI,依賴關系單向流動,由linter在CI層強制執(zhí)行。Agent寫出違反層級關系的代碼?直接構建失敗。

linter錯誤信息本身是修復指令,這也是最反直覺的細節(jié)。

普通項目的lint錯誤是「violation detected」,給人看的;OpenAI Frontier的lint錯誤是「use logger.info({event: 'name', ...data}) instead of console.log」,給Agent看的、可以直接讀懂并修復的指令。

文檔作為單一事實來源。所有架構圖、execution plans、設計規(guī)范都在倉庫內部的docs/目錄。Agent不需要任何外部知識庫,一切就在repo里。

這套東西效果有多厲害?

模型沒有換,但LangChain調整了harness,包括系統(tǒng)提示、工具、中間件和推理模式,最終把Terminal Bench 2.0分數從52.8提到66.5。

你今天就能做的事

是為AI造一個項目大腦

問題回到普通開發(fā)者這里:如果范式已經轉移,作為一個普通工程師,今天就能做點什么。

第一件事,在你最重要的項目根目錄建一個CLAUDE.md。

不需要完美,也不需要很長。寫下你團隊的架構規(guī)則、命名約定、測試要求、那些反復踩過的坑,10分鐘能寫完一個能用的版本。

下次AI犯錯的時候,先不要手動修,而是問自己一句:CLAUDE.md里缺了什么?

第二件事,把每天重復做的事改造成skill。

這里要注意Boris Cherny的金句:「如果你每天做某件事超過一次,把它變成skill或command。」

Code review、生成commit message、寫發(fā)布說明、修一類重復的bug,這些都該是skill,不該是每天手敲提示詞。

第三件事,在容易踩坑的地方加一個hook。

Hook是98.4%里最有杠桿的那部分。它不依賴AI變聰明,它依賴確定性代碼做強制檢查。這是把人類工程師的判斷力翻譯成機器可讀約束的過程。

這件事的核心不在寫代碼,而在寫規(guī)則。

Karpathy今年1月在推特上的那句被廣泛轉發(fā)的話:「我已經從80%手動寫代碼變成了80%交給Agent寫?!?/p>

未來五年,工程師的能力曲線正在從「我能寫多少行代碼」轉向「我能為AI設計多嚴格的工作環(huán)境」。

寫代碼的活兒正在被Agent接管。

但設計那個讓Agent能寫出好代碼的世界,還是人的工作。而且比以前更難、更重要、也更有意思。

參考資料:

https://x.com/ai_rohitt/status/2048390767115428016?s=20

https://arxiv.org/pdf/2604.14228

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
2+8+9+3!掘金最爛首發(fā)!又一筆毒藥合同誕生

2+8+9+3!掘金最爛首發(fā)!又一筆毒藥合同誕生

籃球實戰(zhàn)寶典
2026-05-01 18:31:44
鄭麗文6月訪美剛官宣,國臺辦兩句話就讓行程“凍在機票上”

鄭麗文6月訪美剛官宣,國臺辦兩句話就讓行程“凍在機票上”

愛下廚的阿釃
2026-05-02 00:42:43
王健林時代落幕,輸給了這個靠趙薇起家、截胡許家印的湖北富豪!

王健林時代落幕,輸給了這個靠趙薇起家、截胡許家印的湖北富豪!

歷史偉人錄
2026-04-29 17:41:50
人類首份“陰蒂神經圖”完成,快感不是研究禁區(qū)

人類首份“陰蒂神經圖”完成,快感不是研究禁區(qū)

醫(yī)學界
2026-05-01 18:20:12
7-7!吳宜澤連丟五局后戰(zhàn)平艾倫,世錦賽決賽席位爭奪戰(zhàn)存懸念!

7-7!吳宜澤連丟五局后戰(zhàn)平艾倫,世錦賽決賽席位爭奪戰(zhàn)存懸念!

世界體壇觀察家
2026-05-02 01:51:51
荷蘭發(fā)達到什么程度了?人口僅1700萬,卻擁有12個世界五百強!

荷蘭發(fā)達到什么程度了?人口僅1700萬,卻擁有12個世界五百強!

抽象派大師
2026-04-30 00:16:18
民宿以“蛇很多”等理由勸退預訂客戶,官方通報

民宿以“蛇很多”等理由勸退預訂客戶,官方通報

界面新聞
2026-05-01 08:33:01
上映多時票房只有零元,一個觀眾都沒有,五一檔最慘電影誕生了

上映多時票房只有零元,一個觀眾都沒有,五一檔最慘電影誕生了

影視高原說
2026-05-01 08:47:30
豬大腸被關注!研究發(fā)現:糖尿病患者常吃豬大腸,或有5種變化

豬大腸被關注!研究發(fā)現:糖尿病患者常吃豬大腸,或有5種變化

芹姐說生活
2026-05-01 14:34:43
新疆宏景集團董事長李建宏在國外遭遇車禍去世,年僅60歲

新疆宏景集團董事長李建宏在國外遭遇車禍去世,年僅60歲

每日經濟新聞
2026-05-01 17:26:13
日本著名馬桶公司TOTO殺入芯片行業(yè)大獲成功

日本著名馬桶公司TOTO殺入芯片行業(yè)大獲成功

爆角追蹤
2026-05-01 19:37:18
他們說的話,我連標點符號都不信

他們說的話,我連標點符號都不信

胖胖說他不胖
2026-05-01 15:57:46
太諷刺!2026勞模名單爭議大,被疑有“許家印”,評論區(qū)不留情面

太諷刺!2026勞模名單爭議大,被疑有“許家印”,評論區(qū)不留情面

譚談社會
2026-05-01 14:42:03
“甲亢哥”不小心把在中國買的三折疊手機掉進海里,嘴里念叨“我的中國手機、花了4000美元”,感覺整個人要碎掉;網友:出新款了再來一趟

“甲亢哥”不小心把在中國買的三折疊手機掉進海里,嘴里念叨“我的中國手機、花了4000美元”,感覺整個人要碎掉;網友:出新款了再來一趟

瀟湘晨報
2026-05-01 20:15:11
罕見操作!中石油中石化積極向外國拋售原油,背后信號不簡單。

罕見操作!中石油中石化積極向外國拋售原油,背后信號不簡單。

荊楚寰宇文樞
2026-05-01 23:39:36
打什么電話比12345更管用?這些電話比它管用100倍,建議收藏好

打什么電話比12345更管用?這些電話比它管用100倍,建議收藏好

細說職場
2026-04-28 10:39:02
世錦賽:觀眾不斷起哄,裁判介入,艾倫被逼破僵局!吳宜澤險勝

世錦賽:觀眾不斷起哄,裁判介入,艾倫被逼破僵局!吳宜澤險勝

呀古銅
2026-05-02 02:08:43
看了伊朗新提案,特朗普只說3個字,轉頭下了命令,直戳伊朗命門

看了伊朗新提案,特朗普只說3個字,轉頭下了命令,直戳伊朗命門

基斯默默
2026-05-01 18:04:42
央視不買世界杯天價電視轉播權,沒想到球迷一邊倒地支持!

央視不買世界杯天價電視轉播權,沒想到球迷一邊倒地支持!

達文西看世界
2026-05-01 19:00:14
央媒發(fā)文,高調官宣梁朝偉新身份,定居日本傳聞5個月前早有真相

央媒發(fā)文,高調官宣梁朝偉新身份,定居日本傳聞5個月前早有真相

叨嘮
2026-05-01 01:44:57
2026-05-02 03:39:00
新智元 incentive-icons
新智元
AI產業(yè)主平臺領航智能+時代
15111文章數 66826關注度
往期回顧 全部

科技要聞

DeepSeek發(fā)布多模態(tài)論文又連夜刪除

頭條要聞

伊朗未爆彈藥爆炸 致革命衛(wèi)隊14人死亡

頭條要聞

伊朗未爆彈藥爆炸 致革命衛(wèi)隊14人死亡

體育要聞

無奈!約基奇:這要在塞爾維亞 全隊早被炒了

娛樂要聞

馬筱梅產后身材恢復超好 現身戶外直播

財經要聞

GPU神話松動,AI真正的戰(zhàn)場變了

汽車要聞

限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

態(tài)度原創(chuàng)

健康
本地
藝術
公開課
軍事航空

干細胞治燒燙傷面臨這些“瓶頸”

本地新聞

用青花瓷的方式,打開西溪濕地

藝術要聞

畫畫的你絕不能錯過!色塊與筆觸的激情之旅!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗:持續(xù)推進海上封鎖的行為不可容忍

無障礙瀏覽 進入關懷版