国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI能改10萬行代碼,卻讓你走路去洗車!Karpathy戳破「鋸齒狀智能」

0
分享至


新智元報(bào)道

編輯:元宇

【新智元導(dǎo)讀】能重構(gòu)10萬行代碼的頂尖模型,卻會(huì)建議你走路去洗車店洗車?最近,Karpathy把這件怪事講透了:AI能力是鋸齒狀的,背后是一門經(jīng)濟(jì)學(xué)。他還提到Vibe Coding抬高了編程的地板,但專業(yè)開發(fā)者還需要智能體工程。智能體時(shí)代,你可以外包思考,卻不能外包理解。

今天最先進(jìn)的大模型,可以一口氣重構(gòu)一個(gè)10萬行的代碼庫,也會(huì)在你想要洗車的時(shí)候,建議你走路去50米外的洗車店。

為什么同一個(gè)模型,一會(huì)兒它表現(xiàn)得像一位超級(jí)工程師,一會(huì)兒卻又像一個(gè)剛畢業(yè)的實(shí)習(xí)生?

這是Karpathy近日在Sequoia AI Ascent 2026爐邊談話中拋出的一個(gè)畫面,他用鋸齒狀智能(jaggedness)來概括這種能力分布。


2026年4月29日,Karpathy在Sequoia AI Ascent 2026爐邊談話現(xiàn)場(chǎng)

談話結(jié)束后,他在X上發(fā)帖復(fù)盤整場(chǎng)對(duì)話的亮點(diǎn)。


他想講的第一件事是,大模型根本不只是在加速已有的東西,它還在打開幾條全新的地平線:有些事第一次變得可能,有些事開始顯得不必要。

第二件事,就是鋸齒狀智能。為什么模型一邊能干超人的活,一邊在常識(shí)題上翻車?Karpathy把鋸齒狀能力解釋為可驗(yàn)證性與經(jīng)濟(jì)激勵(lì)共同影響的結(jié)果。

第三件事,一個(gè)面向原生智能體(agent-native)的新經(jīng)濟(jì)正在長出來。所有今天為人類寫的軟件、文檔、流程,都要被重寫為「為agent寫」。

這三件事共同指向同一個(gè)判斷:AI已經(jīng)不是「寫代碼更快」那么簡(jiǎn)單。它在重寫軟件本身,也在重寫人類在系統(tǒng)里的位置。

Karpathy自己就是最鮮明的例子。

這位OpenAI創(chuàng)始成員、前Tesla AI負(fù)責(zé)人、Vibe Coding詞語的發(fā)明者,前不久還公開撂下一句話:「我從未感覺作為程序員這么落后過?!?/p>

Sequoia的主持人正是把這句話拎出來,作為爐邊談的開場(chǎng)白。

這并不是謙虛。

一年前發(fā)明「氛圍編程」(vibe coding)的人,親口承認(rèn)自己跟不上AI時(shí)代的浪潮,只能說明一點(diǎn):AI發(fā)展的速度實(shí)在太快了。

能改10萬行代碼

卻讓你走路去洗車

「太離譜了?!?/p>

Karpathy在Sequoia現(xiàn)場(chǎng)講了這個(gè)洗車的段子:最先進(jìn)的模型,可以重構(gòu)10萬行代碼庫,也會(huì)建議你走路去50米外的洗車店洗車。

10萬行代碼已經(jīng)足以構(gòu)成一個(gè)相當(dāng)復(fù)雜的軟件項(xiàng)目,而「走路去洗車店」呢?這是一個(gè)三歲孩子都能搞清楚的常識(shí)題。

你想洗的是車,車不能走路,所以人走路去洗車店是一個(gè)毫無意義的建議。一個(gè)能改10萬行代碼的模型,就在這種小學(xué)生級(jí)別的常識(shí)題上崩了。

Karpathy用這個(gè)例子來說明大模型的鋸齒狀智能,他認(rèn)為AI的能力并非均勻進(jìn)步的,而是參差不齊,就像一塊凹凸不平的鋸齒板。

因此今天理解AI最危險(xiǎn)的事,就是用「它行/它不行」二分法去判斷。

新地平線

當(dāng)軟件可以「直接做到」

Karpathy在爐邊談里講了一個(gè)讓他自己有點(diǎn)尷尬的故事。

他寫過一個(gè)App,叫MenuGen。在餐廳拍下看不懂的菜單,App幫你把每道菜畫出來。OCR加圖像生成,這是一個(gè)標(biāo)準(zhǔn)的軟件1.0項(xiàng)目。

然后有一天他看到了一個(gè)軟件3.0的版本。

那個(gè)版本只有一句話:把菜單照片發(fā)給Gemini,然后說「用Nanobanana把菜品貼到菜單上」。

Gemini直接吐出一張圖。還是那張菜單,但每一道菜旁邊都貼上了圖。


那一刻,Karpathy感覺到自己寫的MenuGen是多余的,因?yàn)樗€活在舊范式里。

這是Karpathy想說的第一個(gè)新地平線,不只是把舊軟件做得更快,而是把許多原本要靠一整個(gè)工程才能完成的事,壓縮成模型的一次輸出。

第二個(gè)地平線,是.md而不是.sh。

過去你裝一個(gè)軟件,用bash腳本,寫得密密麻麻,環(huán)境一變就崩。Karpathy提到OpenClaw的安裝方式:不是腳本,是一段Markdown文字,寫著「把這段復(fù)制粘貼給你的agent」。

Agent查看你的環(huán)境、debug并完成調(diào)試。Markdown不再是給人看的說明書,而是給agent看的指令。

第三個(gè)地平線,是LLM Wiki。

這是Karpathy 2026年4月在GitHub Gist上發(fā)布的一個(gè)新理念。普通RAG(檢索增強(qiáng)生成)是你每問一次,模型就從零開始重新拆解一次文檔,知識(shí)不累積。

LLM Wiki不一樣,它讓模型在一個(gè)Markdown文件夾里持續(xù)維護(hù)知識(shí)庫,你用Obsidian瀏覽:新文檔進(jìn)來,模型自動(dòng)更新已有條目、修訂摘要、補(bǔ)足鏈接、標(biāo)記矛盾。

在那份Gist里,Karpathy用了一個(gè)比喻:Obsidian是IDE(集成開發(fā)環(huán)境),LLM是程序員,wiki是代碼庫。

在LLM Wiki里,知識(shí)被進(jìn)一步組織成一個(gè)像代碼庫一樣可積累、可維護(hù)、可版本控制的工程產(chǎn)物。

三個(gè)例子,指向同一件事:軟件1.0你寫代碼,軟件2.0你訓(xùn)權(quán)重,軟件3.0你寫提示詞(prompt)、控上下文窗口(context window)、調(diào)智能體。

鋸齒狀的背后

可驗(yàn)證性和經(jīng)濟(jì)學(xué)

講了新范式,Karpathy詳細(xì)解釋了那個(gè)讓全場(chǎng)最困惑的問題:為什么模型智能有時(shí)會(huì)表現(xiàn)得這么「鋸齒」?

他認(rèn)為這主要不是一個(gè)技術(shù)問題,而是一個(gè)經(jīng)濟(jì)學(xué)問題。

是收入和市場(chǎng)規(guī)模(revenue/TAM),決定了前沿實(shí)驗(yàn)室在強(qiáng)化學(xué)習(xí)階段把什么打包進(jìn)訓(xùn)練數(shù)據(jù)分布。


Karpathy在解釋鋸齒狀能力時(shí),特別強(qiáng)調(diào)了強(qiáng)化學(xué)習(xí)( RL )環(huán)境的作用。

強(qiáng)化學(xué)習(xí)要獎(jiǎng)勵(lì)信號(hào)(reward),獎(jiǎng)勵(lì)信號(hào)要可驗(yàn)證。一個(gè)領(lǐng)域只要可以被驗(yàn)證(代碼能不能跑、數(shù)學(xué)題答案對(duì)不對(duì)、漏洞能不能復(fù)現(xiàn)),就可以構(gòu)建強(qiáng)化學(xué)習(xí)環(huán)境,模型就在這個(gè)領(lǐng)域飛速進(jìn)化。

但「可驗(yàn)證」還不夠,還要有錢賺。

OpenAI、Anthropic、Google選什么進(jìn)訓(xùn)練分布,背后是收入和市場(chǎng)規(guī)模的考量。

市場(chǎng)大、付費(fèi)意愿強(qiáng)、能形成商業(yè)閉環(huán)的領(lǐng)域,會(huì)被打包進(jìn)RL;反之就沒人投入。

Karpathy給了一個(gè)畫面感很強(qiáng)的比喻:在RL的軌道上,你在飛;離開數(shù)據(jù)分布,你拿著砍刀進(jìn)叢林。

所以今天看到的所謂鋸齒狀,不是缺陷,是結(jié)構(gòu)。是「可驗(yàn)證 + 有錢賺」這兩條線把模型能力雕成的形狀。

這件事對(duì)創(chuàng)業(yè)者特別重要。

Karpathy在爐邊談里直接給了建議:如果你想做AI創(chuàng)業(yè),找一個(gè)可驗(yàn)證、但前沿實(shí)驗(yàn)室還沒顧上的領(lǐng)域,自己去構(gòu)建RL環(huán)境,自己去微調(diào)(fine-tune)模型。這是當(dāng)下最有可能跑出護(hù)城河的方向。

換句話說,下一波AI-native公司,可能會(huì)是驗(yàn)證環(huán)境本身。誰能定義可驗(yàn)證任務(wù)、構(gòu)建獎(jiǎng)勵(lì)循環(huán)(reward loop)、積累邊緣案例(edge cases),誰就握有底牌。

Karpathy在爐邊談話中,將神秘的AI鋸齒狀智能,還原成一個(gè)可以被分析的工程經(jīng)濟(jì)問題。

Vibe Coding的發(fā)明人

又造出新詞

2025年2月,Karpathy在X上發(fā)明了一個(gè)詞:Vibe Coding,以此形容一種高度依賴AI、幾乎不親手寫代碼的開發(fā)方式。

這個(gè)詞后來火到被Collins字典選為2025年度詞匯。Cursor、Lovable、Replit這一批公司估值飆到幾十億美金,背后都是這股風(fēng)。

一年后,在這次對(duì)話中,Karpathy給這個(gè)詞又升了級(jí),叫智能體工程(Agentic Engineering)。

他對(duì)這兩個(gè)詞的看法是:Vibe Coding是「把地板抬高」(raising the floor),讓所有人都能寫軟件。

智能體工程是「把天花板保住」(preserving the ceiling),讓專業(yè)軟件不因?yàn)锳I而掉到不該掉的水準(zhǔn)。


因?yàn)榻裉霢I寫出來的代碼,在Karpathy眼中顯得很臃腫(bloaty),一堆復(fù)制粘貼,抽象很怪很脆弱,能跑,但真的很糟。

他還講了一個(gè)真實(shí)案例。

他的智能體在MenuGen里,居然試圖用Stripe和Google返回的email地址去做用戶匹配,而不是用一個(gè)持久化的用戶ID(user ID)。

這是任何一個(gè)有經(jīng)驗(yàn)的工程師都不會(huì)犯的錯(cuò),但智能體卻犯了。

因此,Karpathy給了智能體一個(gè)非常準(zhǔn)確的定位:智能體就是一群實(shí)習(xí)生(intern entities)。

實(shí)習(xí)生有用,但你不能讓他們獨(dú)自上線生產(chǎn)代碼。你得管需求定義、管系統(tǒng)架構(gòu)、管安全、管審美、管驗(yàn)證。這些事,智能體干不了。

Vibe Coding的爽感區(qū),屬于業(yè)余項(xiàng)目和原型,而智能體工程才是專業(yè)開發(fā)的下一站。前者降低門檻,后者抬高要求,兩件事不能混為一談。

這也是今天行業(yè)最容易踩的坑。

Vibe Coding浪潮下,所有人都在喊AI讓人人都是程序員,但Karpathy卻說:能在智能體時(shí)代活下來的工程師,不是寫得快的,是管得住智能體的。

你能外包思考

但不能外包理解

爐邊談話中,主持人還問了一個(gè)所有人都在焦慮的問題:當(dāng)智能體能寫代碼、能調(diào)度、能自己裝軟件,人類還剩什么?

Karpathy引用了一條讓他打開腦洞的推文:

你可以外包你的思考,但你不能外包你的理解。

他對(duì)此的理解是:我仍然是瓶頸,因?yàn)橹挥形也胖牢覀兊降滓ㄊ裁?、為什么要建?/p>

Karpathy將人類在智能體流程里的角色定位為工程管理/工程導(dǎo)演職能。

第一是需求定義(spec),寫清楚要做什么;

第二是拆解計(jì)劃(plan),拆清楚怎么做;

第三是系統(tǒng)架構(gòu)(architecture),決定系統(tǒng)長什么樣;

第四是品味判斷(taste),判斷哪個(gè)方案是好的;

第五是過程監(jiān)督(oversight),盯著智能體別跑偏;

第六是結(jié)果驗(yàn)證(verification),驗(yàn)證智能體的產(chǎn)出是否真的正確。

這六件事,智能體可以輔助,但不能獨(dú)立承擔(dān)最終責(zé)任。

Karpathy重提了他此前提到的「動(dòng)物與幽靈」(animals versus ghosts)比喻。


2025年10月,Karpathy曾系統(tǒng)闡述過這個(gè)比喻:幽靈之于動(dòng)物,正如飛機(jī)之于鳥類。

他認(rèn)為今天的前沿大模型研究不是在造動(dòng)物,而是在「召喚幽靈」。

動(dòng)物有內(nèi)在動(dòng)機(jī),幽靈沒有,它只是被數(shù)據(jù)和獎(jiǎng)勵(lì)塑形出來的智能模擬,是一個(gè)全新的物種:你不能像對(duì)待人一樣對(duì)待智能體,也不能像對(duì)待傳統(tǒng)軟件一樣對(duì)待智能體。

而人類的位置,是導(dǎo)演。

導(dǎo)演雖然不親自演戲,但導(dǎo)演要懂戲。你不親手寫每一行代碼,但你要知道這個(gè)產(chǎn)品該長什么樣、為什么這樣比那樣好、上線之后會(huì)出什么事。

Sequoia在2026年給出的判斷是:AI應(yīng)用的滲透速度還在加快,「0到1億美金」的俱樂部,正在升級(jí)成「0到10億美金」。

最好的AI創(chuàng)業(yè)公司,每個(gè)員工的年產(chǎn)出已經(jīng)過百萬美金。這背后是智能體在干活,但能讓智能體真正干出百萬產(chǎn)出的,是那些懂得當(dāng)導(dǎo)演的創(chuàng)始人。

Karpathy在爐邊談話尾聲,描述了他的更遠(yuǎn)愿景:未來某一天,神經(jīng)網(wǎng)絡(luò)會(huì)變成主進(jìn)程,CPU反過來淪為協(xié)處理器。

但就算這條路真的走通,導(dǎo)演的位置也不會(huì)消失。因?yàn)橛撵`永遠(yuǎn)不會(huì)替你想清楚,你到底要什么。那些不能外包的部分,就是你的位置。

參考資料:

https://x.com/karpathy/status/2049903821095354523

https://www.youtube.com/watch?v=96jN2OCOfLs

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
不滿歐洲盟友 特朗普暗示考慮在西班牙和意大利削減駐軍

不滿歐洲盟友 特朗普暗示考慮在西班牙和意大利削減駐軍

財(cái)聯(lián)社
2026-05-01 04:08:16
香奈兒發(fā)布無底綁帶鞋,網(wǎng)友:太抽象了!

香奈兒發(fā)布無底綁帶鞋,網(wǎng)友:太抽象了!

都市快報(bào)橙柿互動(dòng)
2026-04-29 15:43:37
去城里的姑父家拜年,姑姑讓我滾,后來她從新聞上看到我任命縣長

去城里的姑父家拜年,姑姑讓我滾,后來她從新聞上看到我任命縣長

千秋文化
2026-04-30 18:46:59
高瓴資本張磊:判斷一個(gè)人是否靠譜,關(guān)鍵看4個(gè)維度

高瓴資本張磊:判斷一個(gè)人是否靠譜,關(guān)鍵看4個(gè)維度

新浪財(cái)經(jīng)
2026-04-20 01:51:52
許家印錢多沒地方花!干了兩件大事:270億買萬科股票 空手套白狼

許家印錢多沒地方花!干了兩件大事:270億買萬科股票 空手套白狼

涼羽亭
2026-05-01 18:41:49
20多年經(jīng)蟲蛀、火燒仍長出新葉,河南泌水湖公園“樹堅(jiān)強(qiáng)”已成網(wǎng)紅打卡點(diǎn),園林部門:已設(shè)置圍欄和支架保護(hù)

20多年經(jīng)蟲蛀、火燒仍長出新葉,河南泌水湖公園“樹堅(jiān)強(qiáng)”已成網(wǎng)紅打卡點(diǎn),園林部門:已設(shè)置圍欄和支架保護(hù)

極目新聞
2026-05-01 16:24:30
平型關(guān)戰(zhàn)役繳獲日軍地圖,朱老總據(jù)此推斷:差點(diǎn)抓住敵指揮的將軍

平型關(guān)戰(zhàn)役繳獲日軍地圖,朱老總據(jù)此推斷:差點(diǎn)抓住敵指揮的將軍

歷史龍?jiān)w
2026-05-01 06:45:15
海南艦五年返廠升級(jí),或搭載殲-35避開美軍覆轍

海南艦五年返廠升級(jí),或搭載殲-35避開美軍覆轍

雨諾翛翛
2026-05-01 23:53:26
“不好看,有點(diǎn)嚇人!”藝考生曬堪比小燕子的大眼睛,引人不適

“不好看,有點(diǎn)嚇人!”藝考生曬堪比小燕子的大眼睛,引人不適

蝴蝶花雨話教育
2026-02-08 12:47:42
你以為麻豆傳媒是賣片的,其實(shí)它是賣人的

你以為麻豆傳媒是賣片的,其實(shí)它是賣人的

創(chuàng)始人筆記
2026-04-23 21:44:50
張雪峰的峰學(xué)未來早就是個(gè)空殼,內(nèi)部管理危機(jī)四伏,股份爭(zhēng)奪開始

張雪峰的峰學(xué)未來早就是個(gè)空殼,內(nèi)部管理危機(jī)四伏,股份爭(zhēng)奪開始

魔都姐姐雜談
2026-05-01 20:01:53
2026上海高中大擴(kuò)容!296→312,志愿要變

2026上海高中大擴(kuò)容!296→312,志愿要變

戶外阿毽
2026-05-01 19:56:55
斯諾克世錦賽:4-4到8-8!希金斯領(lǐng)先2局被墨菲追平,必打滿4階段

斯諾克世錦賽:4-4到8-8!希金斯領(lǐng)先2局被墨菲追平,必打滿4階段

劉姚堯的文字城堡
2026-05-01 21:45:29
杜鋒發(fā)言引球迷不滿,遼寧主帥有信心拿下生死戰(zhàn),趙繼偉帶病出戰(zhàn)

杜鋒發(fā)言引球迷不滿,遼寧主帥有信心拿下生死戰(zhàn),趙繼偉帶病出戰(zhàn)

中國籃壇快訊
2026-05-02 00:03:53
比亞迪亮出可變磁通電機(jī)!智能磁場(chǎng)革命,這5款車已確定搭載

比亞迪亮出可變磁通電機(jī)!智能磁場(chǎng)革命,這5款車已確定搭載

趣味萌寵的日常
2026-05-02 00:11:55
新華社消息|中國代表:要防止朝鮮半島生戰(zhàn)生亂

新華社消息|中國代表:要防止朝鮮半島生戰(zhàn)生亂

新華社
2026-05-01 10:35:49
清華團(tuán)隊(duì)預(yù)言:90%的人將脫離謀生勞動(dòng),「零人公司」時(shí)代來了!

清華團(tuán)隊(duì)預(yù)言:90%的人將脫離謀生勞動(dòng),「零人公司」時(shí)代來了!

新智元
2026-04-30 15:07:56
人活著,說到底就三樣?xùn)|西:生理需求居首,真正懂的人沒幾個(gè)

人活著,說到底就三樣?xùn)|西:生理需求居首,真正懂的人沒幾個(gè)

朗威談星座
2026-05-01 14:28:21
驢友野線徒步不慎從200米高懸崖墜落,掉落六七米后所幸被樹杈卡住,全身多處骨折,在附近演練的8支藍(lán)天救援隊(duì)4小時(shí)生死營救

驢友野線徒步不慎從200米高懸崖墜落,掉落六七米后所幸被樹杈卡住,全身多處骨折,在附近演練的8支藍(lán)天救援隊(duì)4小時(shí)生死營救

極目新聞
2026-05-01 13:50:20
中國肺癌發(fā)病率世界第一!提醒:罪魁禍?zhǔn)滓丫境觯?種食物要少吃

中國肺癌發(fā)病率世界第一!提醒:罪魁禍?zhǔn)滓丫境觯?種食物要少吃

健康之光
2026-03-23 20:10:05
2026-05-02 02:19:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
15111文章數(shù) 66826關(guān)注度
往期回顧 全部

科技要聞

DeepSeek發(fā)布多模態(tài)論文又連夜刪除

頭條要聞

美軍對(duì)伊朗最新打擊方案披露 包含出動(dòng)地面部隊(duì)

頭條要聞

美軍對(duì)伊朗最新打擊方案披露 包含出動(dòng)地面部隊(duì)

體育要聞

無奈!約基奇:這要在塞爾維亞 全隊(duì)早被炒了

娛樂要聞

馬筱梅產(chǎn)后身材恢復(fù)超好 現(xiàn)身戶外直播

財(cái)經(jīng)要聞

GPU神話松動(dòng),AI真正的戰(zhàn)場(chǎng)變了

汽車要聞

限時(shí)9.67萬起 吉利星越L/星瑞i-HEV智擎混動(dòng)上市

態(tài)度原創(chuàng)

親子
教育
房產(chǎn)
時(shí)尚
家居

親子要聞

教孩子預(yù)防侵犯,分辨危險(xiǎn)身體觸碰并且拒絕!

教育要聞

高考作文遇見反躺平:提倡奮斗,反對(duì)躺平

房產(chǎn)要聞

所有戶型全賣爆!海口TOP級(jí)豪宅,景觀樣板間五一全線開放!

這個(gè)夏天,彩色褲子又火了!

家居要聞

靈動(dòng)實(shí)用 生活藝術(shù)場(chǎng)

無障礙瀏覽 進(jìn)入關(guān)懷版