国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

陶哲軒親測Claude跑崩電腦,全靠這份保姆級指令清單翻盤

0
分享至


新智元報(bào)道

編輯:元宇

【新智元導(dǎo)讀】從電腦崩潰到半小時拿下Lean形式化證明,數(shù)學(xué)大神陶哲軒用親身踩坑經(jīng)歷警告:AI越強(qiáng)大,人類越不能偷懶,應(yīng)時刻保持「人類在環(huán)」的絕對清醒。

連跑45分鐘,燒光Token,最后電腦直接死機(jī)。

你可能很難想象,這竟是全球頂尖數(shù)學(xué)家陶哲軒在實(shí)測最新AI編程工具時,遭遇的一次真實(shí)翻車現(xiàn)場。

九個月前,他曾在一個視頻中向大家展示如何將一段復(fù)雜的數(shù)學(xué)證明形式化。

九個月后,面對被業(yè)界瘋狂追捧的新一代AI助手Claude Code,他本以為這會是一場降維打擊。

沒想到,第一次完全放權(quán)給AI,不僅沒有完成數(shù)學(xué)證明,還把自己的電腦搞崩潰了。

在接到一句宏大的指令后,AI陷入了瘋狂的回溯與試錯,狂跑了45分鐘,不僅沒寫出一行可用代碼,龐大的計(jì)算過載還把電腦弄死機(jī)了。

眼下整個科技圈都在狂熱地討論AI智能體。

仿佛只要隨手拋出一句話,AI就能替你打理好全部工作。陶哲軒這場硬核實(shí)測,卻像一劑清醒劑,終結(jié)了這種技術(shù)幻覺:

即使面對再強(qiáng)大的AI,人類也不能完全「關(guān)掉大腦」。

保持參與,才是最好的使用AI的方式。

「一波流」幻想破滅

AI智能體的「過載陷阱」

故事要從九個月前說起。

在當(dāng)時的Equations of Theories項(xiàng)目里,為了證明等式1689能夠推導(dǎo)出等式2(即singleton law),陶哲軒使用GitHub Copilot和一個名叫conical的輔助工具,靠著人類的智慧和輕度的AI輔助,一步步手動完成了證明的形式化。

如今,全面升級的智能體來了。

由于對AI的過度信任,陶哲軒在第一次嘗試Claude時進(jìn)入了一個極其普遍的誤區(qū),他給Claude下達(dá)了一個大而籠統(tǒng)的指令:「請把整個事情都做完?!?/p>

他原本以為,AI會自動拆解任務(wù)、理清邏輯、輸出完美代碼。

然而這句不加限制的指令,直接觸發(fā)了機(jī)器的「過載陷阱」。面對復(fù)雜的邏輯鏈條,Claude在底層引理的證明泥潭里迷失了方向。

它花了大把時間去猜測該怎么做,接著犯錯,然后瘋狂回溯、推倒重做。





就這樣,在燒掉大量Token之后,AI狂跑了整整45分鐘仍然一無所獲。而且,龐大的計(jì)算壓力,也讓陶哲軒的電腦崩潰了。




事實(shí)證明,當(dāng)人類下達(dá)給AI的任務(wù)指令缺乏清晰邊界時,AI的勤奮只會像無頭蒼蠅式的亂撞,最終演變成一場徒勞無益的消耗。

這次慘痛的教訓(xùn),也戳破了當(dāng)下人們對AI的一個幻覺:認(rèn)為有了智能體,自己就可以當(dāng)「甩手掌柜」了。

「保姆級」指令的勝利

真正的轉(zhuǎn)折,發(fā)生在第二次和第三次嘗試?yán)铩?/p>

第二次,其實(shí)已經(jīng)成功了。

陶哲軒把任務(wù)拆開,不再要求Claude Code一次完成全部證明,而是先形式化引理1、引理2、引理3,再逐步把證明補(bǔ)進(jìn)去。

最后大約用了25分鐘,完整證明做出來了。

在第三次,他還摸索出了一套防AI「暴走」的干貨步驟,核心秘訣,就是專門建一個Markdown文件,把所有指令按步驟寫清楚,再交給Claude Code執(zhí)行。

只是這次他并沒這么做,而是把這些步驟直接寫進(jìn)Lean文件的注釋里。




這套流程的精髓,不在于復(fù)雜,而在于克制。

第零步,先形式化S和F這兩個記號。先把符號系統(tǒng)立住,別急著證明。

第一步,創(chuàng)建證明骨架。把引理1、引理2、引理3的陳述都形式化出來,但這個階段嚴(yán)禁AI嘗試證明,一律用「sorry」占位。

這一步看似保守,實(shí)際上非常高明。因?yàn)樗呀?jīng)從第一次失敗里看明白了:

一旦讓Claude Code過早進(jìn)入「我要把它證出來」的狀態(tài),它就會在證明細(xì)節(jié)里瘋狂打轉(zhuǎn),反復(fù)試、反復(fù)錯、反復(fù)回退,最后什么都做不完。

與其讓它一上來就沖刺,不如先讓它把結(jié)構(gòu)搭好。

然后才是第二步:把非形式化證明里的每一行,逐行轉(zhuǎn)成Lean代碼。

理由先不補(bǔ),能用「sorry」的地方先用「sorry」。

這個動作特別像搭腳手架。先把房子的梁柱立起來,再慢慢砌墻,而不是抱著一堆磚頭就想直接蓋完。

也是在這里,陶哲軒點(diǎn)出了Claude Code一個很有意思的弱點(diǎn):它在最底層、最機(jī)械的步驟上,反而容易「想太多」。

本來人類可能覺得「這一步一兩行就該結(jié)束了」,它卻會繞出更長的路徑。

在陶哲軒的第一次嘗試時,AI甚至不愿意沿用S和F這些簡寫,而是把式子不斷展開,導(dǎo)致證明越來越難讀。

這正是很多人今天會誤判AI的地方。

你以為它最擅長的是細(xì)活,它偏偏會在最該老實(shí)執(zhí)行的時候,突然開始「發(fā)揮創(chuàng)造力」。

而在形式化證明這類任務(wù)中,過度發(fā)揮,往往不是加分項(xiàng),反而可能是事故源頭。

在這套「保姆級」指令的約束下,Claude終于不再像脫韁的野馬。它老老實(shí)實(shí)地跟著人類給定的證明,幾秒鐘就吐出了規(guī)整的代碼框架。

「人機(jī)并行協(xié)作」

你做你的填空,我修我的Bug

真正讓這次實(shí)踐變得好看的,是中間那段非常絲滑的人機(jī)配合感。

做到一半,電腦又崩了一次。

但這一次,崩潰沒有毀掉進(jìn)度。

原因很簡單:因?yàn)槿蝿?wù)已經(jīng)被拆成了一段一段的小步驟,所以恢復(fù)起來并不痛苦。

分步推進(jìn),不只是為了防止AI暴走,也是為了人類后期修改方便。

更精彩的戲碼是在修Bug階段。

在填補(bǔ)細(xì)節(jié)時,Claude卡在了某個底層步驟上。陶哲軒發(fā)現(xiàn),AI把記號SA展開了兩次,而實(shí)際上只需展開一次。

面對這個邏輯死結(jié),AI試圖換一種極其復(fù)雜的思路去繞過它,甚至給出了一段冗長代碼。


這個時候,人類的作用顯現(xiàn)了。

陶哲軒果斷出手,他調(diào)出Info View面板,親自接管了這行邏輯。

面對多余的展開項(xiàng),他直接使用congruence(消掉同類項(xiàng)),瞬間清空了報(bào)錯信息。連他自己都忍不住感慨:「這也太強(qiáng)了,居然直接就成了?!?/p>

隨后,他又意識到,這里其實(shí)可以把H1抽出來,單獨(dú)作為一個關(guān)鍵方程引理,因?yàn)楹竺鎯蓚€地方都能復(fù)用它。

此時,全場高潮的「人機(jī)結(jié)對編程」畫面出現(xiàn)了。

當(dāng)陶哲軒在前方手動修復(fù)復(fù)雜邏輯、提取引理時,Claude Code根本沒有閑著。

它在后臺默默同步,聰明地把過去代碼里的H1替換成了一行簡練的證明,并自動給后續(xù)的引理三搭好了骨架。

這才是這次實(shí)驗(yàn)最舒服的一幕:不是你命令,我執(zhí)行;也不是你放手,我亂跑;而是兩者在同一個代碼庫里獨(dú)立運(yùn)轉(zhuǎn),互不干擾卻又完美配合。

像一場真正的結(jié)對編程,只不過你的搭檔,不是另一個人類,而是一個需要被約束、但又確實(shí)能干活的智能體。

拒絕「多智能體焦慮」

要把手放在方向盤上

最后,這份證明完成了。

總耗時大約半小時,里面還算上了一次系統(tǒng)崩潰。對比第一次45分鐘空轉(zhuǎn)到電腦死機(jī),這個結(jié)果已經(jīng)足夠說明問題。

但在復(fù)盤階段,這位數(shù)學(xué)大神給出的,不是某種神話式結(jié)論,而是一種很清醒的技術(shù)態(tài)度。

他顯然看到了自動化的誘惑。

Claude Code足夠強(qiáng),大多數(shù)人很容易生出一種沖動:干脆讓它全包,我少操點(diǎn)心。

可問題在于,一旦你真這么做,它很可能直接扔掉你原本已經(jīng)很好的非形式化思路,按它自己的方式重寫一遍。

結(jié)果,就是代碼變得晦澀難懂,一旦跑不通,你連調(diào)試都無從下手。

他還順手吐槽了當(dāng)下很流行的一種趨勢:

讓多個智能體同時跑,再用另一個智能體去管理前面那幾個智能體。

理論上當(dāng)然可以。

可至少在這次任務(wù)里,他已經(jīng)對單個、聽話、受控的Agent非常滿意了。再往上疊,不一定是效率提升,也可能只是另一種形式的復(fù)雜化焦慮。



此外,在這場技術(shù)洪流中,人類必須保持參與感。

最頂級的AI工作流,不是關(guān)掉大腦,而是始終把手放在方向盤上。

因?yàn)橐坏┩耆蕾嚬ぞ撸隽藛栴},你能做的往往只剩下一遍遍重新調(diào)用,像是在對一個黑箱許愿。

而當(dāng)你把「人類在環(huán)」這件事堅(jiān)持到底,局面就完全不同了。

這時候,AI不是替你思考的大腦,而是你手里那把越來越鋒利的劍。真正決定它往哪兒揮的人,仍然還得是你。

參考資料:

https://mathstodon.xyz/@tao/116190707979654536%20

https://github.com/teorth/analysis/blob/main/analysis/Analysis/Misc/equational.lean%20

https://www.youtube.com/watch?v=JHEO7cplfk8

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
強(qiáng)硬如穆里尼奧,卻被老板數(shù)次強(qiáng)塞巨星,間接影響足壇格局

強(qiáng)硬如穆里尼奧,卻被老板數(shù)次強(qiáng)塞巨星,間接影響足壇格局

足籃大世界
2026-03-11 07:30:35
大陸助74名臺胞撤離中東,經(jīng)滬返臺,臺陸委會急了,但立馬被打臉

大陸助74名臺胞撤離中東,經(jīng)滬返臺,臺陸委會急了,但立馬被打臉

DS北風(fēng)
2026-03-10 18:18:04
警惕“雌激素炸彈”!女子每天2杯奶茶吃出10cm肌瘤

警惕“雌激素炸彈”!女子每天2杯奶茶吃出10cm肌瘤

福建第一幫幫團(tuán)
2026-03-08 19:05:40
相親遇到奇葩是啥體驗(yàn)?網(wǎng)友:看完渾身不舒服,你能給我賠點(diǎn)錢嗎

相親遇到奇葩是啥體驗(yàn)?網(wǎng)友:看完渾身不舒服,你能給我賠點(diǎn)錢嗎

帶你感受人間冷暖
2026-03-07 02:04:39
楊冪視后夢碎了?《生萬物》除女主之外全拿獎,連秦海璐缺席都有

楊冪視后夢碎了?《生萬物》除女主之外全拿獎,連秦海璐缺席都有

攬星河的筆記
2026-03-10 19:05:08
他意外成上港燙手山芋!租不出去又無法出戰(zhàn)中超,曾是球隊(duì)主力

他意外成上港燙手山芋!租不出去又無法出戰(zhàn)中超,曾是球隊(duì)主力

張麗說足球
2026-03-11 11:05:14
敞開天窗說亮話!對于特朗普月底訪華,中方終于回應(yīng)了!

敞開天窗說亮話!對于特朗普月底訪華,中方終于回應(yīng)了!

現(xiàn)代小青青慕慕
2026-03-10 09:39:02
出乎所有人預(yù)料,伊朗開出的停火條件,壓垮美以聯(lián)軍的最后稻草

出乎所有人預(yù)料,伊朗開出的?;饤l件,壓垮美以聯(lián)軍的最后稻草

策略述
2026-03-11 12:45:23
有人說:什么時候公務(wù)員不再是擠破頭的職業(yè),那社會就百業(yè)興旺了

有人說:什么時候公務(wù)員不再是擠破頭的職業(yè),那社會就百業(yè)興旺了

細(xì)說職場
2026-01-16 11:57:05
焊死在歷史上!歐冠10大最難破的神跡:C羅梅西壟斷

焊死在歷史上!歐冠10大最難破的神跡:C羅梅西壟斷

格斗社
2026-03-11 08:00:03
傳奇人物潘漢年的最后歲月:郊區(qū)茶場里,過著“知足”的生活

傳奇人物潘漢年的最后歲月:郊區(qū)茶場里,過著“知足”的生活

抽象派大師
2026-03-10 16:30:47
吃完他汀后,如果沒有出現(xiàn)這3種情況,醫(yī)生都要恭喜你!

吃完他汀后,如果沒有出現(xiàn)這3種情況,醫(yī)生都要恭喜你!

寶哥精彩賽事
2026-03-11 11:10:18
萬億煙草市場正在漏水?你常買的煙可能已經(jīng)不值錢了!

萬億煙草市場正在漏水?你常買的煙可能已經(jīng)不值錢了!

老特有話說
2026-03-07 16:09:02
一個中年女人的坦白:讓她上癮的男人,從來只有一種

一個中年女人的坦白:讓她上癮的男人,從來只有一種

藝鑒在線
2026-03-11 12:39:03
村里最后餓死的那個人,只有九歲

村里最后餓死的那個人,只有九歲

霹靂炮
2026-02-22 20:24:41
在醫(yī)院做檢查的尷尬瞬間!網(wǎng)友:在護(hù)士眼里那就是塊肉

在醫(yī)院做檢查的尷尬瞬間!網(wǎng)友:在護(hù)士眼里那就是塊肉

帶你感受人間冷暖
2026-03-09 00:05:09
沖3億,周星馳甘拜下風(fēng),古天樂也攔不住,2026年最強(qiáng)港片誕生了

沖3億,周星馳甘拜下風(fēng),古天樂也攔不住,2026年最強(qiáng)港片誕生了

電影票房預(yù)告片
2026-03-10 23:53:38
潑湯女子全網(wǎng)社死!處罰結(jié)果曝光,疑在幼兒園上班,家人也遭連累

潑湯女子全網(wǎng)社死!處罰結(jié)果曝光,疑在幼兒園上班,家人也遭連累

奇思妙想草葉君
2026-03-09 23:58:44
成都地鐵兩條新線迎新進(jìn)展!1號線的“擠地鐵噩夢”終于要結(jié)束了

成都地鐵兩條新線迎新進(jìn)展!1號線的“擠地鐵噩夢”終于要結(jié)束了

王二哥老搞笑
2026-03-11 08:08:40
張?zhí)m北京看雪,一句話讓全網(wǎng)破防:這才是大女主該有的樣子!

張?zhí)m北京看雪,一句話讓全網(wǎng)破防:這才是大女主該有的樣子!

念得小柔
2026-03-11 12:43:56
2026-03-11 13:28:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14691文章數(shù) 66682關(guān)注度
往期回顧 全部

科技要聞

騰訊急了急了,微信絕密AI智能體首度曝光

頭條要聞

阿德巴約單場83分"刷"新紀(jì)錄引質(zhì)疑 本人發(fā)聲致敬科比

頭條要聞

阿德巴約單場83分"刷"新紀(jì)錄引質(zhì)疑 本人發(fā)聲致敬科比

體育要聞

執(zhí)教過李鐵的英國老頭,77歲又出山了

娛樂要聞

楊冪連續(xù)五年為劉詩詩慶生,劉詩詩回應(yīng)

財(cái)經(jīng)要聞

油價(jià)大轉(zhuǎn)頭?一天,從末日到曙光!

汽車要聞

豐田向左,本田向右

態(tài)度原創(chuàng)

時尚
教育
親子
旅游
手機(jī)

看來看去還是這些穿搭最高級,不老套、不死板,舒適又顯氣質(zhì)

教育要聞

【兩會觀察?教育攻堅(jiān)進(jìn)行時】面對人工智能帶來的技術(shù)變革的浪潮,教育如何找到創(chuàng)新與堅(jiān)守的平衡點(diǎn),已成為...

親子要聞

哈密瓜自帶李斯特菌,孕婦絕對不能吃?

旅游要聞

貴安櫻花園最新航拍視頻

手機(jī)要聞

華為Vision智慧屏6 SE發(fā)布:Super Mini LED,3899元起

無障礙瀏覽 進(jìn)入關(guān)懷版