国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

高德納:「震驚!震驚!」Claude破解《計(jì)算機(jī)程序設(shè)計(jì)藝術(shù)》難題

0
分享至

編輯|Panda

「震驚!震驚!」

是什么讓著名計(jì)算機(jī)科學(xué)家和數(shù)學(xué)家、《計(jì)算機(jī)程序設(shè)計(jì)藝術(shù)》作者、圖靈獎得主高德納(Donald Knuth)發(fā)出了如此驚呼?



圖片由 AI 生成

你沒有猜錯(cuò),正是AI

在他近期在斯坦福大學(xué)官網(wǎng)上公布的一篇論文《Claude’s Cycles》中,開篇的「Shock! Shock!」非常直白地表達(dá)了他對于 AI 強(qiáng)大能力的震驚。



論文地址:https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf

緊接著他便寫到:「我昨天得知,我已經(jīng)研究了幾周的一個(gè)開放性問題剛剛被 Claude Opus 4.6——Anthropic 公司三周前發(fā)布的混合推理模型 —— 解決了!看來我得在某個(gè)時(shí)候重新審視我對『生成式 AI』的看法了。不僅我的猜想有了一個(gè)不錯(cuò)的解決方案,而且這標(biāo)志著自動推理和創(chuàng)造性問題解決領(lǐng)域的巨大進(jìn)步,這真是一件令人高興的事。我會在這篇短文中簡要講述這個(gè)過程?!?/p>

此事引發(fā)了廣泛關(guān)注,網(wǎng)友們紛紛點(diǎn)評,感嘆新時(shí)代的到來。





這是 Hacker News 用戶 Ian Danforth 給出的太長不讀版本:高德納提出一個(gè)問題,他的朋友借助 Claude 進(jìn)行了 30 多次探索,在人類的仔細(xì)指導(dǎo)下,Claude 最終編寫了一個(gè) Python 程序,能夠?yàn)樗衅鏀?shù)找到解。高德納隨后為該方法撰寫了證明,并對 Claude 的貢獻(xiàn)感到非常滿意。偶數(shù)情況仍是未解之謎(Claude 在這方面未能取得太大進(jìn)展)。



困擾算法泰斗的圖論難題

高德納在為《計(jì)算機(jī)程序設(shè)計(jì)藝術(shù)》未來卷撰寫關(guān)于有向哈密頓環(huán)的內(nèi)容時(shí),遇到了一個(gè)棘手的開放性問題。

具體而言,需要考慮一個(gè)具有 m3 個(gè)頂點(diǎn)的有向圖,頂點(diǎn)坐標(biāo)記為 ijk,其中 0≦ i, j, k

2 的情況。

高德納此前已經(jīng)解決了 m=3 的基礎(chǔ)情況,并將其作為書中的一道練習(xí)題。他的朋友 Filip Stappers 隨后通過實(shí)驗(yàn)發(fā)現(xiàn)了 4≦ m≦16 的解,這使得所需分解法存在的可能性極高。為了尋找通解,Stappers 將這個(gè)問題原封不動地交給了 Claude 處理。

31 步探索:AI 的解題邏輯

在交互過程中,Stappers 對 Claude 設(shè)定了嚴(yán)格的規(guī)則指令:

  • 在運(yùn)行完任何探測代碼后,必須立即更新 plan.md 文件。
  • 在記錄完成之前,絕對不允許開始下一步的探索。

Claude 采取了多種數(shù)學(xué)工具進(jìn)行嘗試。它最初嘗試了簡單的線性與二次函數(shù),但均未奏效。接著,它嘗試使用暴力深度優(yōu)先搜索,最終因?yàn)樗阉骺臻g過大而放棄。隨后,它引入了「2D 蛇形分析」,并準(zhǔn)確識別出該有向圖是一個(gè)帶有兩個(gè)生成元的凱萊圖(Cayley digraph)。

問題的突破發(fā)生在后半程的探索中:

  • 在第 15 次探索時(shí),Claude 引入了「纖維分解」框架,將問題轉(zhuǎn)化為在坐標(biāo)上選擇算子的排列組合。
  • 在第 25 次探索后,它自主得出結(jié)論,認(rèn)為模擬退火算法雖然能找到解,卻無法給出通用構(gòu)造,此時(shí)需要純粹的數(shù)學(xué)推導(dǎo)。
  • 最終在第 31 次探索時(shí),Claude 注意到每個(gè)纖維的選擇僅依賴于單個(gè)坐標(biāo),并據(jù)此給出了一個(gè)具體的 Python 構(gòu)造程序,成功得出了 m=3, 5, 7, 9, 11 的完美分解方案。



簡化版的 Python 程序,用 C 語言形式寫的

嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)證明與偶數(shù)域的挑戰(zhàn)

得出構(gòu)造代碼僅僅是第一步。Stappers 驗(yàn)證了 3 到 101 之間所有奇數(shù) m 的情況,均獲得了完美的分解方案。隨后,高德納接手進(jìn)行了嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)證明。他詳細(xì)推導(dǎo)了生成的第一個(gè)環(huán)包含所有具備相同特征的 m2 個(gè)頂點(diǎn),從而證實(shí)其長度確為 m3,是一個(gè)真正的哈密頓環(huán)。

高德納進(jìn)一步研究發(fā)現(xiàn),在所有類似 Claude 生成邏輯的分解法中,恰好有 760 種對所有奇數(shù) m>1 均有效的解。Claude 憑借自身推導(dǎo)準(zhǔn)確找到了其中的一種。

目前,偶數(shù) m 的情況依然懸而未決。

  • Claude 在探索中曾找到 m=4, 6, 8 的解,但未能發(fā)現(xiàn)其中的通用規(guī)律。
  • 當(dāng)被要求繼續(xù)攻克偶數(shù)情況時(shí),Claude 陷入了困境,后續(xù)甚至無法正確編寫探索程序。
  • 另一位研究者 Ho Boon Suan 借助 gpt-5.3-codex 生成了處理大于 8 的偶數(shù) m 的代碼,并在高達(dá) m=2000 的規(guī)模下測試成功。
  • 但由于其模式過于復(fù)雜,目前人工證明其正確性的難度極大。

在 Hacker News 和 Reddit 等技術(shù)社區(qū)中,開發(fā)者們普遍認(rèn)為這次事件的核心意義在于,AI 在數(shù)學(xué)輔助證明中展現(xiàn)出了自主更換探索工具、排查無效路徑的能力。

正如高德納在文末所感嘆的那樣,克勞德?香農(nóng)(Claude Shannon)在天之靈若能知曉他的名字與此類進(jìn)步聯(lián)系在一起,定會感到驕傲。

Hats off to Claude!

AI 進(jìn)軍數(shù)學(xué)殿堂:從競賽奪金到前沿探索

高德納的驚嘆并非孤例。事實(shí)上,在過去的一年多時(shí)間里, AI 在解決復(fù)雜數(shù)學(xué)和邏輯問題上已經(jīng)取得了多個(gè)具有實(shí)質(zhì)性意義的突破。

  • 國際奧數(shù)突破:2025 年 7 月,Google DeepMind 發(fā)布的 Gemini(Deep Think 模式)在 IMO 試題評測中達(dá)到金牌標(biāo)準(zhǔn)成績,取得 35 分,并能在接近正式考試條件下輸出完整自然語言證明。與此同時(shí),OpenAI 也披露其內(nèi)部模型達(dá)到了類似水平,但官方認(rèn)證與評測細(xì)節(jié)相對有限。
  • 編程競賽能力躍升:2025 年 9 月,OpenAI 和 Gemini 都聲稱達(dá)到了 ICPC 金牌水平,能夠在嚴(yán)格時(shí)間限制內(nèi)解決高難度算法問題。不過,這些成績主要來自平行測試或基準(zhǔn)評估,并非以正式參賽身份在 International Collegiate Programming Contest 中獲得官方金牌。
  • 從解題到科研協(xié)作:如今,AI 在科研中的角色顯著增強(qiáng)。模型開始借助外部工具參與數(shù)學(xué)研究與問題驗(yàn)證,在復(fù)雜猜想與定理探索中發(fā)揮輔助作用。例如, GPT-5.2 借助外部工具,協(xié)助數(shù)學(xué)家解決了數(shù)個(gè)懸而未決的 Erd?s 猜想,并得到了著名數(shù)學(xué)家陶哲軒的驗(yàn)證。部分系統(tǒng)已展示出生成研究草稿與進(jìn)行結(jié)構(gòu)化推理的能力。

驅(qū)動這些突破的核心機(jī)制也發(fā)生了改變。 AI 開始減少對單次快速生成的依賴?,F(xiàn)在的模型普遍采用「測試時(shí)計(jì)算擴(kuò)展」或「慢思考」策略。通過在推理階段投入更多算力,模型能夠并行探索多條解題路徑并進(jìn)行嚴(yán)格的自我驗(yàn)證。

展望未來, AI 與數(shù)學(xué)的結(jié)合將突破封閉環(huán)境下的標(biāo)準(zhǔn)化考題。隨著自然語言理解力與形式化邏輯的深度融合,AI 將成為數(shù)學(xué)家與工程師身邊得力的合作者,幫助人類共同攻克那些停滯多年的科學(xué)難題。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
重要信息只說了60%?比亞迪閃充的殺傷力,這次比華為大

重要信息只說了60%?比亞迪閃充的殺傷力,這次比華為大

路咖汽車
2026-03-06 10:15:12
地面戰(zhàn)爭開始,伊朗擊落F-15E

地面戰(zhàn)爭開始,伊朗擊落F-15E

西樓飲月
2026-03-05 20:46:17
人大代表庹慶明建議將70歲以上老人全口義齒修復(fù)納入醫(yī)保 讓更多老人嘗到飯香

人大代表庹慶明建議將70歲以上老人全口義齒修復(fù)納入醫(yī)保 讓更多老人嘗到飯香

閃電新聞
2026-03-05 18:04:46
文班談蓋帽:我就喜歡看他們努力半天,最后被我毀掉一天的樣子

文班談蓋帽:我就喜歡看他們努力半天,最后被我毀掉一天的樣子

仰臥撐FTUer
2026-03-06 14:19:03
原來早已不是中國籍,被老外“玩膩”后回國,鄭緒嵐現(xiàn)狀令人唏噓

原來早已不是中國籍,被老外“玩膩”后回國,鄭緒嵐現(xiàn)狀令人唏噓

暖心萌阿菇?jīng)?/span>
2026-03-02 23:02:48
物理學(xué)停滯100年,三座大山難以逾越!或許永遠(yuǎn)都無法進(jìn)步?

物理學(xué)停滯100年,三座大山難以逾越!或許永遠(yuǎn)都無法進(jìn)步?

心中的麥田
2026-03-03 20:19:10
美軍總結(jié):我們最大的錯(cuò)誤,以為志愿軍只是人民軍二流部隊(duì)水平

美軍總結(jié):我們最大的錯(cuò)誤,以為志愿軍只是人民軍二流部隊(duì)水平

雍親王府
2026-03-06 08:55:06
上海一女子因投訴遭拜博口腔醫(yī)院拒診 還被備注“有精神病史”

上海一女子因投訴遭拜博口腔醫(yī)院拒診 還被備注“有精神病史”

信網(wǎng)
2026-03-06 11:39:27
美國人也很納悶:伊朗導(dǎo)彈怎么還沒炸光?美媒給答案:朝鮮出手了

美國人也很納悶:伊朗導(dǎo)彈怎么還沒炸光?美媒給答案:朝鮮出手了

往事我敬你一杯酒人
2026-03-05 23:22:43
Cell重磅:北師大等單位發(fā)現(xiàn)蟲草素可延緩衰老并延長壽命

Cell重磅:北師大等單位發(fā)現(xiàn)蟲草素可延緩衰老并延長壽命

iNature前沿
2026-03-05 10:05:22
喬迪:之前我們已證明,中國球員完全有能力達(dá)到我的傳控要求

喬迪:之前我們已證明,中國球員完全有能力達(dá)到我的傳控要求

懂球帝
2026-03-06 12:48:26
96小時(shí)內(nèi),哈梅殯葬準(zhǔn)時(shí)舉行,普京去不了現(xiàn)場,中國做出重大承諾

96小時(shí)內(nèi),哈梅殯葬準(zhǔn)時(shí)舉行,普京去不了現(xiàn)場,中國做出重大承諾

小嵩
2026-03-06 02:07:55
初戀開大酒店,我調(diào)任市委書記后去她的大酒店吃飯,被她百般嘲笑

初戀開大酒店,我調(diào)任市委書記后去她的大酒店吃飯,被她百般嘲笑

奶茶麥子
2026-03-05 23:57:07
伊朗軍方:擊中美軍“林肯”號航母!道指盤中狂瀉千點(diǎn),原油暴漲8.5%創(chuàng)近六年最大單日漲幅

伊朗軍方:擊中美軍“林肯”號航母!道指盤中狂瀉千點(diǎn),原油暴漲8.5%創(chuàng)近六年最大單日漲幅

金融界
2026-03-06 08:12:10
貝爾:阿扎爾是訓(xùn)練最差的隊(duì)友,但我也不全力訓(xùn)練

貝爾:阿扎爾是訓(xùn)練最差的隊(duì)友,但我也不全力訓(xùn)練

懂球帝
2026-03-05 22:09:19
遭鞭打,被迫在尿騷味地道取暖?迪麗熱巴猛料升級,滯留只是一角

遭鞭打,被迫在尿騷味地道取暖?迪麗熱巴猛料升級,滯留只是一角

阿纂看事
2026-03-04 18:21:39
1996年, 施瓦辛格在家中無事,和35歲200斤女傭發(fā)生不當(dāng)關(guān)系

1996年, 施瓦辛格在家中無事,和35歲200斤女傭發(fā)生不當(dāng)關(guān)系

南權(quán)先生
2026-01-20 15:49:53
奉勸所有40到50歲后的中年人,只要不被開除,干到退休就是成功

奉勸所有40到50歲后的中年人,只要不被開除,干到退休就是成功

歲月有情1314
2026-03-03 14:49:44
曾經(jīng)走紅,如今卻“淪為笑柄”的4種數(shù)碼產(chǎn)品,還是別再買了

曾經(jīng)走紅,如今卻“淪為笑柄”的4種數(shù)碼產(chǎn)品,還是別再買了

美家指南
2026-03-06 10:31:36
一代上海人的回憶落幕!“老舅媽”嫩娘去世,享年100歲

一代上海人的回憶落幕!“老舅媽”嫩娘去世,享年100歲

上觀新聞
2026-03-06 12:37:06
2026-03-06 14:40:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12425文章數(shù) 142578關(guān)注度
往期回顧 全部

科技要聞

獨(dú)家|除夕加班、毫無黑料!林俊旸無奈離場

頭條要聞

伊軍指揮官:這幾天只是清庫存 會亮從未公開的大殺器

頭條要聞

伊軍指揮官:這幾天只是清庫存 會亮從未公開的大殺器

體育要聞

跑了24年,他終于成為英超“最長的河”

娛樂要聞

周杰倫社交媒體曬昆凌,夫妻感情穩(wěn)定

財(cái)經(jīng)要聞

黃金,牛市沒了?!

汽車要聞

710km長續(xù)航+閃充 宋Ultra EV預(yù)售15.5萬起

態(tài)度原創(chuàng)

藝術(shù)
本地
家居
公開課
軍事航空

藝術(shù)要聞

敦煌壁畫里的“動物世界”,溫馨有愛!

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

家居要聞

暖棕撞色 輕法奶油風(fēng)

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

2026年中國國防預(yù)算增長7%

無障礙瀏覽 進(jìn)入關(guān)懷版