陶哲軒潑冷水：我不相信AGI！但又一數(shù)學(xué)難題被GPT-5.2 Pro攻克

2026-01-03 13:28:45　來源: 新智元

北京舉報

分享至

新智元報道

編輯：Aeneas

【新智元導(dǎo)讀】就在剛剛，陶哲軒po文揭秘：當(dāng)前的AI無法實現(xiàn)真正的AGI，不過，他們倒是擁有一些有用的小聰明，或者可以說「通用狡猾」。而就在同時，又一多年數(shù)學(xué)難題被GPT-5.2 Pro攻克了。

就在今天，即將離職Meta的LeCun再次給當(dāng)前AI判死刑——這條路行不通，而且永遠不會成功。

前不久，谷歌DeepMind首席科學(xué)家Shane Legg給出預(yù)測：最小AGI有50%的可能性在2028年實現(xiàn)。

業(yè)界都在討論的AGI之爭，陶哲軒是如何看待的？

就在剛剛，陶哲軒po文明確了自己的態(tài)度——還不行。

他認為，目前還無法實現(xiàn)AGI。

我懷疑目前工具還無法實現(xiàn)真正意義上的「人工通用智能」。然而，我認為一種較弱但仍然非常有價值的「人工通用才智」，正在以各種方式成為現(xiàn)實。

而他的觀點，立馬在網(wǎng)上引起了廣泛討論。

網(wǎng)友們表示，陶哲軒這樣聰明的人，都認為AGI并未實現(xiàn)，這樣太令人絕望了——希望他是錯的吧。

陶哲軒：不是AGI，只是魔術(shù)師

什么叫通用才智？

陶哲軒是這樣解釋的。

「通用才智」是指通過某種臨時手段解決廣泛復(fù)雜問題的能力。

這些手段可能是隨機的，也可能是暴力計算的成果；它們可能缺乏根基或容易出錯；它們可能難以解釋，也可能能追溯到AI訓(xùn)練數(shù)據(jù)中類似的技巧。

因此，它們不能被視為任何真正「智能」的結(jié)果。

然而，它們在實現(xiàn)日益廣泛的任務(wù)時，可以擁有非同尋常的成功率，尤其是在結(jié)合嚴格的驗證程序以過濾掉錯誤或不具前景的方法時，其規(guī)模已超出了單個人類所能達到的范圍。

可以理解為，這是一種「通用狡猾」AI。

而這種「通用狡猾」AI，就會讓人感覺非常匪夷所思。

比如在有時候，這些技術(shù)非常實用，令人印象深刻，然而從根本上說，它卻令人不滿和失望。

AI是「最強大腦」魔術(shù)師？

想象這樣一個場景：一位魔術(shù)師上臺，憑空變出鴿子、猜中你選的牌、把水杯變成金魚。全場掌聲雷動，觀眾目瞪口呆。

結(jié)果他平靜自曝：「其實我袖子藏了十八個機關(guān)，桌下有暗格，牌是特制的，金魚是提前藏好的。」掌聲戛然而止。

如今的AI，就像這位魔術(shù)師一樣。

它能寫詩、編程、解數(shù)學(xué)題——但如果你問它：「你是怎么想到這個答案的？」

它可能會誠實坦白：「我在訓(xùn)練數(shù)據(jù)里見過類似題目，概率上這個回答匹配度最高?！?/p>

所以，這其實不是智能，而是基于海量數(shù)據(jù)的「聰明把戲」。

「通用狡猾AI」，反而起了大作用

對于這種「通用狡猾AI」，陶哲軒是怎么解釋的。

雖然聰明才智和智力在人類身上是某種程度上相關(guān)的特質(zhì)，但對于AI工具（這些工具通常被優(yōu)化以追求聰明才智）來說，它們卻更加解耦，將當(dāng)前一代這樣的工具主要視為一個隨機生成有時聰明，且往往有用的思想和輸出的生成器，在嘗試使用它們解決難題時，可能是一種更具生產(chǎn)性的視角。

也就是說，智能≠聰明。

對人來說，二者是同時存在的；但對于AI而言，所謂的「聰明」，也就是快速解決復(fù)雜問題，可以獨立存在。

當(dāng)前AI的「聰明」，是隨機的，暴力的，可錯的，難解釋的。

最終，它并不是靠智慧取勝，而是靠「大規(guī)模試錯與匹配」，就像用超級望遠鏡，在答案星海里撈最亮的幾顆。

當(dāng)今的AI，并不是全知全能，然而這個「不夠智能但足夠聰明」的工具，卻已經(jīng)悄悄改變知識工作的每一個環(huán)節(jié)。

對于陶哲軒的說法，網(wǎng)友們表示的確如此。

對于目前的AI來說，看似便利但難以預(yù)測的思想，似乎是一種主要應(yīng)用場景。

可以說，陶哲軒所說的，就是目前AI能力「參差不齊的邊界」。

甚至評論區(qū)還出現(xiàn)了中文留言，認為目前的AI底層架構(gòu)就決定了，即使投入無限多的算力，產(chǎn)出的東西也依然有邊際。

而在Reddit的帖子中，網(wǎng)友們也對此展開熱議。

有人對表示，自己非常尊重陶哲軒，但對他的部分觀點表示反駁。

有人說，他用「狡猾」或「巧妙」一詞，來針對現(xiàn)代LLM缺乏系統(tǒng)性思維的缺點。

目前，他或許是對的。不過，ChatGPT還只有3歲，如果要宣布所有LLM都有此局限，至少還應(yīng)該再等待十年。

又一數(shù)學(xué)難題被AI破解

巧的是，就在陶哲軒發(fā)出這個論點不久，又有一道數(shù)學(xué)難題被AI破解了！

滑鐵盧大學(xué)計算機系的助理教授Kimon Fountoulakis激動發(fā)帖稱，GPT-5.2剛剛解決了COLT 2022開放問題——

使用標準加速梯度算法和互補性邊界假設(shè)，證明加速L1正則化PageRank的運行時間復(fù)雜度。

其中，所有證明都由GPT-5.2 Pro生成。算法總工作量的關(guān)鍵界限，則是使用 GPT-5.2 Pro、Aristotle和Antigravity上的Gemini 3 Pro (High) 組合完成了自動的形式化。

多倫多大學(xué)的教授Daniel Litt也出來表示，GPT-5.2 Pro的確很強，它對于自己的代數(shù)幾何和數(shù)論研究，都產(chǎn)生了巨大飛躍。

懸賞8年難題，GPT-5.2用數(shù)學(xué)證明封神

這道難題，已經(jīng)困擾了教授8年。

自2024年以來，每次OpenAI或谷歌發(fā)布一個新模型，他都會拿過來嘗試一下。

令人沒想到的是，這一次，GPT-5.2竟然成功了！

教授這樣回憶道：這個開放性問題，我們嘗試了三年，失敗了；找博士生做，也失敗了；問了多位頂尖學(xué)者，都說太難了。

2022年，這道關(guān)于「加速L1正則化PageRank算法時間復(fù)雜度」的難題，被正式列為COLT國際頂級會議的開放問題之一，懸賞求解。

誰也沒想到，兩年后，這道難倒無數(shù)學(xué)者的題目，竟被GPT-5.2悄然攻克。

懸賞

故事要從2016年說起。當(dāng)時，教授在優(yōu)化PageRank算法時發(fā)現(xiàn)，經(jīng)典迭代軟閾值算法在求解帶L1正則的PageRank問題時，其運行時間竟然只與最終解的非零節(jié)點數(shù)有關(guān)，出奇地高

一個很自然的追問隨之而來：如果用上加速算法，比如在優(yōu)化領(lǐng)域聲名顯赫的FISTA，會不會更快？

理論上應(yīng)該如此。但現(xiàn)實卻潑了一盆冷水：FISTA在迭代過程中會「激活」大量本應(yīng)為零的節(jié)點，雖然最終能收斂到正確的稀疏解，但中間過程卻很鋪張浪費。

開始，教授嘗試了三個月，想從理論上界定FISTA的總計算量，失敗了。后來斷斷續(xù)續(xù)又試了幾次，直到2021年，無論是教授最杰出的學(xué)生，還是幾位大牛研究者，都對這個問題束手無策。

團隊決定，將這個難題公之于眾。

2022年，它被正式列為COLT的開放問題，向全球機器學(xué)習(xí)社區(qū)發(fā)起挑戰(zhàn)。

破局

第一個成功的解法，出現(xiàn)在2023年。David Martínez-Rubio等人提出了一種新穎的加速算法，從完全不同的角度給出解答。

然而，這個算法為了達到加速效果，需要在每一步求解一個昂貴的子問題，在實際應(yīng)用中效率很低。

直到GPT-5.2發(fā)布后，真正的轉(zhuǎn)折點來了。

這一次，GPT-5.2給出了完整的證明。

而且令人震驚的是，它給出的恰恰是針對經(jīng)典FISTA算法的證明。

它揭示了在一種被稱為「互補性邊界」的合理假設(shè)下，F(xiàn)ISTA的總計算量可以被優(yōu)雅地界定，并且在特定的圖結(jié)構(gòu)上，能展現(xiàn)出明確優(yōu)于經(jīng)典算法的加速效果。

更關(guān)鍵的是，這個證明解釋了長期困擾學(xué)界的現(xiàn)象：盡管FISTA在迭代中會激活更多節(jié)點，但這些「多余激活」是可控的、暫時的。一旦迭代進入最優(yōu)解的一個鄰域，算法就會迅速收斂。

怎么證明？三重驗證

GPT-5.2的證明能令人信服嗎？為此，團隊搭建了一個三重驗證體系。

首先，GPT-5.2 Pro生成了完整的證明初稿。

接著，團隊借助@HarmonicMath的Aristotle系統(tǒng)，結(jié)合Gemini 3 Pro模型，將證明中的關(guān)鍵不等式和復(fù)雜度上界，逐行轉(zhuǎn)化成了形式化的Lean代碼。

而且除了形式化驗證之外，教授自己也把證明從頭到尾證明了兩遍。目前看來，證明是沒問題的。

陶哲軒會被說服嗎

又一數(shù)學(xué)難題被GPT-5.2 Pro攻克，這不由得引起網(wǎng)友討論——

它會成為AGI嗎？陶哲軒會看到希望嗎？

至少，目前GPT-5.2再一次證明了LLM在深度數(shù)學(xué)推理上的驚人潛力。

而且，它也彌合了理論分析與實際算法之間的鴻溝。它的證明，為最經(jīng)典的加速算法提供了缺失的理論基石。

當(dāng)然，這并不意味著AI能取代理論科學(xué)家。

可以說，它更像是一個擁有驚人直覺和不知疲倦的協(xié)作者。

人類提出關(guān)鍵問題、界定框架、判斷價值，AI則能在龐大的數(shù)學(xué)空間里，幫我們找到那條通往答案的隱秘小徑。

參考資料：

https://mathstodon.xyz/@tao/115722360006034040

https://x.com/kfountou/status/2000957773584974298

秒追ASI

?點贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點亮星標，鎖定新智元極速推送！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.