国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

陶哲軒潑冷水:我不相信AGI!但又一數(shù)學(xué)難題被GPT-5.2 Pro攻克

0
分享至


新智元報道

編輯:Aeneas

【新智元導(dǎo)讀】就在剛剛,陶哲軒po文揭秘:當(dāng)前的AI無法實現(xiàn)真正的AGI,不過,他們倒是擁有一些有用的小聰明,或者可以說「通用狡猾」。而就在同時,又一多年數(shù)學(xué)難題被GPT-5.2 Pro攻克了。

就在今天,即將離職Meta的LeCun再次給當(dāng)前AI判死刑——這條路行不通,而且永遠不會成功。

前不久,谷歌DeepMind首席科學(xué)家Shane Legg給出預(yù)測:最小AGI有50%的可能性在2028年實現(xiàn)。

業(yè)界都在討論的AGI之爭,陶哲軒是如何看待的?

就在剛剛,陶哲軒po文明確了自己的態(tài)度——還不行。


他認為,目前還無法實現(xiàn)AGI。

我懷疑目前工具還無法實現(xiàn)真正意義上的「人工通用智能」。然而,我認為一種較弱但仍然非常有價值的「人工通用才智」,正在以各種方式成為現(xiàn)實。

而他的觀點,立馬在網(wǎng)上引起了廣泛討論。


網(wǎng)友們表示,陶哲軒這樣聰明的人,都認為AGI并未實現(xiàn),這樣太令人絕望了——希望他是錯的吧。

陶哲軒:不是AGI,只是魔術(shù)師

什么叫通用才智?

陶哲軒是這樣解釋的。

「通用才智」是指通過某種臨時手段解決廣泛復(fù)雜問題的能力。

這些手段可能是隨機的,也可能是暴力計算的成果;它們可能缺乏根基或容易出錯;它們可能難以解釋,也可能能追溯到AI訓(xùn)練數(shù)據(jù)中類似的技巧。

因此,它們不能被視為任何真正「智能」的結(jié)果。

然而,它們在實現(xiàn)日益廣泛的任務(wù)時,可以擁有非同尋常的成功率,尤其是在結(jié)合嚴格的驗證程序以過濾掉錯誤或不具前景的方法時,其規(guī)模已超出了單個人類所能達到的范圍。

可以理解為,這是一種「通用狡猾」AI。


而這種「通用狡猾」AI,就會讓人感覺非常匪夷所思。

比如在有時候,這些技術(shù)非常實用,令人印象深刻,然而從根本上說,它卻令人不滿和失望。

AI是「最強大腦」魔術(shù)師?

想象這樣一個場景:一位魔術(shù)師上臺,憑空變出鴿子、猜中你選的牌、把水杯變成金魚。全場掌聲雷動,觀眾目瞪口呆。

結(jié)果他平靜自曝:「其實我袖子藏了十八個機關(guān),桌下有暗格,牌是特制的,金魚是提前藏好的。」掌聲戛然而止。

如今的AI,就像這位魔術(shù)師一樣。


它能寫詩、編程、解數(shù)學(xué)題——但如果你問它:「你是怎么想到這個答案的?」

它可能會誠實坦白:「我在訓(xùn)練數(shù)據(jù)里見過類似題目,概率上這個回答匹配度最高?!?/p>

所以,這其實不是智能,而是基于海量數(shù)據(jù)的「聰明把戲」。

「通用狡猾AI」,反而起了大作用

對于這種「通用狡猾AI」,陶哲軒是怎么解釋的。

雖然聰明才智和智力在人類身上是某種程度上相關(guān)的特質(zhì),但對于AI工具(這些工具通常被優(yōu)化以追求聰明才智)來說,它們卻更加解耦,將當(dāng)前一代這樣的工具主要視為一個隨機生成有時聰明,且往往有用的思想和輸出的生成器,在嘗試使用它們解決難題時,可能是一種更具生產(chǎn)性的視角。

也就是說,智能≠聰明。

對人來說,二者是同時存在的;但對于AI而言,所謂的「聰明」,也就是快速解決復(fù)雜問題,可以獨立存在。

當(dāng)前AI的「聰明」,是隨機的,暴力的,可錯的,難解釋的。

最終,它并不是靠智慧取勝,而是靠「大規(guī)模試錯與匹配」,就像用超級望遠鏡,在答案星海里撈最亮的幾顆。

當(dāng)今的AI,并不是全知全能,然而這個「不夠智能但足夠聰明」的工具,卻已經(jīng)悄悄改變知識工作的每一個環(huán)節(jié)。

對于陶哲軒的說法,網(wǎng)友們表示的確如此。

對于目前的AI來說,看似便利但難以預(yù)測的思想,似乎是一種主要應(yīng)用場景。


可以說,陶哲軒所說的,就是目前AI能力「參差不齊的邊界」。


甚至評論區(qū)還出現(xiàn)了中文留言,認為目前的AI底層架構(gòu)就決定了,即使投入無限多的算力,產(chǎn)出的東西也依然有邊際。


而在Reddit的帖子中,網(wǎng)友們也對此展開熱議。

有人對表示,自己非常尊重陶哲軒,但對他的部分觀點表示反駁。


有人說,他用「狡猾」或「巧妙」一詞,來針對現(xiàn)代LLM缺乏系統(tǒng)性思維的缺點。

目前,他或許是對的。不過,ChatGPT還只有3歲,如果要宣布所有LLM都有此局限,至少還應(yīng)該再等待十年。


又一數(shù)學(xué)難題被AI破解

巧的是,就在陶哲軒發(fā)出這個論點不久,又有一道數(shù)學(xué)難題被AI破解了!

滑鐵盧大學(xué)計算機系的助理教授Kimon Fountoulakis激動發(fā)帖稱,GPT-5.2剛剛解決了COLT 2022開放問題——

使用標準加速梯度算法和互補性邊界假設(shè),證明加速L1正則化PageRank的運行時間復(fù)雜度。

其中,所有證明都由GPT-5.2 Pro生成。算法總工作量的關(guān)鍵界限,則是使用 GPT-5.2 Pro、Aristotle和Antigravity上的Gemini 3 Pro (High) 組合完成了自動的形式化。


多倫多大學(xué)的教授Daniel Litt也出來表示,GPT-5.2 Pro的確很強,它對于自己的代數(shù)幾何和數(shù)論研究,都產(chǎn)生了巨大飛躍。


懸賞8年難題,GPT-5.2用數(shù)學(xué)證明封神

這道難題,已經(jīng)困擾了教授8年。


自2024年以來,每次OpenAI或谷歌發(fā)布一個新模型,他都會拿過來嘗試一下。

令人沒想到的是,這一次,GPT-5.2竟然成功了!


教授這樣回憶道:這個開放性問題,我們嘗試了三年,失敗了;找博士生做,也失敗了;問了多位頂尖學(xué)者,都說太難了。

2022年,這道關(guān)于「加速L1正則化PageRank算法時間復(fù)雜度」的難題,被正式列為COLT國際頂級會議的開放問題之一,懸賞求解。

誰也沒想到,兩年后,這道難倒無數(shù)學(xué)者的題目,竟被GPT-5.2悄然攻克。

懸賞

故事要從2016年說起。當(dāng)時,教授在優(yōu)化PageRank算法時發(fā)現(xiàn),經(jīng)典迭代軟閾值算法在求解帶L1正則的PageRank問題時,其運行時間竟然只與最終解的非零節(jié)點數(shù)有關(guān),出奇地高

一個很自然的追問隨之而來:如果用上加速算法,比如在優(yōu)化領(lǐng)域聲名顯赫的FISTA,會不會更快?

理論上應(yīng)該如此。但現(xiàn)實卻潑了一盆冷水:FISTA在迭代過程中會「激活」大量本應(yīng)為零的節(jié)點,雖然最終能收斂到正確的稀疏解,但中間過程卻很鋪張浪費。

開始,教授嘗試了三個月,想從理論上界定FISTA的總計算量,失敗了。后來斷斷續(xù)續(xù)又試了幾次,直到2021年,無論是教授最杰出的學(xué)生,還是幾位大牛研究者,都對這個問題束手無策。


團隊決定,將這個難題公之于眾。

2022年,它被正式列為COLT的開放問題,向全球機器學(xué)習(xí)社區(qū)發(fā)起挑戰(zhàn)。


破局

第一個成功的解法,出現(xiàn)在2023年。David Martínez-Rubio等人提出了一種新穎的加速算法,從完全不同的角度給出解答。

然而,這個算法為了達到加速效果,需要在每一步求解一個昂貴的子問題,在實際應(yīng)用中效率很低。

直到GPT-5.2發(fā)布后,真正的轉(zhuǎn)折點來了。

這一次,GPT-5.2給出了完整的證明。


而且令人震驚的是,它給出的恰恰是針對經(jīng)典FISTA算法的證明。

它揭示了在一種被稱為「互補性邊界」的合理假設(shè)下,F(xiàn)ISTA的總計算量可以被優(yōu)雅地界定,并且在特定的圖結(jié)構(gòu)上,能展現(xiàn)出明確優(yōu)于經(jīng)典算法的加速效果。

更關(guān)鍵的是,這個證明解釋了長期困擾學(xué)界的現(xiàn)象:盡管FISTA在迭代中會激活更多節(jié)點,但這些「多余激活」是可控的、暫時的。一旦迭代進入最優(yōu)解的一個鄰域,算法就會迅速收斂。


怎么證明?三重驗證

GPT-5.2的證明能令人信服嗎?為此,團隊搭建了一個三重驗證體系。

首先,GPT-5.2 Pro生成了完整的證明初稿。

接著,團隊借助@HarmonicMath的Aristotle系統(tǒng),結(jié)合Gemini 3 Pro模型,將證明中的關(guān)鍵不等式和復(fù)雜度上界,逐行轉(zhuǎn)化成了形式化的Lean代碼。

而且除了形式化驗證之外,教授自己也把證明從頭到尾證明了兩遍。目前看來,證明是沒問題的。


陶哲軒會被說服嗎

又一數(shù)學(xué)難題被GPT-5.2 Pro攻克,這不由得引起網(wǎng)友討論——

它會成為AGI嗎?陶哲軒會看到希望嗎?

至少,目前GPT-5.2再一次證明了LLM在深度數(shù)學(xué)推理上的驚人潛力。

而且,它也彌合了理論分析與實際算法之間的鴻溝。它的證明,為最經(jīng)典的加速算法提供了缺失的理論基石。

當(dāng)然,這并不意味著AI能取代理論科學(xué)家。

可以說,它更像是一個擁有驚人直覺和不知疲倦的協(xié)作者。

人類提出關(guān)鍵問題、界定框架、判斷價值,AI則能在龐大的數(shù)學(xué)空間里,幫我們找到那條通往答案的隱秘小徑。

參考資料:

https://mathstodon.xyz/@tao/115722360006034040

https://x.com/kfountou/status/2000957773584974298

秒追ASI

?點贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點亮星標,鎖定新智元極速推送!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
影后辛芷蕾,這張照片攝影師得加雞腿,抓拍的太到位了

影后辛芷蕾,這張照片攝影師得加雞腿,抓拍的太到位了

徐幫陽
2025-12-23 18:33:38
拿下特斯拉大單,手握2家上市公司!“中國最大忽悠”要翻身了?

拿下特斯拉大單,手握2家上市公司!“中國最大忽悠”要翻身了?

品牌觀察官
2025-12-07 20:49:20
伊朗爆發(fā)抗議游行 高層被斬首削弱控制,伊朗民眾走上街頭

伊朗爆發(fā)抗議游行 高層被斬首削弱控制,伊朗民眾走上街頭

火星人的想法
2025-12-31 06:00:03
軍演剛結(jié)束,臺當(dāng)局對大陸示威,鄭麗說錯一句話,還遭賴清德羞辱

軍演剛結(jié)束,臺當(dāng)局對大陸示威,鄭麗說錯一句話,還遭賴清德羞辱

博覽歷史
2026-01-03 17:09:57
北京連下六道指令,陜西硬抗整整四年,最高指示:讓749局來

北京連下六道指令,陜西硬抗整整四年,最高指示:讓749局來

小哥很OK
2025-12-12 14:33:01
出門12名女秘書陪伴,非法斂財上百億,昔日河北首富鋃鐺入獄記

出門12名女秘書陪伴,非法斂財上百億,昔日河北首富鋃鐺入獄記

探史
2026-01-03 14:54:27
中日情況有變,高市早苗急電白宮,特朗普發(fā)狠,下達了一項總統(tǒng)令

中日情況有變,高市早苗急電白宮,特朗普發(fā)狠,下達了一項總統(tǒng)令

近史博覽
2026-01-03 11:29:25
這是使命之戰(zhàn)!央視首度披露:我國載人航天首次應(yīng)急發(fā)射經(jīng)歷了什么

這是使命之戰(zhàn)!央視首度披露:我國載人航天首次應(yīng)急發(fā)射經(jīng)歷了什么

政知新媒體
2026-01-03 08:00:02
深夜!大跳水

深夜!大跳水

中國基金報
2026-01-03 00:15:52
注意防風(fēng)防寒!北京下周多冷空氣活動,10日最高氣溫為0℃

注意防風(fēng)防寒!北京下周多冷空氣活動,10日最高氣溫為0℃

新浪財經(jīng)
2026-01-03 15:16:19
虧損5億!《阿凡達3》票房逼近70億,盈利在望!

虧損5億!《阿凡達3》票房逼近70億,盈利在望!

影視高原說
2026-01-03 10:54:31
男子中1000萬彩票后失蹤6年,母親去女兒家探親,打開地窖崩潰

男子中1000萬彩票后失蹤6年,母親去女兒家探親,打開地窖崩潰

罪案洞察者
2025-07-10 09:30:11
丁渤再曝猛料,徐湖平文物貪腐鏈添關(guān)鍵鐵證

丁渤再曝猛料,徐湖平文物貪腐鏈添關(guān)鍵鐵證

取經(jīng)的兵
2025-12-29 19:39:28
亨廷頓《文明的沖突》:十大預(yù)言已逐一兌現(xiàn)!

亨廷頓《文明的沖突》:十大預(yù)言已逐一兌現(xiàn)!

尚曦讀史
2025-12-08 10:32:06
英達直播間喊話巴圖遭3分鐘沉默,網(wǎng)友:惦記曾被視為累贅的孩子

英達直播間喊話巴圖遭3分鐘沉默,網(wǎng)友:惦記曾被視為累贅的孩子

詩意世界
2026-01-02 22:52:32
漢語的同化能力太強了!加拿大華人發(fā)明的中式單詞,竟火遍海外!

漢語的同化能力太強了!加拿大華人發(fā)明的中式單詞,竟火遍海外!

今日美食分享
2026-01-03 12:18:14
看懂抗美援朝,也就懂了伊朗總統(tǒng)萊希死后,中國為啥在臺海掀桌子

看懂抗美援朝,也就懂了伊朗總統(tǒng)萊希死后,中國為啥在臺海掀桌子

云霄紀史觀
2025-12-14 19:41:38
馬刺連續(xù)3年淘到寶!文班缺席榜眼扛大旗 轟22分獨占25年新秀第一

馬刺連續(xù)3年淘到寶!文班缺席榜眼扛大旗 轟22分獨占25年新秀第一

鍋子籃球
2026-01-03 12:29:03
狐貍尾巴終究藏不住,他“妻妾成群”,大兒子和鞏俐越長越像?

狐貍尾巴終究藏不住,他“妻妾成群”,大兒子和鞏俐越長越像?

豐譚筆錄
2026-01-03 07:50:06
國乒教練競聘結(jié)束!3位新人上任,王楚欽傳好消息,王勵勤來真的

國乒教練競聘結(jié)束!3位新人上任,王楚欽傳好消息,王勵勤來真的

做一個合格的吃瓜群眾
2026-01-03 10:56:34
2026-01-03 18:28:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14244文章數(shù) 66422關(guān)注度
往期回顧 全部

科技要聞

比亞迪銷冠!特斯拉2025年交付量跌逾8%

頭條要聞

特朗普下令打擊 委總統(tǒng)馬杜羅:立即進入武裝斗爭階段

頭條要聞

特朗普下令打擊 委總統(tǒng)馬杜羅:立即進入武裝斗爭階段

體育要聞

快船似乎又行了

娛樂要聞

“國服嫂子”司曉迪,曝與多位男星私照

財經(jīng)要聞

具身智能搶人大戰(zhàn):畢業(yè)一年 年薪300萬

汽車要聞

奕派科技全年銷量275,752輛 同比增長28.3

態(tài)度原創(chuàng)

時尚
家居
手機
藝術(shù)
本地

今年最時髦的穿法:長外套+長褲,太高級了!

家居要聞

無形有行 自然與靈感詩意

手機要聞

聯(lián)想拯救者Legion GO 2掌機國行預(yù)約

藝術(shù)要聞

宋徽宗用30年搜集的“二王”真跡,足有100多件,堪為書法界的《永樂大典》!

本地新聞

即將過去的2025年,對重慶的影響竟然如此深遠

無障礙瀏覽 進入關(guān)懷版