国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

45年數(shù)論猜想被GPT-5.2 Pro獨立完成證明,陶哲軒:沒犯任何錯誤

0
分享至

夢晨 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

AI證明數(shù)學(xué)猜想,這次來真的了。

OpenAI最新模型GPT-5.2 Pro剛剛獨立證明了一道埃爾德什猜想。

論證過程經(jīng)菲爾茲獎得主陶哲軒驗證成立,還被評價為“迄今為止最明確的第一類結(jié)果(AI主要貢獻)”。



這道題是埃爾德什問題庫中的第281號,由傳奇數(shù)學(xué)家保羅·埃爾德什(Paul Erd?s)與羅納德·格雷厄姆(Ronald Graham)于1980年共同提出,涉及同余覆蓋系統(tǒng)與自然密度的深層關(guān)系。

45年來,這道題一直靜靜躺在問題庫里,等待解答。

直到2026年1月17日,一位名叫Neel Somani的研究者把這道題扔給了GPT-5.2 Pro。



證明只用到GPT 5.2 Pro

埃爾德什問題網(wǎng)站已收錄AI證明結(jié)果。

整個論證在無窮阿德爾整數(shù)環(huán)上展開,借助哈爾測度和點態(tài)遍歷定理,結(jié)合緊致性論證完成了從逐點收斂到一致收斂的躍遷。



按陶哲軒的話說,它是“Furstenberg對應(yīng)原理”的一個變體,這是遍歷理論與組合數(shù)學(xué)交叉領(lǐng)域的標(biāo)準(zhǔn)工具。

但GPT-5.2 Pro的用法又有些不同,它比通常的論證更依賴伯克霍夫定理。



然而真正讓陶哲軒印象深刻的不是證明方法本身,而是AI沒有犯錯。

  • 讓我更驚訝的是它避免了錯誤,比如極限交換或量詞順序的失誤,這正是這道題最容易踩的坑。前幾代大語言模型幾乎肯定會在這些微妙之處栽跟頭。

為了驗證這份證明,陶哲軒親自動手,把整套遍歷論論證翻譯成了組合學(xué)語言,用哈代-利特爾伍德極大不等式替代伯克霍夫定理,重新走了一遍全部推導(dǎo)。

結(jié)論:證明成立。

一個意外的發(fā)現(xiàn)

正當(dāng)大家討論GPT-5.2 Pro的證明時,一位網(wǎng)名KoishiChan的用戶在評論區(qū)拋出了一個令人意外的發(fā)現(xiàn):

這道題其實有更簡單的解法,而且所需的兩個定理早在1936年和1966年就已經(jīng)存在了。

第一個是達文波特(Harold Davenport)與埃爾德什本人在1936年合作證明的密度收斂定理。

第二個是羅杰斯定理,首次發(fā)表于1966年的哈爾伯斯塔姆-羅斯專著《序列》第五章。把這兩個經(jīng)典結(jié)果拼在一起,第281號問題幾乎是直接推論。

這就奇怪了。埃爾德什自己就是1936年那篇論文的合著者,而他在1980年提出這道題時,都沒有意識到答案近在眼前。



陶哲軒就此事專門寫郵件請教了法國數(shù)學(xué)家特南鮑姆(Tenenbaum)。

特南鮑姆確認“只要滿足你提到的兩個經(jīng)典結(jié)果(達文波特-埃爾多斯定理和羅杰斯定理),問題就能立即得到解決”,但他也猜測“問題的表述可能在某個環(huán)節(jié)被改動過”。不過目前沒有人找到任何其他版本的表述,所以只能按原樣處理。

更有意思的是,2007年菲拉塞塔、福特、科尼亞金、波默朗斯和余等五位頂尖專家在解決另一道埃爾德什問題時,同樣不知道羅杰斯定理的存在,直到特南鮑姆提醒他們才補上了引用。

陶哲軒感慨:“羅杰斯定理沒有得到它應(yīng)有的傳播。它只出現(xiàn)在哈爾伯斯塔姆-羅斯那本書里,沒有單獨發(fā)表,文獻引用寥寥無幾?;蛟S這場討論能讓更多研究篩法和同余覆蓋的人注意到這個結(jié)果。”

最終現(xiàn)在這道題有了兩份證明:一份來自GPT-5.2 Pro的遍歷論路徑,一份來自KoishiChan挖出的經(jīng)典文獻組合。

陶哲軒確認兩者是“不同的證明”,雖然在概念上有些重疊。



如何評估AI數(shù)學(xué)的真實成功率

消息傳開后,各路AI模型紛紛被拉來交叉驗證。

Gemini 3 Pro表示證明沒有問題。另一位研究者用GPT-5.2 Pro反復(fù)檢查論證細節(jié),AI認為唯一需要補充嚴(yán)格性的地方在第二步,可以用法圖引理繞過遍歷論直接完成。

不過陶哲軒指出這里法圖引理的方向用反:我剛教完研究生測度論,這類錯誤見得太多了。

隨后又確認其實是對補集應(yīng)用法圖引理,方向沒問題,論證成立。

但陶哲軒同時發(fā)出了冷靜的提醒。他寫道:

  • 評估AI工具真實成功率時,最大的統(tǒng)計偏差來自強烈的報告偏差,負面結(jié)果幾乎不會被披露。
  • 如果某人或某AI公司把工具用在開放問題上但沒有進展,他們沒有動力報告這個負面結(jié)論;即使報告了,也不太可能像正面結(jié)果那樣在社交媒體上傳播開來。
  • 盡管絕大多數(shù)集中在難度譜系的簡單一端,遠不能說明中等難度的埃爾德什問題已經(jīng)進入AI的射程范圍。

他推薦了Paata Ivanisvili和Mehmet Mars Seven發(fā)起的一個開源項目,系統(tǒng)記錄前沿大語言模型在埃爾德什問題上的正面和負面結(jié)果。



數(shù)據(jù)顯示,這些工具在埃爾德什問題上的真實成功率大約只有百分之一到二。

但考慮到問題庫里有超過600道未解難題,這個比例仍然意味著一批數(shù)量可觀且非平凡的AI貢獻。



參考鏈接:
[1]https://www.erdosproblems.com/forum/thread/281
[2]https://x.com/neelsomani/status/2012695714187325745
[3]https://mathstodon.xyz/@tao/115911902186528812

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
臺海局勢再次升級,武統(tǒng)、和統(tǒng)都沒希望,我國即將走上第三條路

臺海局勢再次升級,武統(tǒng)、和統(tǒng)都沒希望,我國即將走上第三條路

老范談史
2026-01-18 16:00:07
利雅得勝利主帥委婉說出球隊問題就是C羅 狀態(tài)不佳+強踢任意球

利雅得勝利主帥委婉說出球隊問題就是C羅 狀態(tài)不佳+強踢任意球

智道足球
2026-01-19 10:36:44
原來有這么多工作需要保密!網(wǎng)友:犧牲12年的爸爸竟然回來了!

原來有這么多工作需要保密!網(wǎng)友:犧牲12年的爸爸竟然回來了!

另子維愛讀史
2026-01-16 18:29:22
國乒高層大洗牌!3人上桌,2人換桌,1人下桌,肖戰(zhàn)王皓位列其中

國乒高層大洗牌!3人上桌,2人換桌,1人下桌,肖戰(zhàn)王皓位列其中

姩姩有娛
2026-01-19 15:54:53
邁阿密國際正在談判!梅西可能踢南美解放者杯!冠軍+1?

邁阿密國際正在談判!梅西可能踢南美解放者杯!冠軍+1?

氧氣是個地鐵
2026-01-19 20:19:53
拳王鄒市明自爆破產(chǎn),不止賠光2億,妻子參加婚禮撕下最后的體面

拳王鄒市明自爆破產(chǎn),不止賠光2億,妻子參加婚禮撕下最后的體面

哄動一時啊
2026-01-19 19:33:51
這個諾貝爾獎,解釋了伊朗為何走向失敗

這個諾貝爾獎,解釋了伊朗為何走向失敗

老寓雜談
2026-01-17 14:12:26
“中俄鞏固主導(dǎo)地位,新建數(shù)量占全球90%”

“中俄鞏固主導(dǎo)地位,新建數(shù)量占全球90%”

觀察者網(wǎng)
2026-01-19 15:05:09
重磅:莫斯科遇襲大面積停電!烏克蘭海馬斯導(dǎo)彈齊射

重磅:莫斯科遇襲大面積停電!烏克蘭海馬斯導(dǎo)彈齊射

項鵬飛
2026-01-19 19:48:15
一個殘忍預(yù)感:將來50后60后不在了,恐怕三代人的祭祖方式全變了

一個殘忍預(yù)感:將來50后60后不在了,恐怕三代人的祭祖方式全變了

三農(nóng)雷哥
2026-01-12 19:04:47
明朝一男子將私房錢藏于木雕中,藏了600年,幾任收藏家都沒發(fā)現(xiàn)

明朝一男子將私房錢藏于木雕中,藏了600年,幾任收藏家都沒發(fā)現(xiàn)

銘記歷史呀
2025-12-30 18:14:57
什么是性成癮?患者自述:比煙癮、酒癮厲害多了,比戒毒還難

什么是性成癮?患者自述:比煙癮、酒癮厲害多了,比戒毒還難

泠泠說史
2025-10-30 15:20:45
他身高1米6卻娶了中國首席舞蹈家譚元元

他身高1米6卻娶了中國首席舞蹈家譚元元

豐譚筆錄
2026-01-13 07:30:10
1-2爆大冷!鄭欽文宿敵出局,慘遭一輪游,大滿貫冠軍0-2遭淘汰

1-2爆大冷!鄭欽文宿敵出局,慘遭一輪游,大滿貫冠軍0-2遭淘汰

體育就你秀
2026-01-19 11:19:58
羅永浩需要為西貝預(yù)制菜風(fēng)波擔(dān)責(zé)?律師解讀

羅永浩需要為西貝預(yù)制菜風(fēng)波擔(dān)責(zé)?律師解讀

半島官網(wǎng)
2026-01-19 09:26:22
中方繳清會費后,美國另立聯(lián)合國,入群需交69億,古特雷斯表態(tài)了

中方繳清會費后,美國另立聯(lián)合國,入群需交69億,古特雷斯表態(tài)了

凡知
2026-01-19 20:02:13
江蘇省環(huán)保集團有限公司黨委書記、董事長方斌斌被查

江蘇省環(huán)保集團有限公司黨委書記、董事長方斌斌被查

揚子晚報
2026-01-19 18:00:00
1月下旬開始,貴人暗中出現(xiàn),事業(yè)財運同步走高的三個星座

1月下旬開始,貴人暗中出現(xiàn),事業(yè)財運同步走高的三個星座

小晴星座說
2026-01-19 20:18:30
王艷曬倆兒子合照!繼子罕出鏡和球球關(guān)系親密,王艷和他像同齡人

王艷曬倆兒子合照!繼子罕出鏡和球球關(guān)系親密,王艷和他像同齡人

琴聲飛揚
2026-01-19 14:18:46
爆:中國電信重大技術(shù)性成果突破!

爆:中國電信重大技術(shù)性成果突破!

通信頭條
2026-01-17 11:20:59
2026-01-19 21:15:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12032文章數(shù) 176360關(guān)注度
往期回顧 全部

科技要聞

這一仗必須贏!馬斯克死磕芯片"9個月一更"

頭條要聞

特朗普給挪威首相發(fā)信息:不再有義務(wù)只考慮和平

頭條要聞

特朗普給挪威首相發(fā)信息:不再有義務(wù)只考慮和平

體育要聞

錯失英超冠軍獎牌,他卻在德甲成為傳奇

娛樂要聞

吳磊起訴白珊珊誹謗,白珊珊稱被盜號

財經(jīng)要聞

公章爭奪 家族反目 雙星為何從頂端跌落?

汽車要聞

徐軍:沖擊百萬銷量,零跑一直很清醒

態(tài)度原創(chuàng)

藝術(shù)
本地
家居
公開課
軍事航空

藝術(shù)要聞

有一種美,叫做中國園林!

本地新聞

云游內(nèi)蒙|黃沙與碧波撞色,烏海天生會“混搭”

家居要聞

雋永之章 清雅無塵

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

古美關(guān)系高度緊張 古巴啟動"戰(zhàn)爭狀態(tài)"

無障礙瀏覽 進入關(guān)懷版