国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

菲爾茲獎得主0貢獻!GPT-5.5 Pro兩小時跑出博士級證明

0
分享至


新智元報道

編輯:桃子

【新智元導讀】全網(wǎng)震撼!菲爾茲獎得主把未解數(shù)學題扔給GPT-5.5 Pro,不到兩小時拿到博士論文級證明。整個過程中,他沒給出任何數(shù)學思路。

今天,菲爾茲獎得主Timothy Gowers在個人博客上發(fā)了一篇長文——

最近一次使用ChatGPT 5.5 Pro的體驗

標題平平無奇,內(nèi)容卻讓整個數(shù)學圈坐不住了。


文中,他親手驗證了一個令整個數(shù)學界不寒而栗的事實:

GPT-5.5 Pro,用了不到兩個小時,獨立完成了一項博士論文級別的數(shù)學研究。

而Gowers本人在整個過程中,數(shù)學貢獻幾乎為0


兩個小時,一章博士論文級成果。


全程2小時,菲爾茲獎得主貢獻為0

事情是這樣的。

這幾天,Timothy Gowers拿到了ChatGPT 5.5 Pro的測試權限,決定搞一次真刀真槍的測試。

他從數(shù)學家Melvyn Nathanson的一篇新論文中,挑出了幾個關于加法數(shù)論中集合求和的未解問題。


這些問題的核心是:給定一個k個整數(shù)的集合A,它的h重求和集hA的可能大小有哪些?

要實現(xiàn)特定大小的求和集,集合的「直徑」最小能是多少?


Nathanson自己給出了一個指數(shù)級的上界:2^k - 1。

于是,Gowers把問題扔給了GPT-5.5 Pro。17分鐘05秒后,AI給出了一個構造,直接把上界從指數(shù)級干到了二次方級。

而這,顯然已經(jīng)是最優(yōu)的了。

更讓人坐不住的,是Gowers在整個過程中扮演的角色。

他沒有給出任何數(shù)學思路,沒有提供關鍵引理,更沒有指出證明方向,

Gowers只是充當了一個「情緒價值提供者」和「排版助手」,給出的提示詞極其簡單——

對,這個想法不錯,試試看能不能成;

把這段推導寫成標準的LaTeX論文格式。


博客中,Gowers在反復強調(diào):提示詞「不包含任何數(shù)學輸入」。

AI走的每一步推理、每一個構造、每一處關鍵轉折,都是它自己想出來的。

僅用了幾個小時,AI就完成了人類可能需要數(shù)月,甚至數(shù)年才能完成的工作。

換句話說,人類頂級數(shù)學家在這場合作中的智力貢獻,約等于0。

AI給出原創(chuàng)想法,震驚MIT博士生

如果故事到這里就結束了,那頂多算是「AI又解了一道數(shù)學題」。

但后面發(fā)生的事情,才真正讓人細思極恐。

Gowers繼續(xù)追問ChatGPT:那一般情況的h呢?這個問題的難度陡然上升。

因為當h=2的時候,數(shù)學家們已完全搞清了所有可能的求和集大小。但對于一般的h,甚至不知道完整的答案是什么。

此前,MIT博士生Isaac Rajagopal已經(jīng)證明了一個指數(shù)級的上界。


Gowers于是讓GPT去看看能不能改進拉Rajagopal的結果。

第一輪GPT思考了16分41秒,把上界從k的指數(shù)級改進到了k^(1/2+ε)的指數(shù)級。

這是對拉Rajagopal工作的「常規(guī)修改」。

第二輪Gowers說,能不能再進一步,搞到多項式級?

GPT思考了13分33秒,表示「有戲」,但需要驗證兩個技術性命題。

Gowers讓它自己驗證,9分12秒后,GPT完成了驗證,并在隨后的31分40秒內(nèi)寫出了完整的預印本論文。


論文地址:https://drive.google.com/file/d/1IkJBcWYz_3J_QGsESBmMa-jrEHAJDcJB/view

最終結果:N(h,k) ≤ O(k^{10h3})——從指數(shù)級,直接躍升到多項式級。


Rajagopal本人看完后,給出了一個讓人五味雜陳的評價:

ChatGPT這個想法很原創(chuàng)、很巧妙。如果是我自己想出來的,我會非常驕傲。

然而,我需要一兩周才能完成的腦力風暴,GPT只用了不到一個小時。


更重磅的是,Rajagopal詳細分析了GPT的核心創(chuàng)新——

它使用了h2-耗散集(h2-dissociated sets)來控制h階以下的關系。「這個思路,據(jù)我所知,完全是原創(chuàng)的」。

不得不說,當一個MIT學生用「我會為這個想法感到驕傲」來評價一個AI的數(shù)學證明時,某種范式轉移已經(jīng)悄然發(fā)生了。

頂級數(shù)學家警告:危機來了

菲爾茲獎得主Gowers沒有停留在「ChatGPT很厲害」的層面,他直接把話題拉到了最尖銳的問題:

博士生怎么辦?

這才是這篇博客真正的重量級炸彈。


在組合數(shù)學領域,有大量論文會提出一系列新的組合參數(shù),并附帶一串未解問題。

這些問題通常不是特別難,它們的價值在于給初入科研的學生提供一個「可以攻克的目標」,讓他們在解決一個「正式的開放問題」中獲得信心和成就感。

但現(xiàn)在,這條路被AI截斷了。Gowers的原話說得很直白:

過去,只要有人提出問題就夠了。

但現(xiàn)在,僅僅被提出是不夠的,它還必須足夠難,難到LLM解決不了。



2026年至今,已有15個Erd?s開放問題被解決,其中11個明確標注了AI的貢獻。

就在幾周前,一個23歲、沒有高等數(shù)學學位的年輕人Liam Price,用GPT-5.4 Pro在80分鐘內(nèi)解決了一個困擾數(shù)學家60年的Erd?s問題。

菲爾茲獎得主陶哲軒親自驗證了這個證明,并將其擴展為一個新理論的起點。


過去需要數(shù)年訓練才能達到的研究能力門檻,正在被AI一夜之間碾平。

Gowers直言,「若是AI在數(shù)學領域以目前這個速度發(fā)展下去,那么我們將很快面臨一場危機」。


對此,OpenAI研究員Sebastien Bubeck深表贊同。


但也有人冷靜指出:這只是一次實驗,不能過度外推。Nathanson的問題雖然是開放問題,但難度未必代表數(shù)學前沿的天花板。

Gowers自己也承認,他「沒有完整答案」,只是在記錄自己的經(jīng)歷。

過去兩年,類似的「AI攻克數(shù)學」敘事出現(xiàn)過好幾次,仔細看都會發(fā)現(xiàn)具體條件限制不少。

但這一次,說話的人是菲爾茲獎得主,他的判斷標準不需要額外背書。


AI數(shù)學加速度,已不可逆轉

把時間線拉長一點就會發(fā)現(xiàn),AI在數(shù)學領域的進步曲線幾乎是垂直的。

2023年,GPT-4做不了大多數(shù)本科數(shù)學題;2024年,o1在數(shù)學競賽中拿到了金牌水平;2025年,o3在前沿研究中開始展現(xiàn)推理能力。


2026年5月,GPT-5.5 Pro獨立完成了博士論文級別的證明。

三年,從本科到博士。

Gowers的實驗揭示了一個臨界點:AI不只是工具了。至少在某些問題上,它已經(jīng)是一個能獨立產(chǎn)出原創(chuàng)結果的研究者。

那些曾經(jīng)需要數(shù)年苦修才能叩開的大門,現(xiàn)在只需要一個提示框和兩個小時。

門檻沒了。但門后面的世界,可能比我們想象的更大,也更陌生。

參考資料:

https://x.com/wtgowers/status/2052830948685676605?s=20

https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
商務部:亞太經(jīng)貿(mào)合作進入更加復雜的深水區(qū) 議題內(nèi)容進一步向數(shù)字經(jīng)濟、綠色低碳、產(chǎn)業(yè)鏈供應鏈韌性等新興領域拓展

商務部:亞太經(jīng)貿(mào)合作進入更加復雜的深水區(qū) 議題內(nèi)容進一步向數(shù)字經(jīng)濟、綠色低碳、產(chǎn)業(yè)鏈供應鏈韌性等新興領域拓展

財聯(lián)社
2026-05-09 15:34:13
科爾2年合同續(xù)約勇士 和庫里師徒二人保持同進退

科爾2年合同續(xù)約勇士 和庫里師徒二人保持同進退

仰臥撐FTUer
2026-05-10 09:47:04
吃蘭州拉面的人為什么越來越少了?網(wǎng)友:進店小心翼翼的怕說錯話

吃蘭州拉面的人為什么越來越少了?網(wǎng)友:進店小心翼翼的怕說錯話

另子維愛讀史
2026-02-27 20:31:34
3次招牌單打收割活塞!阿特金森:這是我熟悉的哈登

3次招牌單打收割活塞!阿特金森:這是我熟悉的哈登

體壇周報
2026-05-10 07:47:12
大反轉還是大陰謀?伊朗的聲音正在越來越高,態(tài)度也越來越強硬

大反轉還是大陰謀?伊朗的聲音正在越來越高,態(tài)度也越來越強硬

譚浩俊
2026-05-10 08:20:34
“斷崖式”下跌37%,黃金首飾賣不動了

“斷崖式”下跌37%,黃金首飾賣不動了

新浪財經(jīng)
2026-05-09 19:19:21
詹姆斯休息22分鐘湖人輸18分!亞歷山大沒上、雷霆贏26分!

詹姆斯休息22分鐘湖人輸18分!亞歷山大沒上、雷霆贏26分!

歷史第一人梅西
2026-05-09 15:31:47
斯威士蘭國王的豪車多,他娶了16個老婆,巴拉圭總統(tǒng)也得了好處

斯威士蘭國王的豪車多,他娶了16個老婆,巴拉圭總統(tǒng)也得了好處

清歡百味
2026-05-09 22:27:24
回國后我才敢說:印尼是我去過的所有東南亞國家中,最被低估的

回國后我才敢說:印尼是我去過的所有東南亞國家中,最被低估的

千秋文化
2026-04-28 20:20:16
大比分3:0!紐約之王布倫森狂轟33分,尼克斯提前鎖定東決席位!

大比分3:0!紐約之王布倫森狂轟33分,尼克斯提前鎖定東決席位!

田先生籃球
2026-05-09 10:29:11
曼聯(lián)重大突破!領跑世界級球星爭奪戰(zhàn),球員本人鐵心要來紅魔

曼聯(lián)重大突破!領跑世界級球星爭奪戰(zhàn),球員本人鐵心要來紅魔

瀾歸序
2026-05-10 01:32:30
“我媽有兩個老公”,OPPO至少惹怒了三群人

“我媽有兩個老公”,OPPO至少惹怒了三群人

萬能的大叔
2026-05-09 00:17:51
懵了,三星市值破萬億=騰訊+阿里巴巴+小米……還把中國大陸家電業(yè)務給停了

懵了,三星市值破萬億=騰訊+阿里巴巴+小米……還把中國大陸家電業(yè)務給停了

新浪財經(jīng)
2026-05-08 15:09:54
10分+致命兩空!胡金秋被罵上熱搜,防守軟蛋+吃餅俠實錘?

10分+致命兩空!胡金秋被罵上熱搜,防守軟蛋+吃餅俠實錘?

劉哥談體育
2026-05-10 09:13:02
內(nèi)娛又曝私生子大瓜,撕開后,全是藏不住的算計和涼薄

內(nèi)娛又曝私生子大瓜,撕開后,全是藏不住的算計和涼薄

財叔
2026-05-10 09:35:06
休想再回國!中國體壇兩大叛徒,奪冠后不承認是國人,報應終到來

休想再回國!中國體壇兩大叛徒,奪冠后不承認是國人,報應終到來

大運河時空
2026-04-27 18:40:03
國防部已經(jīng)發(fā)出最后警告:關于如何處置賴清德,大陸早就想好了!

國防部已經(jīng)發(fā)出最后警告:關于如何處置賴清德,大陸早就想好了!

小曙說娛
2026-05-10 03:57:28
最喜歡的英超對手,薩卡11次對陣西漢姆聯(lián)貢獻5球4助攻

最喜歡的英超對手,薩卡11次對陣西漢姆聯(lián)貢獻5球4助攻

懂球帝
2026-05-10 10:04:05
“天下第一人”河北彩花出道8周年,2026年夏季相約臺北!

“天下第一人”河北彩花出道8周年,2026年夏季相約臺北!

吃瓜黨二號頭目
2026-05-09 10:07:58
曬太陽被關注!醫(yī)生發(fā)現(xiàn):曬得越久,壽命越長?告訴你答案

曬太陽被關注!醫(yī)生發(fā)現(xiàn):曬得越久,壽命越長?告訴你答案

橘子約定
2026-05-09 20:46:06
2026-05-10 10:27:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領航智能+時代
15172文章數(shù) 66854關注度
往期回顧 全部

科技要聞

DeepSeek融資,改寫所有人的估值

頭條要聞

牛彈琴:74歲法國政壇老將對華清醒表態(tài) 讓人刮目相看

頭條要聞

牛彈琴:74歲法國政壇老將對華清醒表態(tài) 讓人刮目相看

體育要聞

成立128年后,這支升班馬首奪頂級聯(lián)賽冠軍

娛樂要聞

50歲趙薇臉頰凹陷滄桑得認不出!

財經(jīng)要聞

白酒大逃殺

汽車要聞

軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

態(tài)度原創(chuàng)

時尚
藝術
手機
家居
軍事航空

越減越胖的人 ,被“0糖0脂”做局了

藝術要聞

母親節(jié) | 16位西方畫家筆下的母愛

手機要聞

iQOO 15T首發(fā)天璣9500特別版:實測幀率無敵 穩(wěn)如泰山

家居要聞

菁英人居 全能豪宅

軍事要聞

美伊突然再次交火 伊朗外長:戰(zhàn)爭準備程度是1000%

無障礙瀏覽 進入關懷版