国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

陶哲軒驚嘆!數(shù)學(xué)奇點初現(xiàn),AI首次給出人類無法企及的原創(chuàng)證明

0
分享至


新智元報道

編輯:KingHZ 好困

【新智元導(dǎo)讀】數(shù)學(xué)奇點初現(xiàn)!Gemini攻克全新數(shù)學(xué)定理,斯坦福大牛驚呼「想出來能吹一輩子」;陶哲軒預(yù)言數(shù)學(xué)家+AI共生未來;Grok發(fā)現(xiàn)黎曼猜想新的隱蔽通道……

漢語是人類語言的一種。

比特是計算機的語言。

而數(shù)學(xué)則是宇宙的語言。

正如「現(xiàn)代物理學(xué)之父」伽利略所言:「要理解宇宙,你必須理解它所書寫的語言——數(shù)學(xué)的語言?!?/p>


要測試人類是否實現(xiàn)了超級人工智能ASI,除了數(shù)學(xué),還有誰?

AI在數(shù)學(xué)上的原創(chuàng)能力是通向ASI(甚至理解物理本質(zhì))的必經(jīng)之路,是核心中的核心。

如果說AI斬獲國際奧數(shù)IMO金牌,你可能對ASI還有所懷疑——

畢竟,IMO所涉及的知識,還是高中數(shù)學(xué);

畢竟,這類問題人類必有答案;

畢竟,可能只靠記憶力或許也能拿下IMO金牌 ……

但現(xiàn)在不一樣了。

這不是在瞎吹,是菲爾茲獎得主陶哲軒(Terence Tao)、斯坦福教授兼Ravi Vakil親自蓋章。

谷歌DeepMind的一個團隊,用Gemini證明了一個代數(shù)幾何領(lǐng)域的全新定理——

注意,是全新的!

不是像以前那樣把人類已知的東西重寫一遍,而是連斯坦福的大牛Ravi Vakil教授都驚呼:

這種優(yōu)雅的洞察力,如果是我自己想出來的,我會吹一輩子。


對那些仍對AI智能存疑的人來說,這樣的成果無疑具有震撼力。

而這還不是唯一的突破。

AI工具已經(jīng)在數(shù)學(xué)領(lǐng)域遍地開花。AI已正式叩響思想創(chuàng)造之門!

浩蕩征程,由此啟程。

陶哲軒預(yù)言:AI或獨自攻克15-2%的埃爾德什問題。

與此同時,馬斯克的Grok 4.20也不裝了,被曝在5分鐘內(nèi)「秒殺」了困擾教授們許久的Bellman函數(shù)難題。

這意味著什么?

我們大膽預(yù)測一下:2026年將是「ASI元年」。人類負責(zé)定義問題,AI負責(zé)填補證明的空白。

警報:數(shù)學(xué)界的「奧本海默時刻」到了?

剛剛,Gemini 證明了一個代數(shù)幾何領(lǐng)域的新定理。


傳送門:https://arxiv.org/abs/2601.07222

數(shù)學(xué)家Ravi Vakil等四人,發(fā)表的這篇論文標題為:THE MOTIVIC CLASS OF THE SPACE OF GENUS 0 MAPS TO THE FLAG VARIETY「旗空間上的虧格零映射的Motivic類」。

這個問題長期以來很難下手,而新論文的部分證明推廣了已有框架下的相關(guān)論證方法。

在一個足夠強、又可計算的框架里(Grothendieck環(huán)/動機類)給了非常干凈的閉式答案,并且還能導(dǎo)出可直接檢驗的有限域點數(shù)公式。

但論文明晃晃寫道:

本論文核心成果的證明過程,正是在谷歌Gemini模型及其相關(guān)工具的大力推動下得以實現(xiàn)的——具體包括DeepThink系統(tǒng),以及由第四作者基于Gemini框架專門開發(fā)的數(shù)學(xué)證明系統(tǒng)(暫定名為FullProof)。


要知道論文的最后署名的作者Ravi Vakil是這方面的專家,這篇論文還參考了他2025年發(fā)表在頂刊《Duke Mathematical Journal》杜克數(shù)學(xué)雜志的文章。

普通讀者可能還沒看明白標題是啥,AI都能協(xié)助數(shù)學(xué)家找到新的證明方法了。

不得不感慨:AI與人類天才之間的差距正在縮小。


斯坦福大學(xué)教授、美國數(shù)學(xué)會會長Ravi Vakil親自認證了Gemini提供了關(guān)鍵且獨創(chuàng)的洞見,給出的證明「嚴謹、正確,而且優(yōu)雅」:

作為熟悉相關(guān)文獻的人,我認為:Gemini 的論證并非對既有證明的簡單改寫,而是帶來了真正的洞見。

這種洞見,即使出自我手,我也會引以為傲。


他甚至表示,他也無法確定最終自己能否獨自得到這個結(jié)論。

而這次他最大的收獲是:重要的數(shù)學(xué)進展,來自人類智慧與 Gemini 貢獻之間的真實協(xié)同。


Ravi Vakil的研究對代數(shù)幾何的許多課題作出了基礎(chǔ)性貢獻,包括格羅莫夫-威滕理論、枚舉幾何和舒伯特演算。

去年,Epoch AI報道過Ravi Vakil教授對AI的預(yù)計:AI對數(shù)學(xué)的影響是相變,而不是緩慢的爬坡。


數(shù)學(xué)史上,每次重大變革都令專家措手不及,這一次也不會例外——區(qū)別只在于,我們所有的預(yù)測將錯得更加徹底。

數(shù)學(xué)奇幻漂流

Grok 4.20發(fā)現(xiàn)平方級躍升

無獨有偶,加利福尼亞大學(xué)爾灣分校數(shù)學(xué)系教授Paata Ivanisvili,也提前拿到了Grok 4.20內(nèi)部測試版的訪問權(quán)限。

這一版本的Grok展現(xiàn)出的驚人數(shù)學(xué)能力,讓教授直呼「好家伙」。


事情是這樣的:

Ivanisvili教授和他的學(xué)生N. Alpay之前正在尋找一個新的Bellman函數(shù)。

簡單來說,他們需要在兩個約束條件下確定逐點最大函數(shù) U(p,q),并搞清楚U(p,0)到底長什么樣。

經(jīng)過一番「人類大腦」的苦戰(zhàn),他們在最新的論文中推導(dǎo)出了一個不錯的下界:U(p,0) \geq I(p)。


傳送門:https://arxiv.org/pdf/2502.16045

這里的I(p)是高斯等周輪廓。

當p趨近于0時,它的精度大約在 p\sqrt{\log(1/p)} 這個級別。

然后,高光時刻來了。

教授把題目喂給了Grok 4.20。

僅僅過了5分鐘,Grok 就把一個漂亮的顯式公式甩在了桌上:

U(p,q) = E \sqrt{q^2+\tau}

換句話說就是,Grok 引入了布朗運動從p點出發(fā)離開 (0,1) 區(qū)間的逃逸時間(exit time)tau。

通過這個公式一算,結(jié)果變成了U(p,0) \sim p \log(1/p)。

懂行的朋友可能已經(jīng)發(fā)現(xiàn)了:Grok幫人類把那個討厭的「根號」給摘掉了!

這在對數(shù)因子上實現(xiàn)了一次實打?qū)嵉钠椒礁墑e飛躍。

這個公式,在數(shù)學(xué)好奇心的滿足上可謂是價值連城。它讓我們在理解「布爾函數(shù)導(dǎo)數(shù)的隨機模擬究竟能有多小」這件事上,往前邁了一大步。

更確切地說,Grok給出了二進平方函數(shù)(dyadic square function)L^1范數(shù)的一個緊確下界(sharp lower bound)

Ivanisvili教授此前就曾經(jīng)歷過類似的數(shù)學(xué)奇幻漂流:他曾發(fā)現(xiàn)某些下界竟然和高木函數(shù)(Takagi function),甚至大名鼎鼎的黎曼猜想有著神秘的量子糾纏般的聯(lián)系。

而這次Grok挖掘出的新函數(shù),雖然不像高木函數(shù)那樣是分形的,卻是一個平滑且完美的等周類型輪廓,而且完全不按高斯等周輪廓的套路出牌。

在調(diào)和分析領(lǐng)域,關(guān)于平方函數(shù)如何「發(fā)散」(blow up)的問題一直引人入勝。讓我們看看這張排行榜:

  • 銅牌(前人紀錄):Burkholder—Davis—Gandy 給出的下界是 |A|(1-|A|)。

  • 銀牌(教授團隊):Ivanisvili 團隊費勁心力,把它推進到了 |A| (1-|A|)\sqrt{\log(\dots)}的級別。

  • 金牌(Grok 4.20):AI 給出了 |A| (1-|A|) \log(\dots)。

Grok不僅去掉了根號,更霸氣的是,這個界被證實是緊確的(Sharp)。



陶哲軒:AI單挑1%到2%的Erd?s難題

上周末,Neel Somani——一位軟件工程師、前量化研究員、初創(chuàng)公司創(chuàng)始人——在測試OpenAI最新模型的數(shù)學(xué)能力時,意外發(fā)現(xiàn)了一件令人震驚的事。

他將一道數(shù)學(xué)題貼進ChatGPT,離開十五分鐘后回來,竟然發(fā)現(xiàn)模型已經(jīng)寫出了一份完整的證明。他用名為Harmonic的工具將這份推理形式化處理,結(jié)果一切無懈可擊。


自從GPT 5.2發(fā)布以來,Somani注意到一個趨勢:這代模型在數(shù)學(xué)推理上「肉眼可見地更聰明了」,所解決的問題數(shù)量,也開始變得令人難以忽視。

Somani專注研究的是「Erd?s問題集」——這是一位匈牙利數(shù)學(xué)家留下的1000多個猜想,目前都被整理在網(wǎng)上。

題目橫跨多個數(shù)學(xué)分支,難度各異,是AI數(shù)學(xué)能力的絕佳試金石。

早在去年11月,第一批由Gemini驅(qū)動的模型AlphaEvolve就已經(jīng)解決了部分難題。而如今,Somani等人發(fā)現(xiàn):GPT 5.2在處理高階數(shù)學(xué)問題時,展現(xiàn)出了驚人的實力。

從圣誕節(jié)以來,已有15道Erd?s題目從「未解」狀態(tài)被改為「已解」,其中11道明確標注,AI模型在解題過程中發(fā)揮了關(guān)鍵作用。

知名數(shù)學(xué)家陶哲軒(Terence Tao)也在GitHub上進行了更詳細的追蹤。他

統(tǒng)計出,目前AI模型在8道Erd?s難題上實現(xiàn)了「自主推進式」的實質(zhì)性進展,還有6道是通過查找和延續(xù)已有研究取得了突破。

雖然距離AI真正實現(xiàn)「全自動數(shù)學(xué)」還有一段距離,但大型模型在數(shù)學(xué)研究中的重要性,已經(jīng)不容忽視。

在Mastodon上,陶哲軒更進一步提出「AI擴展」猜想:

它們拓展性強,非常適合系統(tǒng)性地清理那些「長尾」的Erd?s難題,其中很多其實并不復(fù)雜。



「這些相對容易的Erd?s題目,未來更可能由AI純自主解決,而非人類或人機合作。」他補充道。

他個人猜測,大概在1%到2%目前尚未解決的Erd?s難題中,能在幾乎不依賴人類干預(yù)的情況下,被現(xiàn)有AI工具直接攻克。

AI在數(shù)學(xué)界的「出道」,從一開始就帶著爭議和好奇心。

但現(xiàn)在,它正悄悄扎根在研究最前沿。無論是像Aristotle這樣專為形式化設(shè)計的AI助手,還是像GPT-5.2這樣通用型、卻在高等數(shù)學(xué)問題上頻頻「開掛」的大模型,它們都在改變我們對「數(shù)學(xué)探索者」身份的傳統(tǒng)想象。

從某種意義上說,這場變化也不僅僅是技術(shù)性的。

數(shù)學(xué)界素來以謹慎著稱,一項新方法若想獲得主流認可,往往需要長時間的驗證與辯論。

而AI帶來的,不只是「工具變了」,而是整個研究過程的范式正在被重塑。

參考資料:

1https://x.com/_sholtodouglas/status/2011325979650900396

https://x.com/A_G_I_Joe/status/2011213878395617571

https://x.com/PI010101/status/2011560477688463573

https://techcrunch.com/2026/01/14/ai-models-are-starting-to-crack-high-level-math-problems/

https://mathstodon.xyz/@tao/115891256726420022


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
美國與中國大陸將協(xié)議兩岸統(tǒng)一!

美國與中國大陸將協(xié)議兩岸統(tǒng)一!

雪中風(fēng)車
2026-01-13 20:33:50
舉報楊貴妃露胸的,來看看這些古代裸體

舉報楊貴妃露胸的,來看看這些古代裸體

聽風(fēng)聽你
2026-01-14 19:44:04
四川:多個“萬人刨豬湯”活動相繼宣布取消

四川:多個“萬人刨豬湯”活動相繼宣布取消

看看新聞Knews
2026-01-15 13:17:11
華為鴻蒙后悔藥來了!官方確認可回退4.3版本,你的機型在列嗎?

華為鴻蒙后悔藥來了!官方確認可回退4.3版本,你的機型在列嗎?

小8說科技
2026-01-15 12:15:03
最高9.4分!這5部黃暴美劇,值得通宵去看

最高9.4分!這5部黃暴美劇,值得通宵去看

來看美劇
2026-01-15 22:21:21
你是怎么發(fā)現(xiàn)好朋友家里很有錢的?看完網(wǎng)友分享,評論區(qū)笑麻了

你是怎么發(fā)現(xiàn)好朋友家里很有錢的?看完網(wǎng)友分享,評論區(qū)笑麻了

夜深愛雜談
2026-01-14 19:31:52
"崩老頭"火了!年輕女性在網(wǎng)上釣中年男性,索要小額紅包節(jié)日大紅包

"崩老頭"火了!年輕女性在網(wǎng)上釣中年男性,索要小額紅包節(jié)日大紅包

互聯(lián)網(wǎng)大觀
2025-12-12 15:14:03
“抵制日貨”的聲音為什么消失了?答案殘酷:日貨已經(jīng)不夠格了

“抵制日貨”的聲音為什么消失了?答案殘酷:日貨已經(jīng)不夠格了

跳跳歷史
2025-12-29 12:20:25
烏克蘭國防部證實,葉爾馬克沒有聯(lián)系任何征兵機構(gòu),也沒有入伍

烏克蘭國防部證實,葉爾馬克沒有聯(lián)系任何征兵機構(gòu),也沒有入伍

山河路口
2026-01-15 18:01:44
已提前做最壞準備,面對伊朗變局,中國或隨時準備北上波斯灣

已提前做最壞準備,面對伊朗變局,中國或隨時準備北上波斯灣

通文知史
2026-01-14 18:00:03
羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

瓜汁橘長Dr
2025-12-29 11:29:56
上海男籃40分大勝廣東男籃,難以概括今天的大鯊魚有多強,自己點進來看吧!

上海男籃40分大勝廣東男籃,難以概括今天的大鯊魚有多強,自己點進來看吧!

五星體育
2026-01-15 22:08:12
你敢信?統(tǒng)一臺灣的關(guān)鍵人物,可能已經(jīng)出現(xiàn)了!

你敢信?統(tǒng)一臺灣的關(guān)鍵人物,可能已經(jīng)出現(xiàn)了!

鶴羽說個事
2026-01-14 15:37:05
外媒:烏前總理季莫申科所在政黨辦公室突遭整夜搜查

外媒:烏前總理季莫申科所在政黨辦公室突遭整夜搜查

參考消息
2026-01-14 22:08:06
華為降價,一場精準的降維狙擊

華為降價,一場精準的降維狙擊

ZAKER新聞
2026-01-13 18:59:28
名記:博納諾特離隊后,埃蘇戈將頂替其在歐冠名單中的位置

名記:博納諾特離隊后,埃蘇戈將頂替其在歐冠名單中的位置

懂球帝
2026-01-16 00:05:06
烏軍去年傷亡減少13%,19名俄軍將軍死亡,1名俄軍“英雄”的故事

烏軍去年傷亡減少13%,19名俄軍將軍死亡,1名俄軍“英雄”的故事

鷹眼Defence
2026-01-15 16:34:30
雙胞胎傳聞僅1個月,49歲陳坤又變樣了,大兒子生母原來早已揭曉

雙胞胎傳聞僅1個月,49歲陳坤又變樣了,大兒子生母原來早已揭曉

動物奇奇怪怪
2026-01-13 00:33:35
參議院準許川普繼續(xù)打委、為打伊鋪平道路,或同時動格陵蘭或先動

參議院準許川普繼續(xù)打委、為打伊鋪平道路,或同時動格陵蘭或先動

邵旭峰域
2026-01-15 12:22:50
原來秦嵐年輕時的小腳丫這么水靈

原來秦嵐年輕時的小腳丫這么水靈

陳意小可愛
2026-01-14 12:11:51
2026-01-16 00:48:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14342文章數(shù) 66498關(guān)注度
往期回顧 全部

科技要聞

阿里最狠的一次“自我革命”

頭條要聞

柬埔寨副首相放話:特朗普讓我們醒悟 不能只依靠中國

頭條要聞

柬埔寨副首相放話:特朗普讓我們醒悟 不能只依靠中國

體育要聞

聶衛(wèi)平:黑白棋盤上的凡人棋圣

娛樂要聞

92歲陶玉玲去世,馮遠征曹可凡悼念

財經(jīng)要聞

央行再次結(jié)構(gòu)性降息0.25個百分點

汽車要聞

吉利帝豪/繽越推冠軍一口價 起售價4.88萬

態(tài)度原創(chuàng)

家居
藝術(shù)
房產(chǎn)
公開課
軍事航空

家居要聞

自在自宅 個性自由

藝術(shù)要聞

300億!341米!迪拜將建全球首個奔馳品牌城市

房產(chǎn)要聞

突發(fā)!商業(yè)用房購房貸款最低首付比例下調(diào)至30%

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國已正式開始出售委內(nèi)瑞拉石油

無障礙瀏覽 進入關(guān)懷版