国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

陶哲軒驚嘆!數(shù)學(xué)奇點(diǎn)初現(xiàn),AI首次給出人類無法企及的原創(chuàng)證明

0
分享至


新智元報(bào)道

編輯:KingHZ 好困

【新智元導(dǎo)讀】數(shù)學(xué)奇點(diǎn)初現(xiàn)!Gemini攻克全新數(shù)學(xué)定理,斯坦福大牛驚呼「想出來能吹一輩子」;陶哲軒預(yù)言數(shù)學(xué)家+AI共生未來;Grok發(fā)現(xiàn)黎曼猜想新的隱蔽通道……

漢語是人類語言的一種。

比特是計(jì)算機(jī)的語言。

而數(shù)學(xué)則是宇宙的語言。

正如「現(xiàn)代物理學(xué)之父」伽利略所言:「要理解宇宙,你必須理解它所書寫的語言——數(shù)學(xué)的語言。」


要測(cè)試人類是否實(shí)現(xiàn)了超級(jí)人工智能ASI,除了數(shù)學(xué),還有誰?

AI在數(shù)學(xué)上的原創(chuàng)能力是通向ASI(甚至理解物理本質(zhì))的必經(jīng)之路,是核心中的核心。

如果說AI斬獲國(guó)際奧數(shù)IMO金牌,你可能對(duì)ASI還有所懷疑——

畢竟,IMO所涉及的知識(shí),還是高中數(shù)學(xué);

畢竟,這類問題人類必有答案;

畢竟,可能只靠記憶力或許也能拿下IMO金牌 ……

但現(xiàn)在不一樣了。

這不是在瞎吹,是菲爾茲獎(jiǎng)得主陶哲軒(Terence Tao)、斯坦福教授兼Ravi Vakil親自蓋章。

谷歌DeepMind的一個(gè)團(tuán)隊(duì),用Gemini證明了一個(gè)代數(shù)幾何領(lǐng)域的全新定理——

注意,是全新的!

不是像以前那樣把人類已知的東西重寫一遍,而是連斯坦福的大牛Ravi Vakil教授都驚呼:

這種優(yōu)雅的洞察力,如果是我自己想出來的,我會(huì)吹一輩子。


對(duì)那些仍對(duì)AI智能存疑的人來說,這樣的成果無疑具有震撼力。

而這還不是唯一的突破。

AI工具已經(jīng)在數(shù)學(xué)領(lǐng)域遍地開花。AI已正式叩響思想創(chuàng)造之門!

浩蕩征程,由此啟程。

陶哲軒預(yù)言:AI或獨(dú)自攻克15-2%的埃爾德什問題。

與此同時(shí),馬斯克的Grok 4.20也不裝了,被曝在5分鐘內(nèi)「秒殺」了困擾教授們?cè)S久的Bellman函數(shù)難題。

這意味著什么?

我們大膽預(yù)測(cè)一下:2026年將是「ASI元年」。人類負(fù)責(zé)定義問題,AI負(fù)責(zé)填補(bǔ)證明的空白。

警報(bào):數(shù)學(xué)界的「奧本海默時(shí)刻」到了?

剛剛,Gemini 證明了一個(gè)代數(shù)幾何領(lǐng)域的新定理。


傳送門:https://arxiv.org/abs/2601.07222

數(shù)學(xué)家Ravi Vakil等四人,發(fā)表的這篇論文標(biāo)題為:THE MOTIVIC CLASS OF THE SPACE OF GENUS 0 MAPS TO THE FLAG VARIETY「旗空間上的虧格零映射的Motivic類」。

這個(gè)問題長(zhǎng)期以來很難下手,而新論文的部分證明推廣了已有框架下的相關(guān)論證方法。

在一個(gè)足夠強(qiáng)、又可計(jì)算的框架里(Grothendieck環(huán)/動(dòng)機(jī)類)給了非常干凈的閉式答案,并且還能導(dǎo)出可直接檢驗(yàn)的有限域點(diǎn)數(shù)公式。

但論文明晃晃寫道:

本論文核心成果的證明過程,正是在谷歌Gemini模型及其相關(guān)工具的大力推動(dòng)下得以實(shí)現(xiàn)的——具體包括DeepThink系統(tǒng),以及由第四作者基于Gemini框架專門開發(fā)的數(shù)學(xué)證明系統(tǒng)(暫定名為FullProof)。


要知道論文的最后署名的作者Ravi Vakil是這方面的專家,這篇論文還參考了他2025年發(fā)表在頂刊《Duke Mathematical Journal》杜克數(shù)學(xué)雜志的文章。

普通讀者可能還沒看明白標(biāo)題是啥,AI都能協(xié)助數(shù)學(xué)家找到新的證明方法了。

不得不感慨:AI與人類天才之間的差距正在縮小。


斯坦福大學(xué)教授、美國(guó)數(shù)學(xué)會(huì)會(huì)長(zhǎng)Ravi Vakil親自認(rèn)證了Gemini提供了關(guān)鍵且獨(dú)創(chuàng)的洞見,給出的證明「嚴(yán)謹(jǐn)、正確,而且優(yōu)雅」:

作為熟悉相關(guān)文獻(xiàn)的人,我認(rèn)為:Gemini 的論證并非對(duì)既有證明的簡(jiǎn)單改寫,而是帶來了真正的洞見。

這種洞見,即使出自我手,我也會(huì)引以為傲。


他甚至表示,他也無法確定最終自己能否獨(dú)自得到這個(gè)結(jié)論。

而這次他最大的收獲是:重要的數(shù)學(xué)進(jìn)展,來自人類智慧與 Gemini 貢獻(xiàn)之間的真實(shí)協(xié)同。


Ravi Vakil的研究對(duì)代數(shù)幾何的許多課題作出了基礎(chǔ)性貢獻(xiàn),包括格羅莫夫-威滕理論、枚舉幾何和舒伯特演算。

去年,Epoch AI報(bào)道過Ravi Vakil教授對(duì)AI的預(yù)計(jì):AI對(duì)數(shù)學(xué)的影響是相變,而不是緩慢的爬坡。


數(shù)學(xué)史上,每次重大變革都令專家措手不及,這一次也不會(huì)例外——區(qū)別只在于,我們所有的預(yù)測(cè)將錯(cuò)得更加徹底。

數(shù)學(xué)奇幻漂流

Grok 4.20發(fā)現(xiàn)平方級(jí)躍升

無獨(dú)有偶,加利福尼亞大學(xué)爾灣分校數(shù)學(xué)系教授Paata Ivanisvili,也提前拿到了Grok 4.20內(nèi)部測(cè)試版的訪問權(quán)限。

這一版本的Grok展現(xiàn)出的驚人數(shù)學(xué)能力,讓教授直呼「好家伙」。


事情是這樣的:

Ivanisvili教授和他的學(xué)生N. Alpay之前正在尋找一個(gè)新的Bellman函數(shù)。

簡(jiǎn)單來說,他們需要在兩個(gè)約束條件下確定逐點(diǎn)最大函數(shù) U(p,q),并搞清楚U(p,0)到底長(zhǎng)什么樣。

經(jīng)過一番「人類大腦」的苦戰(zhàn),他們?cè)谧钚碌恼撐闹型茖?dǎo)出了一個(gè)不錯(cuò)的下界:U(p,0) \geq I(p)。


傳送門:https://arxiv.org/pdf/2502.16045

這里的I(p)是高斯等周輪廓。

當(dāng)p趨近于0時(shí),它的精度大約在 p\sqrt{\log(1/p)} 這個(gè)級(jí)別。

然后,高光時(shí)刻來了。

教授把題目喂給了Grok 4.20。

僅僅過了5分鐘,Grok 就把一個(gè)漂亮的顯式公式甩在了桌上:

U(p,q) = E \sqrt{q^2+\tau}

換句話說就是,Grok 引入了布朗運(yùn)動(dòng)從p點(diǎn)出發(fā)離開 (0,1) 區(qū)間的逃逸時(shí)間(exit time)tau。

通過這個(gè)公式一算,結(jié)果變成了U(p,0) \sim p \log(1/p)。

懂行的朋友可能已經(jīng)發(fā)現(xiàn)了:Grok幫人類把那個(gè)討厭的「根號(hào)」給摘掉了!

這在對(duì)數(shù)因子上實(shí)現(xiàn)了一次實(shí)打?qū)嵉钠椒礁?jí)別飛躍。

這個(gè)公式,在數(shù)學(xué)好奇心的滿足上可謂是價(jià)值連城。它讓我們?cè)诶斫狻覆紶柡瘮?shù)導(dǎo)數(shù)的隨機(jī)模擬究竟能有多小」這件事上,往前邁了一大步。

更確切地說,Grok給出了二進(jìn)平方函數(shù)(dyadic square function)L^1范數(shù)的一個(gè)緊確下界(sharp lower bound)

Ivanisvili教授此前就曾經(jīng)歷過類似的數(shù)學(xué)奇幻漂流:他曾發(fā)現(xiàn)某些下界竟然和高木函數(shù)(Takagi function),甚至大名鼎鼎的黎曼猜想有著神秘的量子糾纏般的聯(lián)系。

而這次Grok挖掘出的新函數(shù),雖然不像高木函數(shù)那樣是分形的,卻是一個(gè)平滑且完美的等周類型輪廓,而且完全不按高斯等周輪廓的套路出牌。

在調(diào)和分析領(lǐng)域,關(guān)于平方函數(shù)如何「發(fā)散」(blow up)的問題一直引人入勝。讓我們看看這張排行榜:

  • 銅牌(前人紀(jì)錄):Burkholder—Davis—Gandy 給出的下界是 |A|(1-|A|)。

  • 銀牌(教授團(tuán)隊(duì)):Ivanisvili 團(tuán)隊(duì)費(fèi)勁心力,把它推進(jìn)到了 |A| (1-|A|)\sqrt{\log(\dots)}的級(jí)別。

  • 金牌(Grok 4.20):AI 給出了 |A| (1-|A|) \log(\dots)。

Grok不僅去掉了根號(hào),更霸氣的是,這個(gè)界被證實(shí)是緊確的(Sharp)。



陶哲軒:AI單挑1%到2%的Erd?s難題

上周末,Neel Somani——一位軟件工程師、前量化研究員、初創(chuàng)公司創(chuàng)始人——在測(cè)試OpenAI最新模型的數(shù)學(xué)能力時(shí),意外發(fā)現(xiàn)了一件令人震驚的事。

他將一道數(shù)學(xué)題貼進(jìn)ChatGPT,離開十五分鐘后回來,竟然發(fā)現(xiàn)模型已經(jīng)寫出了一份完整的證明。他用名為Harmonic的工具將這份推理形式化處理,結(jié)果一切無懈可擊。


自從GPT 5.2發(fā)布以來,Somani注意到一個(gè)趨勢(shì):這代模型在數(shù)學(xué)推理上「肉眼可見地更聰明了」,所解決的問題數(shù)量,也開始變得令人難以忽視。

Somani專注研究的是「Erd?s問題集」——這是一位匈牙利數(shù)學(xué)家留下的1000多個(gè)猜想,目前都被整理在網(wǎng)上。

題目橫跨多個(gè)數(shù)學(xué)分支,難度各異,是AI數(shù)學(xué)能力的絕佳試金石。

早在去年11月,第一批由Gemini驅(qū)動(dòng)的模型AlphaEvolve就已經(jīng)解決了部分難題。而如今,Somani等人發(fā)現(xiàn):GPT 5.2在處理高階數(shù)學(xué)問題時(shí),展現(xiàn)出了驚人的實(shí)力。

從圣誕節(jié)以來,已有15道Erd?s題目從「未解」?fàn)顟B(tài)被改為「已解」,其中11道明確標(biāo)注,AI模型在解題過程中發(fā)揮了關(guān)鍵作用。

知名數(shù)學(xué)家陶哲軒(Terence Tao)也在GitHub上進(jìn)行了更詳細(xì)的追蹤。他

統(tǒng)計(jì)出,目前AI模型在8道Erd?s難題上實(shí)現(xiàn)了「自主推進(jìn)式」的實(shí)質(zhì)性進(jìn)展,還有6道是通過查找和延續(xù)已有研究取得了突破。

雖然距離AI真正實(shí)現(xiàn)「全自動(dòng)數(shù)學(xué)」還有一段距離,但大型模型在數(shù)學(xué)研究中的重要性,已經(jīng)不容忽視。

在Mastodon上,陶哲軒更進(jìn)一步提出「AI擴(kuò)展」猜想:

它們拓展性強(qiáng),非常適合系統(tǒng)性地清理那些「長(zhǎng)尾」的Erd?s難題,其中很多其實(shí)并不復(fù)雜。



「這些相對(duì)容易的Erd?s題目,未來更可能由AI純自主解決,而非人類或人機(jī)合作?!顾a(bǔ)充道。

他個(gè)人猜測(cè),大概在1%到2%目前尚未解決的Erd?s難題中,能在幾乎不依賴人類干預(yù)的情況下,被現(xiàn)有AI工具直接攻克。

AI在數(shù)學(xué)界的「出道」,從一開始就帶著爭(zhēng)議和好奇心。

但現(xiàn)在,它正悄悄扎根在研究最前沿。無論是像Aristotle這樣專為形式化設(shè)計(jì)的AI助手,還是像GPT-5.2這樣通用型、卻在高等數(shù)學(xué)問題上頻頻「開掛」的大模型,它們都在改變我們對(duì)「數(shù)學(xué)探索者」身份的傳統(tǒng)想象。

從某種意義上說,這場(chǎng)變化也不僅僅是技術(shù)性的。

數(shù)學(xué)界素來以謹(jǐn)慎著稱,一項(xiàng)新方法若想獲得主流認(rèn)可,往往需要長(zhǎng)時(shí)間的驗(yàn)證與辯論。

而AI帶來的,不只是「工具變了」,而是整個(gè)研究過程的范式正在被重塑。

參考資料:

1https://x.com/_sholtodouglas/status/2011325979650900396

https://x.com/A_G_I_Joe/status/2011213878395617571

https://x.com/PI010101/status/2011560477688463573

https://techcrunch.com/2026/01/14/ai-models-are-starting-to-crack-high-level-math-problems/

https://mathstodon.xyz/@tao/115891256726420022


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
降息、降首付!降個(gè)稅!2026年的貨幣政策開始啟動(dòng)了

降息、降首付!降個(gè)稅!2026年的貨幣政策開始啟動(dòng)了

櫻桃大房子
2026-01-15 19:38:02
柬埔寨副首相放話:特朗普讓我們驚醒,不能只依靠中國(guó)

柬埔寨副首相放話:特朗普讓我們驚醒,不能只依靠中國(guó)

揚(yáng)子晚報(bào)
2026-01-15 12:30:47
今年第1號(hào)臺(tái)風(fēng)生成!深圳下周將迎“斷崖式”降溫

今年第1號(hào)臺(tái)風(fēng)生成!深圳下周將迎“斷崖式”降溫

魯中晨報(bào)
2026-01-15 21:07:05
加拿大打破核聚變世界紀(jì)錄,為什么令整個(gè)能源行業(yè)震驚?

加拿大打破核聚變世界紀(jì)錄,為什么令整個(gè)能源行業(yè)震驚?

百科密碼
2026-01-15 16:05:03
47歲賀嬌龍去世后續(xù)!好友曝其婚姻現(xiàn)狀,三任老公都離了,沒孩子

47歲賀嬌龍去世后續(xù)!好友曝其婚姻現(xiàn)狀,三任老公都離了,沒孩子

180視角
2026-01-15 13:33:23
16億只是保底,馬斯克想給朱曉彤的是100億

16億只是保底,馬斯克想給朱曉彤的是100億

字母榜
2026-01-15 14:44:13
聶衛(wèi)平曾多次和鄧小平打橋牌:老爺子牌技比我好得多,但出錯(cuò)牌也會(huì)虛心聽取批評(píng)

聶衛(wèi)平曾多次和鄧小平打橋牌:老爺子牌技比我好得多,但出錯(cuò)牌也會(huì)虛心聽取批評(píng)

極目新聞
2026-01-15 15:09:28
電池項(xiàng)目停產(chǎn)、連拉兩日跌停 億晶光電深陷退市危機(jī)

電池項(xiàng)目停產(chǎn)、連拉兩日跌停 億晶光電深陷退市危機(jī)

封面新聞
2026-01-15 16:45:21
水貝現(xiàn)“白銀大劫案”:涉案金額超千萬,“老板沒跑但確實(shí)交不出錢和貨”

水貝現(xiàn)“白銀大劫案”:涉案金額超千萬,“老板沒跑但確實(shí)交不出錢和貨”

藍(lán)鯨新聞
2026-01-15 21:54:10
馬克龍:首批法國(guó)士兵已抵達(dá)格陵蘭島

馬克龍:首批法國(guó)士兵已抵達(dá)格陵蘭島

界面新聞
2026-01-15 20:32:24
痛心!74歲“棋圣”聶衛(wèi)平去世,原因是直腸癌,三婚娶小23歲嬌妻

痛心!74歲“棋圣”聶衛(wèi)平去世,原因是直腸癌,三婚娶小23歲嬌妻

180視角
2026-01-15 09:32:04
賀嬌龍運(yùn)送回家畫面曝光!強(qiáng)撐見家人最后一面,“五杯酒”引熱議

賀嬌龍運(yùn)送回家畫面曝光!強(qiáng)撐見家人最后一面,“五杯酒”引熱議

李健政觀察
2026-01-15 17:24:19
湖北咸寧千名業(yè)主買“包租商鋪”被“套牢”:12年只收到3萬元返利

湖北咸寧千名業(yè)主買“包租商鋪”被“套牢”:12年只收到3萬元返利

封面新聞
2026-01-15 19:37:16
KK園區(qū)被炸后,緬北爆發(fā)“二次招聘潮”,7萬美元搶一個(gè)電詐人才

KK園區(qū)被炸后,緬北爆發(fā)“二次招聘潮”,7萬美元搶一個(gè)電詐人才

諦聽骨語本尊
2026-01-15 12:44:30
原來他就是聶衛(wèi)平長(zhǎng)子,移民日本入日籍娶日本妻,拒絕讓兒子姓聶

原來他就是聶衛(wèi)平長(zhǎng)子,移民日本入日籍娶日本妻,拒絕讓兒子姓聶

以茶帶書
2026-01-15 14:14:27
上海知名主持人已入住養(yǎng)老院!價(jià)格、環(huán)境全公開,是受歡迎的房型

上海知名主持人已入住養(yǎng)老院!價(jià)格、環(huán)境全公開,是受歡迎的房型

墨印齋
2026-01-15 17:49:55
西貝將關(guān)閉102家門店

西貝將關(guān)閉102家門店

財(cái)聯(lián)社
2026-01-15 14:45:06
官媒發(fā)文,官宣與輝同行傳來“噩耗”,網(wǎng)友:董宇輝該何去何從

官媒發(fā)文,官宣與輝同行傳來“噩耗”,網(wǎng)友:董宇輝該何去何從

阿纂看事
2026-01-14 14:24:33
又一個(gè)烏克蘭!全面推動(dòng)去俄化,不準(zhǔn)再叫將軍,只能叫突厥軍銜?

又一個(gè)烏克蘭!全面推動(dòng)去俄化,不準(zhǔn)再叫將軍,只能叫突厥軍銜?

科普100克克
2026-01-15 14:18:27
A股:散戶聽我一句勸,央行下調(diào)利率0.25,明天將出現(xiàn)核彈級(jí)別行情?

A股:散戶聽我一句勸,央行下調(diào)利率0.25,明天將出現(xiàn)核彈級(jí)別行情?

股市皆大事
2026-01-15 16:52:13
2026-01-15 23:04:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14342文章數(shù) 66496關(guān)注度
往期回顧 全部

科技要聞

阿里最狠的一次“自我革命”

頭條要聞

車主稱4S店只賣套餐不給單換:剎車油線下價(jià)是線上3倍

頭條要聞

車主稱4S店只賣套餐不給單換:剎車油線下價(jià)是線上3倍

體育要聞

聶衛(wèi)平:黑白棋盤上的凡人棋圣

娛樂要聞

傳奇棋圣聶衛(wèi)平離世,網(wǎng)友集體悼念

財(cái)經(jīng)要聞

央行再次結(jié)構(gòu)性降息0.25個(gè)百分點(diǎn)

汽車要聞

吉利帝豪/繽越推冠軍一口價(jià) 起售價(jià)4.88萬

態(tài)度原創(chuàng)

時(shí)尚
家居
數(shù)碼
本地
教育

羽絨服+闊腿褲:今年冬天最火搭配,松弛又時(shí)髦!

家居要聞

自在自宅 個(gè)性自由

數(shù)碼要聞

石頭G30S Pro掃地機(jī)器人1月20日上市,越障高度突破8.8cm

本地新聞

云游內(nèi)蒙|黃沙與碧波撞色,烏海天生會(huì)“混搭”

教育要聞

學(xué)習(xí)節(jié)奏亂了,怎么補(bǔ)都白搭

無障礙瀏覽 進(jìn)入關(guān)懷版