国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

陶哲軒驚呼“變天”,AI用6小時(shí)改寫數(shù)學(xué)史

0
分享至

一塊閃亮的數(shù)學(xué)獎(jiǎng)牌,剛剛被寫入代碼的智能體在6小時(shí)內(nèi)摘下,而人類為此思考了30年。

PART 01

AI六小時(shí)破解30年數(shù)學(xué)難題

2025年12月,人工智能領(lǐng)域迎來里程碑事件:Harmonic公司開發(fā)的AI系統(tǒng)“亞里士多德”僅用6小時(shí)便攻克了困擾數(shù)學(xué)界30年的埃爾德什問題#124簡化版。這一突破被學(xué)界稱為“數(shù)學(xué)智能體時(shí)代的開端”,而菲爾茲獎(jiǎng)得主陶哲軒則犀利指出:AI正在高效收割數(shù)學(xué)界的“低垂果實(shí)”,讓人類研究者得以聚焦更具挑戰(zhàn)性的核心問題。



埃爾德什問題#124自1995年提出以來,一直是組合數(shù)論領(lǐng)域的頑固堡壘。其核心命題探討:給定k個(gè)不小于2的自然數(shù)d?,若∑1/(d?-1) ≥ 1,是否所有足夠大的自然數(shù)n都能表示為特定0-1組合的和?這個(gè)看似簡潔的問題,卻讓數(shù)學(xué)家們?cè)谧畲蠊s數(shù)(gcd)約束和邊界案例驗(yàn)證中陷入長達(dá)三十年的僵局。

“亞里士多德”的突破性在于其完全獨(dú)立的證明能力。它采用創(chuàng)新的“vibe proving”方法論,融合強(qiáng)化學(xué)習(xí)與蒙特卡洛樹搜索,在無需人類干預(yù)的情況下遍歷上億種證明路徑,最終輸出100%可驗(yàn)證的定理。整個(gè)過程僅耗時(shí)6小時(shí),而通過Lean形式化驗(yàn)證系統(tǒng)的檢驗(yàn)只需1分鐘。



耐人尋味的是,當(dāng)通用AI巨頭ChatGPT和Gemini面對(duì)同一問題時(shí),卻集體“折戟”。陶哲軒分析指出:Gemini僅能給出排除數(shù)字1后gcd條件成為必要的基礎(chǔ)觀察;ChatGPT則表現(xiàn)出明顯的“路徑依賴”,大量引用已有網(wǎng)頁和論文,未能提出原創(chuàng)性觀點(diǎn)。

這種差異揭示了專業(yè)AI與通用AI的本質(zhì)分野——當(dāng)“亞里士多德”被設(shè)計(jì)為“邏輯工匠”,基于形式邏輯生成可驗(yàn)證代碼時(shí),ChatGPT類模型仍是“猜詞機(jī)器”,依賴統(tǒng)計(jì)概率生成文本。

PART 02

“人機(jī)協(xié)同”的科研革命

陶哲軒將數(shù)學(xué)未解問題的分布描述為“長尾特征”。大多數(shù)難題并非超高難度,而是因人類數(shù)學(xué)家資源有限而被擱置的“低垂果實(shí)”。AI的自動(dòng)化能力恰恰擅長處理這類問題。



在埃爾德什問題網(wǎng)站上,“未解”標(biāo)簽最近減少了近十個(gè),這并非因?yàn)槿祟愅蝗唤鉀Q了這些問題,而是AI通過文獻(xiàn)檢索發(fā)現(xiàn)它們?cè)缫驯还タ?。這種現(xiàn)象揭示了AI作為“清道夫”的價(jià)值——它能清理最容易解決的問題,讓人類聚焦于真正具有挑戰(zhàn)性的核心難題。

HarmonicMath創(chuàng)始人Vlad Tenev提出的“Vibe證明時(shí)代”已經(jīng)到來。這一概念意味著AI不僅能輔助驗(yàn)證,還能獨(dú)立創(chuàng)造。在數(shù)學(xué)領(lǐng)域,這種變革尤為深刻,因?yàn)閿?shù)學(xué)的形式化特性使其非常適合AI參與。



微軟前AI副總裁Sebastien Bubeck激動(dòng)地分享道:“該解決方案100%由AI生成,總計(jì)耗時(shí)6小時(shí)?!边@一效率與人類數(shù)學(xué)家30年的掙扎形成鮮明對(duì)比,凸顯了AI在科研效率方面的革命性提升。

PART 03

AI當(dāng)前局限與信息學(xué)學(xué)生的不可替代性

盡管“亞里士多德”取得了突破,但它解決的是原問題的簡化版本。原版埃爾德什問題#124不允許使用數(shù)字1且需要滿足額外的最小公約數(shù)條件,這一更復(fù)雜的版本仍有待解決。

AI在數(shù)學(xué)推理中面臨的主要挑戰(zhàn)之一是“超長推理鏈”問題。高中數(shù)學(xué)證明可能只需10到40步,而像黎曼猜想這樣的難題,證明路徑可能長達(dá)百萬步。美國加州理工學(xué)院的謝爾蓋·古科夫指出,這類超長路徑極難處理,AI必須在指數(shù)級(jí)增長的可能路徑中找到正確解法。



DeepMind的AlphaProof和AlphaGeometry2在國際奧數(shù)競賽中表現(xiàn)出色,但專家們普遍認(rèn)為,它們?nèi)匀狈φ嬲臄?shù)學(xué)洞察力。競賽題有一定“套路”,而真正的數(shù)學(xué)研究更開放、復(fù)雜。初創(chuàng)公司Epoch AI的FrontierMath測試顯示,面對(duì)全新技術(shù)難題,LLM幾乎集體“交白卷”。

數(shù)學(xué)家董彬指出,AI在數(shù)學(xué)研究中的理想角色是“AI學(xué)徒”——用訓(xùn)練數(shù)學(xué)家的方式培養(yǎng)AI助手。但目前,AI更適用于“單點(diǎn)突破”,從局部解決某些具體問題,而非全面替代人類直覺和創(chuàng)造力。

PART 04

信息學(xué)學(xué)生的四維能力重構(gòu)

當(dāng)AI開始收割數(shù)學(xué)“低垂果實(shí)”,信息學(xué)學(xué)生亟需重構(gòu)能力模型,在以下四個(gè)維度建立新優(yōu)勢:

人機(jī)協(xié)同的架構(gòu)思維——“亞里士多德”的成功源于其專業(yè)定位——與通用大模型不同,它專為數(shù)學(xué)證明設(shè)計(jì),融合強(qiáng)化學(xué)習(xí)、蒙特卡洛樹搜索與Lean形式化語言。這種“領(lǐng)域?qū)S弥悄堋奔軜?gòu)思維值得信息學(xué)學(xué)生深入學(xué)習(xí)。正如DeepSeek-V3.2-Speciale模型展現(xiàn)的,通過融合定理證明能力,專業(yè)模型在IMO、ICPC等賽事中已超越多數(shù)人類選手。

形式化驗(yàn)證的必備技能——Lean證明系統(tǒng)的應(yīng)用標(biāo)志著數(shù)學(xué)驗(yàn)證進(jìn)入程序化時(shí)代。信息學(xué)學(xué)生需掌握形式化驗(yàn)證工具,將自然語言證明轉(zhuǎn)化為機(jī)器可驗(yàn)證代碼。這不僅是防范AI幻覺的有效手段,更是未來科研協(xié)作的基礎(chǔ)能力。埃爾德什#124的證明在GitHub公開后,全球研究者均可參與驗(yàn)證與拓展(github.com/plby/lean-proofs)。

直覺引導(dǎo)的算法設(shè)計(jì)——當(dāng)前AI在依賴性質(zhì)觀察與解題直覺的題目上仍存在明顯局限。如AlphaProof解決3個(gè)IMO問題耗時(shí)3天,而人類選手僅需4.5小時(shí)。信息學(xué)學(xué)生應(yīng)強(qiáng)化元認(rèn)知能力,在AI陷入局部最優(yōu)時(shí)提供方向性指導(dǎo),這正是人類思維不可替代的核心價(jià)值——正如PatternBoost AI系統(tǒng)開發(fā)者所言:“探索性思維是數(shù)學(xué)的核心”。

問題發(fā)現(xiàn)的戰(zhàn)略眼光——倫敦?cái)?shù)學(xué)科學(xué)研究所何楊輝指出:AI能幫助證明問題,卻無法幫助確定需要解決的關(guān)鍵問題。信息學(xué)學(xué)生需培養(yǎng)科學(xué)發(fā)現(xiàn)的前瞻力,在AI清理“低垂果實(shí)”后,精準(zhǔn)識(shí)別真正值得攻堅(jiān)的“數(shù)學(xué)高峰”。這種能力建立在對(duì)學(xué)科發(fā)展脈絡(luò)的深刻理解與跨領(lǐng)域知識(shí)融合基礎(chǔ)上。

PART 05

教育轉(zhuǎn)型:從工具使用者到智能體架構(gòu)師

面對(duì)AI的沖擊,信息學(xué)教育正在經(jīng)歷范式轉(zhuǎn)變。2025年CNCC論壇達(dá)成共識(shí):信息學(xué)奧賽應(yīng)繼續(xù)堅(jiān)持以計(jì)算思維培養(yǎng)為核心,同時(shí)更加重視學(xué)生發(fā)現(xiàn)問題和提出問題的能力。微軟前AI副總裁塞巴斯蒂安·布貝克激動(dòng)地分享AI攻克埃爾德什難題的消息時(shí),強(qiáng)調(diào)“解決方案100%由AI生成”。



但走進(jìn)普林斯頓高等研究院,數(shù)學(xué)家們已在全新實(shí)驗(yàn)室工作:人類提出大膽猜想,AI負(fù)責(zé)驗(yàn)證與反例生成;人類構(gòu)建理論框架,AI完成繁瑣計(jì)算;人類捕捉靈感火花,AI將其轉(zhuǎn)化為嚴(yán)謹(jǐn)證明。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
張雪掀了陳光標(biāo)底褲

張雪掀了陳光標(biāo)底褲

言立方
2026-04-03 18:24:14
上海那五萬日本僑民要睡不著了,不是因?yàn)閼?zhàn)爭,而是因?yàn)槿毡菊?>
    </a>
        <h3>
      <a href=潮鹿逐夢(mèng)
2026-04-02 17:03:00
2012年一伙歹徒劫機(jī),快得手時(shí),有女乘客大吼一聲,結(jié)局意想不到

2012年一伙歹徒劫機(jī),快得手時(shí),有女乘客大吼一聲,結(jié)局意想不到

阿胡
2025-04-07 16:04:09
快訊!美軍地面部隊(duì)遲遲不入場的原因終于找到了!

快訊!美軍地面部隊(duì)遲遲不入場的原因終于找到了!

達(dá)文西看世界
2026-04-03 19:59:09
2年和領(lǐng)導(dǎo)開房410次!從臨時(shí)工“睡”成處長,南航女經(jīng)理升遷之路

2年和領(lǐng)導(dǎo)開房410次!從臨時(shí)工“睡”成處長,南航女經(jīng)理升遷之路

就一點(diǎn)
2026-03-28 17:42:50
13.9萬起!豐田官宣:新車首次降價(jià)

13.9萬起!豐田官宣:新車首次降價(jià)

高科技愛好者
2026-04-02 23:20:08
這就是回家要脫褲子才能上床的原因!網(wǎng)友:看完天都塌了!

這就是回家要脫褲子才能上床的原因!網(wǎng)友:看完天都塌了!

夜深愛雜談
2026-02-07 19:05:55
月交付不足800臺(tái)!尊界S800要從“遙遙領(lǐng)先”變成“遙遙無期”?

月交付不足800臺(tái)!尊界S800要從“遙遙領(lǐng)先”變成“遙遙無期”?

三農(nóng)老歷
2026-04-03 14:48:32
沒想到,李榮浩心中這口惡氣竟讓人民日?qǐng)?bào)給出了,網(wǎng)友:就該封殺

沒想到,李榮浩心中這口惡氣竟讓人民日?qǐng)?bào)給出了,網(wǎng)友:就該封殺

樂天閑聊
2026-04-03 05:35:52
與輝同行:深表歉意,全額退款

與輝同行:深表歉意,全額退款

魯中晨報(bào)
2026-04-02 22:01:03
A股為何“獨(dú)立”下跌?超過4700家下跌,A股只剩“光”了

A股為何“獨(dú)立”下跌?超過4700家下跌,A股只?!肮狻绷?/a>

看財(cái)經(jīng)show
2026-04-03 17:27:08
美國苦尋30年的寶貝,被中國漁民一網(wǎng)撈起,想要回去?我國霸氣回應(yīng)讓他們閉嘴

美國苦尋30年的寶貝,被中國漁民一網(wǎng)撈起,想要回去?我國霸氣回應(yīng)讓他們閉嘴

文史明鑒
2026-03-10 19:50:15
中年群體猝死事件刷屏!網(wǎng)友建議:別再裸睡,萬一猝死太不體面

中年群體猝死事件刷屏!網(wǎng)友建議:別再裸睡,萬一猝死太不體面

火山詩話
2026-04-01 13:23:12
西班牙宣布與以色列斷絕外交關(guān)系。

西班牙宣布與以色列斷絕外交關(guān)系。

阿七說史
2026-04-01 15:51:46
美情報(bào)機(jī)構(gòu)評(píng)估伊朗仍有約半數(shù)導(dǎo)彈發(fā)射裝置完好

美情報(bào)機(jī)構(gòu)評(píng)估伊朗仍有約半數(shù)導(dǎo)彈發(fā)射裝置完好

看看新聞Knews
2026-04-03 22:47:01
巴菲特和比爾蓋茨,絕交了!2.5萬億現(xiàn)金抄底股市

巴菲特和比爾蓋茨,絕交了!2.5萬億現(xiàn)金抄底股市

和訊網(wǎng)
2026-04-03 17:00:06
西班牙首相談反穆斯林口號(hào):少數(shù)球迷行為玷污了西班牙的形象

西班牙首相談反穆斯林口號(hào):少數(shù)球迷行為玷污了西班牙的形象

懂球帝
2026-04-03 11:00:09
許家印,在恒大王國里,過足了官癮、錢癮、色癮,金蟬脫殼玩死了

許家印,在恒大王國里,過足了官癮、錢癮、色癮,金蟬脫殼玩死了

歷史偉人錄
2026-04-01 17:55:34
戰(zhàn)功赫赫的紅軍軍團(tuán)長,整編時(shí)竟無人愿收,主席震怒直言純屬瞎胡鬧

戰(zhàn)功赫赫的紅軍軍團(tuán)長,整編時(shí)竟無人愿收,主席震怒直言純屬瞎胡鬧

磊子講史
2026-03-30 15:41:41
就當(dāng)個(gè)“波濤洶涌”的爬山者

就當(dāng)個(gè)“波濤洶涌”的爬山者

飛娛日記
2026-03-28 07:06:50
2026-04-03 23:16:49
電腦報(bào)少年派 incentive-icons
電腦報(bào)少年派
最新鮮的互聯(lián)網(wǎng)產(chǎn)業(yè)資訊
3919文章數(shù) 1602關(guān)注度
往期回顧 全部

科技要聞

5萬輛庫存車,給了特斯拉一記重拳

頭條要聞

伊朗:美飛行員跳傘在伊境內(nèi)落地 美方曾試圖營救未果

頭條要聞

伊朗:美飛行員跳傘在伊境內(nèi)落地 美方曾試圖營救未果

體育要聞

被NBA選中20年后,他重新回到籃球場

娛樂要聞

夏克立官宣再婚當(dāng)爸?否認(rèn)婚內(nèi)出軌

財(cái)經(jīng)要聞

專家稱長期攝入“飄香劑”存在健康隱患

汽車要聞

你介意和遠(yuǎn)房親戚長得很像嗎?

態(tài)度原創(chuàng)

房產(chǎn)
數(shù)碼
本地
手機(jī)
公開課

房產(chǎn)要聞

小陽春全面啟動(dòng)!現(xiàn)房,才是這波行情里最穩(wěn)的上車票

數(shù)碼要聞

52位專家選出十大顯示突破技術(shù),海信RGB-Mini LED成大屏液晶顯示技術(shù)唯一

本地新聞

跟著歌聲游安徽,聽古村回響

手機(jī)要聞

告別擠牙膏:華為Pura 90全系直屏+漸變色,影像堆料不留后路

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版