国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

陶哲軒力推AlphaEvolve:解決67個不同數(shù)學(xué)問題,多個難題中超越人類最優(yōu)解

0
分享至

陶哲軒又來安利AlphaEvolve了。

在與DeepMind高級工程師Bogdan Georgiev等人合著的新論文中,陶哲軒稱其為數(shù)學(xué)發(fā)現(xiàn)的有力新工具。


具體來說,他們用AlphaEvolve研究了67個數(shù)學(xué)問題,涵蓋組合數(shù)學(xué)、幾何、數(shù)學(xué)分析與數(shù)論等多個領(lǐng)域。


結(jié)果發(fā)現(xiàn),AlphaEvolve在可擴展性、魯棒性、可解釋性方面均優(yōu)于傳統(tǒng)工具。

更關(guān)鍵的是,AlphaEvolve已經(jīng)可以自主發(fā)現(xiàn)新穎的數(shù)學(xué)構(gòu)造,并在部分問題上超越人類已有的最優(yōu)結(jié)果。

AI自主發(fā)現(xiàn)新數(shù)學(xué)構(gòu)造

AlphaEvolve在67個問題的測試中,不僅復(fù)現(xiàn)了眾多已知最優(yōu)解,更在多個方面展現(xiàn)了其獨特的發(fā)現(xiàn)能力。

一個關(guān)鍵的成就是AlphaEvolve能夠自主發(fā)現(xiàn)人類未曾一窺的新數(shù)學(xué)構(gòu)造。

例如在處理Nikodym集問題時,系統(tǒng)生成的初步構(gòu)造雖然尚未達到最優(yōu),但它為人類研究者提供了“一個極好的人類直覺跳板” 。


基于AI提供的結(jié)構(gòu),研究人員通過人工簡化和直覺推演,最終找到了一個更優(yōu)的構(gòu)造,改進了已知的上界,這一人機協(xié)作的成果將作為一篇獨立的數(shù)學(xué)論文發(fā)表。


同樣地,在算術(shù)Kakeya猜想中,AlphaEvolve也發(fā)揮了類似作用。


系統(tǒng)不僅將一個已知的下界從1.61226提升至1.668,其構(gòu)造的解(形態(tài)上類似于離散高斯分布)還啟發(fā)人類數(shù)學(xué)家建立了新的漸近關(guān)系,相關(guān)成果也即將發(fā)表。


這種啟發(fā)人類研究的能力,與AlphaEvolve輸出結(jié)果的可解釋性緊密相關(guān)。

系統(tǒng)在大多數(shù)情況下生成的是結(jié)構(gòu)清晰的程序代碼,而非難以理解的黑盒結(jié)果,這使得人類專家可以方便地分析、歸納其發(fā)現(xiàn)的模式,并提煉出通用的數(shù)學(xué)公式。

積木堆疊問題便是這一特性的絕佳體現(xiàn)。


在該問題中,系統(tǒng)最初生成了一個邏輯正確的遞歸程序來計算積木的放置。在隨后的演化中,系統(tǒng)內(nèi)部的LLM分析了這段代碼的邏輯,并自主將其重構(gòu)為一個更簡潔、高效的顯式程序。

這個最終程序清晰地揭示了最優(yōu)解與諧波數(shù)(harmonic numbers)之間的數(shù)學(xué)關(guān)系,這與人類已知的理論公式完全一致,展示了系統(tǒng)從復(fù)雜解法中提煉數(shù)學(xué)本質(zhì)的能力。


除了方案的清晰性,AlphaEvolve在不同類型的問題設(shè)置下也表現(xiàn)出了強大的魯棒性。

它能夠有效處理高維度參數(shù)空間、復(fù)雜的幾何約束以及基于蒙特卡洛模擬的近似評分函數(shù)。

比如這里有一個最小三角形密度問題。


研究人員最初設(shè)計了一個樸素的評分函數(shù),但系統(tǒng)很快利用了該問題空間的非凸性,通過“欺騙”評分函數(shù)獲得了超越理論最優(yōu)的不可能分?jǐn)?shù)。


為了解決這個問題,研究人員設(shè)計了一個更魯棒的新評分函數(shù),該函數(shù)基于問題的利普希茨連續(xù)性(Lipschitz type bounds)構(gòu)造。

在切換到這個更復(fù)雜的連續(xù)評分函數(shù)后,AlphaEvolve不再受局部陷阱的迷惑,迅速收斂到了已知的、正確的理論最優(yōu)解。


并且AlphaEvolve具備了出色的泛化能力,來看IMO 2025的第6題。


研究人員只在輸入n為完全平方數(shù)時才對系統(tǒng)進行評分。這種“信息限制”反而迫使AlphaEvolve去尋找這些稀疏實例背后的共同結(jié)構(gòu)模式,而不是對每個n進行“過擬合”。


最終,系統(tǒng)成功發(fā)現(xiàn)并輸出了在所有完全平方數(shù)n上均達到最優(yōu)的通用構(gòu)造,展現(xiàn)出了歸納能力。


在實際應(yīng)用中,AlphaEvolve的效率極高,僅需少量高質(zhì)量提示即可驅(qū)動。論文指出,來自領(lǐng)域?qū)<业奶崾荆╡xpert guidance)往往能顯著提升最終構(gòu)造的質(zhì)量,表明系統(tǒng)對人類輸入具有高度的敏感性。

同時,該系統(tǒng)在架構(gòu)上支持并行化,允許研究人員在多個問題實例或同一問題的不同參數(shù)設(shè)置上同時運行探索,并能自動遷移成功的搜索策略,這在處理多參數(shù)的幾何類問題時尤其高效。

AlphaEvolve工作模式

AlphaEvolve并非一個單一流程的系統(tǒng),而是通過不同“工作模式”適應(yīng)不同類型的數(shù)學(xué)問題探索任務(wù)。

該系統(tǒng)主要在兩種不同的模式下運行——“搜索模式”(search mode)和“泛化模式”(generalizer mode)。

“搜索模式”是系統(tǒng)最常用的模式,其目標(biāo)是高效地發(fā)現(xiàn)最優(yōu)的數(shù)學(xué)構(gòu)造,而不必關(guān)心構(gòu)造過程是否具有可解釋性或普適性。在這種模式下,AlphaEvolve演化的不是直接生成構(gòu)造的程序,而是演化用于搜索構(gòu)造的程序。

每一個被演化的程序本身就是一個“搜索啟發(fā)式算法”(search heuristic)。

評估器會給予這些啟發(fā)式算法一個固定的時間預(yù)算,算法的得分取決于它在此預(yù)算內(nèi)能找到的最佳構(gòu)造的質(zhì)量。

這種方式解決了LLM調(diào)用(緩慢且昂貴)與傳統(tǒng)局部搜索(快速且廉價)之間的速度差異——一次緩慢的LLM調(diào)用用于生成一個高效的搜索策略,該策略隨后可以觸發(fā)大規(guī)模的廉價計算,自主探索數(shù)百萬個候選構(gòu)造。

系統(tǒng)演化的是一系列“改進器”(improver)函數(shù),它們動態(tài)地適應(yīng)搜索進程,早期可能偏好進行廣泛探索的啟發(fā)式算法,而當(dāng)接近最優(yōu)解時,則會演化出更精細(xì)的、針對特定問題進行優(yōu)化的算法。


“泛化模式”則更具挑戰(zhàn)性 。

其目標(biāo)是讓AlphaEvolve編寫一個能夠解決任意給定參數(shù)n的問題的通用程序 。系統(tǒng)的評估方式是考察該程序在一系列不同n值上的綜合表現(xiàn)。

這種模式的期望是,通過讓系統(tǒng)觀察自己在小規(guī)模n上找到的最優(yōu)解,它能夠自主“發(fā)現(xiàn)模式”,并將其歸納推廣為一個適用于所有n的通用公式或算法 。


總之,AlphaEvolve展示了AI引導(dǎo)的演化搜索如何補充人類的直覺,為數(shù)學(xué)研究提供了一個強大的新范式。

論文地址:
https://arxiv.org/abs/2511.02864

文章來源:量子位。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
浙江官宣:即將舉辦城市足球聯(lián)賽

浙江官宣:即將舉辦城市足球聯(lián)賽

新京報政事兒
2025-12-21 20:13:40
海南封關(guān)首日:30克金飾省近萬元,居民排長隊買榴蓮

海南封關(guān)首日:30克金飾省近萬元,居民排長隊買榴蓮

極目新聞
2025-12-21 08:11:42
石宇奇衛(wèi)冕失!第二局0-7崩盤手腕明顯不適 祝賀波波夫顯格局

石宇奇衛(wèi)冕失敗!第二局0-7崩盤手腕明顯不適 祝賀波波夫顯格局

顏小白的籃球夢
2025-12-21 19:37:05
考古最新證實:阿房宮既沒建好也沒被火燒,杜牧《阿房宮賦》所描述的阿房宮景象非寫實之作

考古最新證實:阿房宮既沒建好也沒被火燒,杜牧《阿房宮賦》所描述的阿房宮景象非寫實之作

大象新聞
2025-12-21 10:49:06
羅永浩稱收入超99%中國人

羅永浩稱收入超99%中國人

超角度
2025-12-21 12:35:06
南博事件再升級!《江南春》調(diào)撥人是凌波,神秘顧客也浮出水面

南博事件再升級!《江南春》調(diào)撥人是凌波,神秘顧客也浮出水面

奇思妙想草葉君
2025-12-21 13:59:16
臉都不要了,但還是低估了他們的無恥

臉都不要了,但還是低估了他們的無恥

胖胖說他不胖
2025-12-21 11:00:20
南京博物館事件,我很擔(dān)心會走向“彭宇案”的老路

南京博物館事件,我很擔(dān)心會走向“彭宇案”的老路

人格志
2025-12-20 23:34:32
太不尋常了!日本外長公開承認(rèn)波茨坦公告,日高官求中國一件事

太不尋常了!日本外長公開承認(rèn)波茨坦公告,日高官求中國一件事

知鑒明史
2025-12-20 19:15:51
安徽省委決定:在全省開展持續(xù)深化違規(guī)吃喝問題專項整治,對頂風(fēng)者嚴(yán)查快辦、絕不姑息

安徽省委決定:在全省開展持續(xù)深化違規(guī)吃喝問題專項整治,對頂風(fēng)者嚴(yán)查快辦、絕不姑息

新京報政事兒
2025-12-21 20:13:56
日退將妄稱“美日臺聯(lián)手作戰(zhàn)”,帥化民打臉:美國沒那個意愿、日本沒那個能力

日退將妄稱“美日臺聯(lián)手作戰(zhàn)”,帥化民打臉:美國沒那個意愿、日本沒那個能力

海峽導(dǎo)報社
2025-12-21 12:36:02
陳慧琳素顏逛美國超市,臉好方,腮幫子鼓起來了,牙齒不整齊!

陳慧琳素顏逛美國超市,臉好方,腮幫子鼓起來了,牙齒不整齊!

庭小娛
2025-12-21 14:51:03
威武!倆中國女生埃及游,與當(dāng)?shù)?人互毆,完勝后獲圍觀者豎拇指

威武!倆中國女生埃及游,與當(dāng)?shù)?人互毆,完勝后獲圍觀者豎拇指

阿纂看事
2025-12-20 10:16:59
張學(xué)良三個兒子瘋的瘋,死的死,都以為張家就要絕后,結(jié)局如何?

張學(xué)良三個兒子瘋的瘋,死的死,都以為張家就要絕后,結(jié)局如何?

古書記史
2025-12-12 11:32:56
北京一副局長騎電動車送外賣,“原以為騎手最關(guān)心社保政策,沒想到他們張口就是‘別罰我款’”

北京一副局長騎電動車送外賣,“原以為騎手最關(guān)心社保政策,沒想到他們張口就是‘別罰我款’”

第一財經(jīng)資訊
2025-12-21 08:55:57
同仁堂假貨泛濫!央視曝光,3元成本翻20倍賣,家里有老人的速查

同仁堂假貨泛濫!央視曝光,3元成本翻20倍賣,家里有老人的速查

觀察鑒娛
2025-12-21 12:02:11
中美較量開始了:世紀(jì)號油輪事件,是特朗普對中國的敲打,中國硬核回?fù)簦?>
    </a>
        <h3>
      <a href=V記錄號
2025-12-21 14:58:44
彭珮云同志逝世

彭珮云同志逝世

新華社
2025-12-21 17:03:03
韓紅直呼“太離譜”,三甲醫(yī)生連番追問!5月齡小洛熙手術(shù)后離世仍需更多真相……

韓紅直呼“太離譜”,三甲醫(yī)生連番追問!5月齡小洛熙手術(shù)后離世仍需更多真相……

新民周刊
2025-12-21 14:48:33
這次,美國徹底把我們打醒了!

這次,美國徹底把我們打醒了!

戎評
2025-12-20 14:02:05
2025-12-21 20:40:49
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識,交流思想
5273文章數(shù) 64595關(guān)注度
往期回顧 全部

科技要聞

生態(tài)適配已超95% 鴻蒙下一關(guān):十萬個應(yīng)用

頭條要聞

妻兒三人被發(fā)小入室殺害 家屬:兇手還假裝毫不知情

頭條要聞

妻兒三人被發(fā)小入室殺害 家屬:兇手還假裝毫不知情

體育要聞

勇士火箭贏球:王牌之外的答案?

娛樂要聞

星光大賞太尷尬!搶話擋鏡頭,場地還小

財經(jīng)要聞

老房子“強制體檢”,政府出手了

汽車要聞

-30℃,標(biāo)致508L&凡爾賽C5 X冰雪"大考"

態(tài)度原創(chuàng)

時尚
教育
親子
手機
房產(chǎn)

紅色不流行了?今年最火的穿搭居然是它

教育要聞

26考研初試估分通道開啟,想估分的速來!

親子要聞

Who can resist the piano romance from a 3-year-old...

手機要聞

華為Mate80系列迎雙喜:18天銷量破百萬,同比前代大幅增長!

房產(chǎn)要聞

中交·藍色港灣一周年暨藍調(diào)生活沙龍圓滿舉行

無障礙瀏覽 進入關(guān)懷版