專訪數(shù)學(xué)家Daniel Litt（丹尼爾?利特）：AI人工智能的數(shù)學(xué)能力或長期處于不均衡發(fā)展?fàn)顟B(tài)（上）

2026-01-31 00:10:53　來源: 小樂數(shù)學(xué)科普

江蘇舉報(bào)

分享至

★置頂zzllrr小樂公眾號(hào)（主頁右上角）數(shù)學(xué)科普不迷路！

訪談背景簡介：

丹尼爾?利特（Daniel Litt）是多倫多大學(xué)數(shù)學(xué)系教授。他一直密切關(guān)注AI人工智能在推動(dòng)數(shù)學(xué)發(fā)現(xiàn)領(lǐng)域的發(fā)展進(jìn)程，對此態(tài)度時(shí)而審慎懷疑，時(shí)而滿懷期待。

本期Epoch.ai與其探討的話題包括：當(dāng)下的模型能解決的最難數(shù)學(xué)問題究竟是什么；是否有確鑿證據(jù)表明人工智能正推動(dòng)數(shù)學(xué)研究提速；以及人工智能能否攻克千禧年大獎(jiǎng)難題。

他們還探討如何評(píng)估數(shù)學(xué)研究的進(jìn)展，其中包括Epoch.ai全新推出的「FrontierMath前沿?cái)?shù)學(xué)：開放式問題」基準(zhǔn)測試 —— 該測試以數(shù)學(xué)領(lǐng)域具有研究價(jià)值的未解問題為依據(jù)，對人工智能模型的能力進(jìn)行評(píng)估。

詳情參閱：

訪談人簡介：

丹尼爾·利特（Daniel Litt）是多倫多大學(xué)數(shù)學(xué)助理教授。他獲得斯坦福大學(xué)博士學(xué)位，研究重點(diǎn)是代數(shù)幾何與數(shù)論之間的相互作用。

格雷格?伯納姆（Greg Burnham）是 Epoch AI 的研究員。在此之前，他曾在Elemental Cognition和Bridgewater Associates工作。他擁有普林斯頓大學(xué)數(shù)學(xué)學(xué)士學(xué)位。

安森（Anson Ho）是 Epoch AI 的研究員。他致力于幫助對人工智能未來發(fā)展及其社會(huì)影響進(jìn)行更嚴(yán)謹(jǐn)?shù)睦斫狻?/p>

時(shí)間節(jié)點(diǎn)目錄：

（采訪時(shí)間和內(nèi)容較長，分成十四小節(jié)，上下兩篇。本篇為上篇，涉及前七小節(jié)）

00:00:00 一、如今人工智能能解決的最難數(shù)學(xué)問題是什么？

00:16:08 二、當(dāng)下的人工智能模型對數(shù)學(xué)研究的助力有多大？

00:23:36 三、垃圾論文、大語言模型生成的證明與審稿危機(jī)

00:27:21 四、人工智能實(shí)現(xiàn)數(shù)學(xué)問題的大規(guī)模篩選

00:33:49 五、人工智能何時(shí)能發(fā)展到足以在頂級(jí)數(shù)學(xué)期刊發(fā)表成果的水平？

00:42:15 六、智能的價(jià)值回報(bào)體現(xiàn)在何處？

00:59:50 七、人工智能能否攻克千禧年大獎(jiǎng)難題？

01:11:54 八、數(shù)學(xué)領(lǐng)域還存在大量易解的「低垂果實(shí)」嗎？

01:18:47 九、丹尼爾如何調(diào)整職業(yè)發(fā)展，以適應(yīng)人工智能的發(fā)展進(jìn)程？

01:25:28 十、人工智能數(shù)學(xué)基準(zhǔn)測試，實(shí)際在評(píng)估什么能力？

01:33:05 十一、開放式問題基準(zhǔn)測試的設(shè)計(jì)思路

01:56:35 十二、數(shù)學(xué)家會(huì)相信關(guān)于數(shù)學(xué)猜想的啟發(fā)式論證嗎？

02:01:24 十三、若人工智能攻克「FrontierMath前沿?cái)?shù)學(xué)：開放式問題」基準(zhǔn)測試，會(huì)帶來什么影響？

02:06:53 十四、人工智能是否即將推動(dòng)數(shù)學(xué)研究邁入加速發(fā)展階段？

作者：epoch.ai 2026-1-29

譯者：zzllrr小樂（數(shù)學(xué)科普公眾號(hào)）2026-1-30

訪談實(shí)錄（上）：
一、如今的人工智能能攻克哪些最難的數(shù)學(xué)難題？
[00:00:00]

格雷格：大家好，我是Epoch人工智能研究院（Epoch AI）的研究員格雷格?伯納姆（Greg Burnham），這位是我的同事安森（Anson Ho）。

安森：我也是Epoch人工智能研究院的研究員。

格雷格：今天我們還邀請到了丹尼爾，你好，丹尼爾。

丹尼爾：你們好，很高興和大家見面，能線下交流很開心。我是丹尼爾?利特（ Daniel Litt ），多倫多大學(xué)的數(shù)學(xué)教授。

格雷格：我們先從一個(gè)有趣的問題開始吧。你能否說說，如今的人工智能系統(tǒng)能解決的最難的數(shù)學(xué)難題，大概處于什么水平？

丹尼爾：這個(gè)問題問得很好。目前所有的前沿大模型，基本都能在最新的國際數(shù)學(xué)奧林匹克競賽（IMO）中拿到金牌，這可以作為衡量其能力的一個(gè)不錯(cuò)基準(zhǔn)。后面我們也會(huì)聊到幾個(gè)已經(jīng)被解決的數(shù)學(xué)開放問題，這些問題要么是在人工智能的輔助下解決的，要么是由人工智能自主攻克的。客觀來說，這些問題的難度大概相當(dāng)于國際數(shù)學(xué)奧林匹克競賽中難度中等或偏低的題目。

格雷格：明白了。

丹尼爾：有跡象表明，現(xiàn)在的人工智能系統(tǒng)其實(shí)能做到更好一些。如果加以優(yōu)化，當(dāng)前這一代的模型大概率能發(fā)揮出更優(yōu)的性能。但總體而言，其解題水平還是停留在競賽題層面 —— 也就是優(yōu)秀的高中生或大學(xué)生能在幾小時(shí)內(nèi)解決的題目。

格雷格：你曾大膽斷言，未來一年內(nèi)，我們或許能看到一些些許有價(jià)值的數(shù)學(xué)猜想被人工智能解決。這句話具體是什么意思？

丹尼爾：在我看來，“些許有價(jià)值的猜想”，指的是有人正式發(fā)表過、至少有一個(gè)研究者真正關(guān)注過，且大概率有人為其花費(fèi)過至少數(shù)小時(shí)研究的猜想。這類難度的猜想數(shù)量不少，我認(rèn)為當(dāng)前的人工智能系統(tǒng)，在算力支持達(dá)到約 100 萬次運(yùn)算量級(jí)的情況下，就能解決其中一部分。

格雷格：懂了。

丹尼爾：其實(shí)近期已經(jīng)有一些例子符合這個(gè)標(biāo)準(zhǔn)了，或許這個(gè)預(yù)測已經(jīng)成真，只是對于這些問題的實(shí)際價(jià)值，還存在一些爭議。

格雷格：也就是爭議在于這些問題的價(jià)值到底有多大。

丹尼爾：對，核心就是這些問題的實(shí)際研究價(jià)值究竟如何。

格雷格：你多次提到用 “人類解決該問題所需的時(shí)間” 作為衡量標(biāo)準(zhǔn)，你總體來說認(rèn)可這個(gè)衡量維度嗎？

丹尼爾：說實(shí)話，并不認(rèn)可。我覺得這不是衡量難題難度的好方法。拿國際數(shù)學(xué)奧林匹克競賽的題目來說，全世界最頂尖的參賽學(xué)生大概有一個(gè)半小時(shí)的解題時(shí)間，這能給難度設(shè)定一個(gè)上限，但對于很多這類題目，如果你交給專業(yè)數(shù)學(xué)家來做，他們實(shí)際花費(fèi)的時(shí)間反而會(huì)更長 —— 因?yàn)樗麄儠?huì)反復(fù)推敲，也沒有競賽中那種強(qiáng)烈的解題動(dòng)力。此外，解決競賽題所用到的方法是非常有限的，而在數(shù)學(xué)研究中，研究者沒有任何方法上的束縛，會(huì)嘗試所有思路、反復(fù)摸索，甚至?xí)柚?jì)算機(jī)演算具體的例子。

難度本身是個(gè)很微妙的概念，該如何評(píng)判呢？很多時(shí)候，或許最好的評(píng)判方式是事后復(fù)盤：當(dāng)你看到證明過程的邏輯結(jié)構(gòu)后，會(huì)覺得 “其實(shí)這個(gè)問題也沒那么難”。但這種方式也有隱患 —— 如果用它來評(píng)估人工智能模型的能力，很容易導(dǎo)致不斷改變評(píng)判標(biāo)準(zhǔn)：模型給出了證明，你卻會(huì)說 “這題本來就不難，我不過是點(diǎn)了個(gè)按鈕而已”。

安森：你經(jīng)常在推特上提到，這些人工智能系統(tǒng)能為數(shù)學(xué)研究帶來的實(shí)際助力其實(shí)相當(dāng)有限，但也有人認(rèn)為這種助力要大得多。你如何解釋這種認(rèn)知差異？

丹尼爾：人工智能模型在某些領(lǐng)域的表現(xiàn)確實(shí)更出色。比如最優(yōu)化理論領(lǐng)域，我的了解是，OpenAI 有不少該領(lǐng)域的專家，他們生成了大量相關(guān)數(shù)據(jù)，還結(jié)合自身的人類專業(yè)知識(shí)指導(dǎo)模型訓(xùn)練。所以該領(lǐng)域的研究者能從模型中獲得更多幫助，我一點(diǎn)也不意外。相比之下，在代數(shù)幾何和數(shù)論領(lǐng)域，人工智能模型的表現(xiàn)就沒那么好了。

有些研究領(lǐng)域，更適配人工智能模型當(dāng)前所具備的工具使用能力。比如你想為某個(gè)不等式找反例，編寫代碼驗(yàn)證是很自然的做法；但如果你想為 “三次三維簇的中間雅可比簇相關(guān)猜想” （

intermediate Jacobian of a cubic threefold

）找反例，大概率沒有任何代碼能幫上忙。

除此之外，我認(rèn)為很多人可能夸大了模型對自己的幫助。新工具的出現(xiàn)，使用起來確實(shí)很有趣，但很多人在談?wù)撊斯ぶ悄芗铀倏茖W(xué)研究時(shí)，并沒有嘗試進(jìn)行嚴(yán)謹(jǐn)?shù)膶?shí)證檢驗(yàn)。我愿意相信，人工智能確實(shí)消除了研究中的一些阻礙，但數(shù)學(xué)研究中還有很多瓶頸，是當(dāng)前的模型無法觸及的。如果人工智能只是解決了 “打開論文找到引理 3.7” 這類小問題，卻無法幫研究者產(chǎn)生好的想法，那這真的能算加速研究嗎？

安森：我通常會(huì)用莫拉維克（Moravec）悖論來解釋人工智能在不同領(lǐng)域的能力差異或能力的不均衡性，而在數(shù)學(xué)領(lǐng)域內(nèi)部，這種能力的不均衡性同樣存在。一部分原因來自訓(xùn)練數(shù)據(jù)，一部分是因?yàn)橛行?shù)學(xué)領(lǐng)域更適配人工智能的特性。這兩點(diǎn)能解釋大部分的能力差異嗎？還是說還有其他因素？

丹尼爾：開展數(shù)學(xué)研究需要的是一種高維度的綜合能力，這和競賽解題有一點(diǎn)不同 —— 研究中沒有一套固定的、已知的有效方法。那些需要?jiǎng)?chuàng)造性思維的數(shù)學(xué)問題，模型至今都沒能成功解決。

我們在數(shù)學(xué)領(lǐng)域看到的這種能力不均衡，其實(shí)和在其他所有領(lǐng)域看到的情況是一樣的，并沒有什么特殊性。人工智能模型無法自主開展高質(zhì)量數(shù)學(xué)研究的最大障礙，和自動(dòng)化任何工作的最大障礙是同一個(gè)：它們無法完成長上下文任務(wù)。人類需要花費(fèi)六個(gè)月解決的任務(wù)，模型目前完全做不到。一旦未來的模型能完成這個(gè)量級(jí)的軟件工程任務(wù)，那么它們開始開展高質(zhì)量的數(shù)學(xué)研究，也就不足為奇了。在這一點(diǎn)上，數(shù)學(xué)研究并沒有什么特殊之處。

格雷格：我有一個(gè)腦洞大開的想法：人工智能模型在空間推理和視覺空間直覺方面的能力較弱，或許當(dāng)一個(gè)數(shù)學(xué)問題能通過符號(hào)運(yùn)算的方式解決時(shí)，它們的表現(xiàn)會(huì)格外出色？

丹尼爾：或許是這樣，但我對這種解釋持一點(diǎn)懷疑態(tài)度。數(shù)學(xué)家思考數(shù)學(xué)問題的方式千差萬別，我們中有些人是空間視覺型思考者，有些人則更偏向語言文字型思考者。

格雷格：我很好奇，有沒有數(shù)學(xué)家患有心象缺失癥（aphantasia）？

丹尼爾：當(dāng)然有，甚至有些幾何學(xué)家都患有心象缺失癥，這是很有名的事。有大量數(shù)學(xué)家在用截然不同的方法研究問題，這也是為什么有些數(shù)學(xué)家的整體數(shù)學(xué)水平遠(yuǎn)高于我，卻無法在相同時(shí)間內(nèi)證明我能證明的定理，甚至根本證明不了。核心原因就是我們的研究方法不同。

目前能較好解決數(shù)學(xué)問題的人工智能模型大概有三四款，它們的解題方法略有差異，但這種差異性遠(yuǎn)小于人類數(shù)學(xué)家之間的差異，這一點(diǎn)在各項(xiàng)基準(zhǔn)測試中也能體現(xiàn)出來：不同模型能解決的問題有很高的重合度，而基準(zhǔn)測試中的所有問題，至少有一位人類數(shù)學(xué)家能解決。在我看來，我們可以把人工智能模型看作一位獨(dú)立的數(shù)學(xué)家 —— 它們會(huì)在某些問題上表現(xiàn)出色，也會(huì)在某些問題上束手無策。但或許我們不必過度解讀模型擅長或不擅長的問題類型，這只是因?yàn)槟壳翱晒┭芯康哪Ｐ椭挥袃扇疃?，只是一種客觀結(jié)果。

格雷格：你認(rèn)為人工智能的能力，在數(shù)學(xué)的不同子領(lǐng)域之間，存在多大的遷移性？

丹尼爾：我的感受是，當(dāng)你讓模型證明一個(gè)代數(shù)幾何領(lǐng)域的命題時(shí)，它大概率只會(huì)嘗試在文獻(xiàn)中找到相關(guān)命題，或是極其相似的結(jié)論，然后在此基礎(chǔ)上進(jìn)行一兩步推理。而當(dāng)你問它一個(gè)組合數(shù)學(xué)的問題時(shí)，它并不會(huì)做出同樣的、真正的解題嘗試。

和一個(gè)掌握了所有模型所知的代數(shù)幾何或數(shù)論知識(shí)的研究生相比，這個(gè)研究生能進(jìn)行的推理要多得多，也能真正嘗試去證明定理。在部分?jǐn)?shù)學(xué)領(lǐng)域，模型的知識(shí)儲(chǔ)備已經(jīng)超越人類，但它們未必掌握了擁有相同知識(shí)儲(chǔ)備的人類研究生所具備的研究方法。這只是我的直觀感受。

格雷格：你覺得模型在哪些數(shù)學(xué)領(lǐng)域的原生推理能力更強(qiáng)？

丹尼爾：在證明不等式這類問題上，它們的能力絕對比我強(qiáng)。我猜測原因是這類問題更容易生成訓(xùn)練數(shù)據(jù)，而且相關(guān)的訓(xùn)練數(shù)據(jù)量可能遠(yuǎn)多于代數(shù)幾何領(lǐng)域。

格雷格：你說的不等式，是競賽類型的不等式嗎？還是分析學(xué)中更有研究價(jià)值的不等式？

丹尼爾：是那些編寫代碼能輔助解決的不等式問題，模型在這類問題上的表現(xiàn)通常都很出色。現(xiàn)在我每次需要證明不等式時(shí)，第一步都會(huì)借助模型編寫代碼，來探究問題的解空間特征。

格雷格：你之前提到的兩個(gè)觀點(diǎn)，看起來存在一定矛盾：一方面，你說模型缺少的是產(chǎn)生好想法的能力；另一方面，你又說如果模型能在多個(gè)領(lǐng)域持續(xù)工作六個(gè)月，或許也能做好數(shù)學(xué)研究。

丹尼爾：這個(gè)問題問得很好，這兩個(gè)觀點(diǎn)確實(shí)存在矛盾。在我看來，從單純應(yīng)用已知方法，到開發(fā)新的研究方法，這之間是一個(gè)連續(xù)的過程。而開發(fā)一種新方法，說白了就是把上百種不同的思路以某種方式結(jié)合起來，而完成這件事的關(guān)鍵要素之一，就是時(shí)間。只是目前還不確定，時(shí)間是不是唯一的要素。

我自己做數(shù)學(xué)研究的經(jīng)歷是，極少會(huì)出現(xiàn) “突然想到一個(gè)絕妙的想法，一下子就解決了問題” 的情況。偶爾會(huì)有半夜醒來，問題突然有了答案的時(shí)刻，但通常這種情況的發(fā)生，前提是你已經(jīng)為這個(gè)問題鉆研了數(shù)月。時(shí)間的積累確實(shí)有其獨(dú)特的價(jià)值，只是我不確定自己的自我反思是否足夠可靠，能判斷時(shí)間是不是唯一的核心要素。

研究中還會(huì)發(fā)生其他事：你會(huì)形成自己的研究思路，或是找到不同問題之間的類比關(guān)系 —— 數(shù)學(xué)研究中存在一種難以言喻的玄妙特質(zhì)，而這種特質(zhì)，目前的模型還無法展現(xiàn)。但或許這也只是一種主觀感受，這種玄妙的特質(zhì)，可能只是把你讀過、吸收的大量想法濃縮成人類能理解的形式而已，或許和上下文壓縮的原理很接近。

格雷格：目前有一些關(guān)于智能的核心類比觀點(diǎn) —— 比如 “智能是一種搜索行為”，或是 “智能是一種信息壓縮能力”，而人類目前只是在這些方面做得更好而已。

丹尼爾：我總體上對這類類比持懷疑態(tài)度。在我看來，做好數(shù)學(xué)研究的方式有很多種?？纯床煌瑪?shù)學(xué)家的研究能力就會(huì)發(fā)現(xiàn)，彼此的能力重疊度其實(shí)很低。我敢肯定，沒有哪位數(shù)學(xué)家能證明我能證明的所有定理，也有很多數(shù)學(xué)家的思考方式和我截然不同。

二、如今的人工智能模型對數(shù)學(xué)研究的幫助有多大？

[00:16:08]

格雷格：能否結(jié)合前代研究工具，說說你認(rèn)為當(dāng)前人工智能工具的實(shí)際效用？比如文獻(xiàn)檢索功能，現(xiàn)在的模型確實(shí)做得更好，但谷歌學(xué)術(shù)早就實(shí)現(xiàn)了文獻(xiàn)檢索。

丹尼爾：目前的人工智能工具，其實(shí)和前代工具處于同一發(fā)展脈絡(luò)中。文獻(xiàn)檢索方面，模型至少在部分任務(wù)上，已經(jīng)比谷歌或谷歌學(xué)術(shù)做得更好了，這確實(shí)能節(jié)省一些時(shí)間，但具體能省多少，我也不確定。和過去去圖書館查資料相比，能節(jié)省多少時(shí)間呢？

格雷格：大概就是長期來看，能提升 2% 左右的工作效率這種水平。

丹尼爾：沒錯(cuò)，基本就是這個(gè)趨勢。總體而言，這些提升都相當(dāng)有限，我懷疑其帶來的效率提升不會(huì)超過 1% 或 2%。

格雷格：如果今天人工智能的發(fā)展突然停滯，你認(rèn)為當(dāng)前的技術(shù)水平，不足以推動(dòng)數(shù)學(xué)研究質(zhì)量出現(xiàn)爆發(fā)式提升？

丹尼爾：我認(rèn)為數(shù)學(xué)研究的效率會(huì)保持我們以往看到的增長速度，這種增長在一定程度上可能歸功于技術(shù)，但大概率主要是因?yàn)檠芯咳丝诘脑鲩L。你也可以對谷歌提出同樣的問題：谷歌或電子郵件，到底提升了多少工作效率？

格雷格：你經(jīng)歷過谷歌出現(xiàn)前后的時(shí)代嗎？那段變化對你有什么感受？

丹尼爾：沒有，我出生于 1988 年，2015 年拿到博士學(xué)位，所以在我開始接觸數(shù)學(xué)研究時(shí)，谷歌就已經(jīng)存在了。我問過一些年長的數(shù)學(xué)家這個(gè)問題，他們的普遍共識(shí)是，谷歌確實(shí)提升了數(shù)學(xué)研究的效率，但這種提升很難直觀看到，也很難找到一個(gè)指標(biāo)來衡量。從直觀感受來看，谷歌的出現(xiàn)并沒有帶來優(yōu)秀數(shù)學(xué)新思想的爆發(fā)式增長，我認(rèn)為核心原因是，文獻(xiàn)檢索并非數(shù)學(xué)研究的主要瓶頸。

人工智能工具還有一個(gè)前身，那就是計(jì)算機(jī)技術(shù)的發(fā)展。上世紀(jì) 60、70、80 年代，計(jì)算機(jī)技術(shù)的發(fā)展推動(dòng)了多個(gè)數(shù)學(xué)領(lǐng)域的重大進(jìn)展。有一個(gè)經(jīng)典的例子：歐拉曾提出冪和猜想，探討何時(shí)存在若干個(gè) k 次冪的和等于另一個(gè) k 次冪。這個(gè)猜想的第一個(gè)反例，就是通過計(jì)算機(jī)搜索找到的。更著名的是，四次冪的情況在 1988 年由埃爾基斯解決，他用到了一種非常巧妙的計(jì)算機(jī)搜索方法。

格雷格：如果沒有計(jì)算機(jī)，這種方法根本無從施展，盡管其中包含了大量人類的巧思。

丹尼爾：沒錯(cuò)。他找到了一種方法，讓 1988 年的計(jì)算機(jī)能處理這類問題，即便是現(xiàn)在，單純的暴力窮舉也依然無法解決這些問題。但這確實(shí)是數(shù)學(xué)研究的一大突破。如果我們的人工智能模型停留在當(dāng)前水平，數(shù)學(xué)研究也會(huì)沿著這個(gè)趨勢自然發(fā)展。

格雷格：具體會(huì)呈現(xiàn)出怎樣的發(fā)展?fàn)顟B(tài)？目前我們主要將模型用于文獻(xiàn)檢索和代碼編寫，或許未來會(huì)在代碼編寫方面進(jìn)一步發(fā)展，比如朝著 AlphaEvolve 的方向？

丹尼爾：有時(shí)候，數(shù)學(xué)研究的突破需要進(jìn)行大量的搜索驗(yàn)證，而這類搜索往往需要一定的研究技巧。比如你需要驗(yàn)證上千個(gè)不同的例子，卻沒有固定的算法來處理每個(gè)例子，每個(gè)例子都需要一點(diǎn)新的想法，或是運(yùn)用一些標(biāo)準(zhǔn)的研究方法，這種工作很難用計(jì)算機(jī)程序自動(dòng)化實(shí)現(xiàn)。

在代數(shù)幾何領(lǐng)域，你可能需要完成一系列推導(dǎo)步驟，其中一部分可以用 Python 程序自動(dòng)化，另一部分則需要真正的研究思路。以目前模型的能力，我認(rèn)為可以想象，一些這類例子的搜索驗(yàn)證工作，能以較高的可靠性實(shí)現(xiàn)自動(dòng)化。

格雷格：這類工作過去大多需要人工完成，工作量會(huì)隨著問題規(guī)模線性增加，而現(xiàn)在 ——

丹尼爾：現(xiàn)在其中一部分工作的工作量能大幅減少，這也是我非常期待的一點(diǎn)。有時(shí)候我發(fā)表的論文，核心就是一個(gè)精妙的構(gòu)造，而找到這個(gè)構(gòu)造，需要我進(jìn)行大量搜索，還要思考該從哪個(gè)方向入手。AlphaEvolve 的出現(xiàn)，或許就是這種自動(dòng)化搜索的雛形 —— 也就是由智能大語言模型輔助的自動(dòng)化搜索。我能想象，這會(huì)對數(shù)學(xué)研究產(chǎn)生非常重大的影響，但這種影響和計(jì)算機(jī)技術(shù)的影響一脈相承，并不意味著數(shù)學(xué)研究的完全自動(dòng)化。

格雷格：也就是繼續(xù)探索如何利用計(jì)算機(jī)減少人工勞動(dòng)，或是開辟新的研究方向。

丹尼爾：對，就像四色定理的證明、開普勒猜想的證明一樣，這類問題需要驗(yàn)證大量的案例，而計(jì)算機(jī)能幫助我們完成這項(xiàng)工作。

格雷格：如果大幅提升算力，能讓這類工作實(shí)現(xiàn)更大的突破嗎？

丹尼爾：其實(shí)數(shù)學(xué)家已經(jīng)在這么做了。我和計(jì)算數(shù)論領(lǐng)域的研究者聊過，他們的對話非常有趣 —— 有人會(huì)拿著一個(gè)問題說，“根據(jù)摩爾定律，等到算力不再成為限制時(shí)，這個(gè)問題在今年就能被解決”，而這些預(yù)測的準(zhǔn)確率還相當(dāng)高。

你或許聽過這個(gè)例子：一個(gè)整數(shù)能否表示為三個(gè)立方數(shù)的和。我們知道每個(gè)具體案例的解決難度，提升兩倍、三倍算力，就能找到更多有研究價(jià)值的整數(shù)解。但問題是，這種進(jìn)展究竟能算真正的數(shù)學(xué)突破嗎？有人對此比我更興奮。

我想象的場景是，當(dāng)你要尋找某種構(gòu)造的例子，卻沒有已知的算法時(shí)，讓 GPT 進(jìn)行巧妙的搜索，讓它自己產(chǎn)生思路。

格雷格：如果給它足夠的測試時(shí)間 ——

丹尼爾：或許最終它能找到一些結(jié)果。我并不認(rèn)為隨著測試時(shí)間的增加，它能產(chǎn)生越來越精妙的想法，只是能嘗試更多的思路而已。

三、垃圾論文、大語言模型生成的證明，以及數(shù)學(xué)審稿危機(jī)

[00:23:36]

格雷格：目前人工智能是否給數(shù)學(xué)研究帶來了一些問題？大學(xué)中的作弊問題顯然已經(jīng)出現(xiàn)，那垃圾論文的問題呢？

丹尼爾：垃圾論文的問題肯定存在。大概從 9 月份開始，我開始統(tǒng)計(jì)預(yù)印本平臺(tái) arXiv 上標(biāo)題或摘要中包含 “霍奇猜想（Hodge conjecture）” 的論文?；羝娌孪胧乾F(xiàn)存的六大千禧年難題之一，也是普通人最難理解其表述的一個(gè)猜想。長期以來，這個(gè)猜想都能避開一些非專業(yè)研究者的胡亂嘗試，因?yàn)槠胀ㄈ烁緦懖怀鲫P(guān)于它的、看似合理的內(nèi)容，但現(xiàn)在情況不同了，前沿模型能寫出關(guān)于霍奇猜想的、看起來言之有理的文本。

9 月和 10 月，arXiv 的數(shù)學(xué) - 代數(shù)幾何分類下，有 12 到 13 篇論文的標(biāo)題或摘要包含霍奇猜想，其中除了一篇，其余全是無意義的垃圾論文。我無法證明這些論文是大語言模型生成的，但從寫作風(fēng)格來看，答案非常明顯，而且其中有大概六位作者是反復(fù)發(fā)表這類垃圾論文的。

這個(gè)問題的影響有多大呢？它不過是浪費(fèi)了我?guī)追昼姷臅r(shí)間。但隨著大語言模型越來越擅長寫看似連貫的文本，過去你花 10 秒就能看出一篇論文是無意義的，現(xiàn)在卻需要花幾分鐘。其中最離譜的一篇，論證邏輯完全不通，但你必須讀到論文中間，才能發(fā)現(xiàn)一些命題純粹是胡說八道 —— 它的引言部分寫得完全合理、有趣，還提出了非常大膽的結(jié)論，想要驗(yàn)證它是垃圾論文，并不是一件容易的事。我認(rèn)為這個(gè)問題會(huì)越來越嚴(yán)重。

在目前形式化驗(yàn)證并不實(shí)用的數(shù)學(xué)領(lǐng)域，這會(huì)成為一個(gè)大問題。你可以想象更糟糕的情況：一個(gè)卡在某個(gè)問題上的研究生，利用模型生成某個(gè)關(guān)鍵步驟的無意義證明，論文的 99% 都是正確的，但因?yàn)檫@一處無意義的證明，整篇論文變得毫無價(jià)值。

格雷格：人類從很久以前就開始在研究中弄虛作假了。

丹尼爾：現(xiàn)在確實(shí)有很多錯(cuò)誤的論文，但核心問題在于邊際成本：說謊和作弊的邊際成本，現(xiàn)在變得低多了。

格雷格：如果人工智能的能力就此停滯，這個(gè)問題在社會(huì)層面能得到管控嗎？

丹尼爾：這個(gè)問題正在加劇數(shù)學(xué)領(lǐng)域的審稿危機(jī) —— 目前產(chǎn)生的論文數(shù)量，遠(yuǎn)超過了能被嚴(yán)謹(jǐn)審稿的數(shù)量，而且情況會(huì)持續(xù)惡化。這在很大程度上是由數(shù)學(xué)學(xué)術(shù)界的激勵(lì)機(jī)制造成的，而非模型本身的問題。我們會(huì)沿用以往的方式管控，但效果會(huì)不盡如人意。不過我也看到了一些希望：模型也能幫助檢查論文，目前已經(jīng)有一些不錯(cuò)的相關(guān)工具在開發(fā)中了。

四、人工智能實(shí)現(xiàn)了大規(guī)模的數(shù)學(xué)問題搜索驗(yàn)證

[00:27:21]

安森：我想從更長遠(yuǎn)的角度聊聊這個(gè)問題。人工智能和數(shù)學(xué)研究的發(fā)展，很大一部分都依賴于算力和規(guī)?；覀冎耙擦牡?，讓人工智能進(jìn)行大量的例子驗(yàn)證。當(dāng)我們擁有了大規(guī)模開展這類數(shù)學(xué)實(shí)驗(yàn)的能力后，數(shù)學(xué)各領(lǐng)域的發(fā)展會(huì)呈現(xiàn)出怎樣的趨勢？

丹尼爾：你問的正是我之前提到的，讓模型進(jìn)行大量的例子驗(yàn)證，而非讓模型去解決黎曼猜想這類頂級(jí)難題。

安森：對，就是這個(gè)意思。

丹尼爾：我認(rèn)為這會(huì)是以往研究趨勢的延續(xù) —— 我們能驗(yàn)證更多有研究價(jià)值的例子，核心優(yōu)勢在于，嘗試第一個(gè)直觀思路的成本變得極低。在過去，我想要找到一個(gè)精妙的構(gòu)造，必須坐下來嘗試各種思路，即便這些思路幾乎不需要什么巧思，也依然要花費(fèi)我?guī)滋斓臅r(shí)間，而我本身還有很多其他工作。更何況，這個(gè)問題可能只是一個(gè)偶然想到的問題，我還有更感興趣的研究方向，嘗試解決它存在機(jī)會(huì)成本。

而現(xiàn)在，嘗試一種思路的邊際成本變得極低，即便用的是能力并不出眾的模型，這也具有極高的價(jià)值。數(shù)學(xué)研究的推進(jìn)方式之一，就是尋找各類有趣的案例，而偶爾就能從中發(fā)現(xiàn)有價(jià)值的結(jié)論，這并不一定需要深刻的洞見或絕妙的想法，只需要花費(fèi)時(shí)間。讓人工智能自動(dòng)化地搜索這些有趣的案例，會(huì)是一件意義重大的事。

數(shù)學(xué)中有一些零散的經(jīng)典案例，比如散在有限單群、例外李群，研究者會(huì)用相當(dāng)系統(tǒng)的方法去尋找它們，但最終還是需要靠發(fā)現(xiàn)。很多時(shí)候，發(fā)現(xiàn)的過程就是看到有人推導(dǎo)出了一個(gè)有趣的例子，然后從中觀察到一些有價(jià)值的性質(zhì)。我最引以為傲的一些研究成果，就是從文獻(xiàn)中發(fā)現(xiàn)了有趣的結(jié)論，然后推導(dǎo)出了相關(guān)的推論。

格雷格：這種研究方式的效率確實(shí)很高。

丹尼爾：這是數(shù)學(xué)研究推進(jìn)的重要方式，數(shù)學(xué)的發(fā)展并非只依靠最頂尖的數(shù)學(xué)家證明驚天定理，還有大量研究者在做著基礎(chǔ)性的工作，研究各類有趣的問題，他們偶爾就能發(fā)現(xiàn)重要的結(jié)論。即便自動(dòng)化的水平達(dá)不到普通專業(yè)數(shù)學(xué)家的程度，這種自動(dòng)化的搜索驗(yàn)證，也會(huì)對數(shù)學(xué)研究產(chǎn)生巨大的影響。

安森：這類數(shù)學(xué)實(shí)驗(yàn)的收益遞減速度有多快？驗(yàn)證一千個(gè)例子，會(huì)比驗(yàn)證一百個(gè)例子有用得多嗎？

丹尼爾：這取決于搜索的方式。至少對我而言，最有價(jià)值的例子，往往出現(xiàn)在需要從無限多的對象中尋找少數(shù)特殊對象的場景中，比如找 26 個(gè)特殊對象，這些對象都是極其罕見、極具特殊性的。這時(shí)候就不能用暴力窮舉，而是需要一定的巧思，而模型能將這部分巧思的工作實(shí)現(xiàn)一定程度的自動(dòng)化。我能想象，在一些場景中，驗(yàn)證一百萬個(gè)例子的價(jià)值，遠(yuǎn)高于驗(yàn)證一百個(gè)例子。

安森：哪些數(shù)學(xué)領(lǐng)域最適配這種大規(guī)模的實(shí)驗(yàn)驗(yàn)證？

丹尼爾：我認(rèn)為所有領(lǐng)域都適配。代數(shù)幾何中有一些我很喜歡的特殊構(gòu)造，比如三次曲面上的 27 條直線、平面四次曲線的 28 條雙切線，這些例子都有有趣的性質(zhì)，還和例外李群相關(guān)。這些都是1800年代的經(jīng)典結(jié)論，但如果能找到新的、類似的精妙特殊構(gòu)造，會(huì)是一件非常了不起的事，而且這并非不可能，研究者也一直在發(fā)現(xiàn)這類有趣的例子。

安森：這么說來，算力確實(shí)至關(guān)重要。那為什么不是所有數(shù)學(xué)家都想去大型實(shí)驗(yàn)室，和 OpenAI、深度思維（DeepMind）這類擁有海量算力的機(jī)構(gòu)合作呢？

丹尼爾：因?yàn)槟壳澳Ｐ偷哪芰€沒達(dá)到那個(gè)水平?，F(xiàn)在想要實(shí)現(xiàn)這種自動(dòng)化，方式大概是讓模型循環(huán)執(zhí)行 “尋找該現(xiàn)象的有趣例子” 的指令，并記錄已經(jīng)驗(yàn)證過的例子，但當(dāng)你真的讓模型這么做時(shí)，它基本會(huì) 100% 失敗。至少在代數(shù)幾何領(lǐng)域，模型的能力還達(dá)不到，它們甚至無法完成一個(gè)有研究價(jià)值的例子的驗(yàn)證。不過這種情況可能很快就會(huì)改變。

安森：如果根據(jù) FrontierMath 的發(fā)展趨勢推斷，或許到明年年底，這個(gè)基準(zhǔn)測試就會(huì)被模型完全攻克。

丹尼爾：但我認(rèn)為，攻克 FrontierMath，和實(shí)現(xiàn)這種大規(guī)模的例子驗(yàn)證，并沒有什么關(guān)聯(lián)。

五、人工智能何時(shí)能寫出登上頂級(jí)數(shù)學(xué)期刊的論文？

[00:33:49]

格雷格：聊聊你關(guān)心的時(shí)間維度吧。你曾和塔梅伊?貝西羅格盧（Tamay Besiroglu）打賭，以 3 比 1 的賠率賭：到 2030 年初，人工智能系統(tǒng)無法自主寫出符合當(dāng)前標(biāo)準(zhǔn)、能發(fā)表在你所在領(lǐng)域頂級(jí)期刊《數(shù)學(xué)年刊》（Annals）上的論文。這意味著你認(rèn)為這件事發(fā)生的概率只有 25%。

丹尼爾：我覺得自己當(dāng)時(shí)可能有點(diǎn)過于自信了，不過從那之后，我的預(yù)估其實(shí)更偏向于自己的判斷了。

格雷格：我記得，塔梅伊的預(yù)估向你靠攏了，而你的預(yù)估也向他靠攏了一點(diǎn)。

丹尼爾：對，還挺有意思的。這個(gè)打賭還有一些附加條件：首先，人工智能的這種能力必須是可復(fù)現(xiàn)的 —— 當(dāng)然，如果模型證明了黎曼猜想，那這條條件就另當(dāng)別論了。

格雷格：要求可復(fù)現(xiàn)，是為了避免只是偶然的成功。

丹尼爾：對，不能是模型恰好找到一個(gè)反例，推翻了某個(gè)重要猜想這種偶然情況，而是能穩(wěn)定地產(chǎn)出高質(zhì)量論文。還有一個(gè)成本條件：每篇論文的邊際成本必須約為 10 萬美元，這個(gè)數(shù)字是估算的人類數(shù)學(xué)家寫出一篇《數(shù)學(xué)年刊》論文的邊際成本。

格雷格：畢竟數(shù)學(xué)家的年薪也到不了上百萬美元，所以 ——

丹尼爾：大概率我們不會(huì)花費(fèi) 10 萬美元的算力去做這件事，不過也有可能。但如果到 2031 年，模型寫出這樣的論文只需要 1000 美元，那這個(gè)賭局就很容易判定結(jié)果了。

格雷格：客觀來說，五年內(nèi)有 25% 的概率實(shí)現(xiàn)這件事，從當(dāng)前的技術(shù)水平來看，這已經(jīng)是非常大的進(jìn)步了。

丹尼爾：我認(rèn)為這個(gè)預(yù)測是很合理的。

格雷格：從打賭到現(xiàn)在，你的判斷有哪些變化？

丹尼爾：25% 這個(gè)概率感覺有點(diǎn)偏低，這其實(shí)只是我的直觀感受，沒有什么實(shí)際依據(jù)。我認(rèn)為，模型在這段時(shí)間內(nèi)，大概率能自主開展高質(zhì)量的數(shù)學(xué)研究。這個(gè)打賭原本是為了衡量 “模型是否會(huì)在數(shù)學(xué)研究中對人類形成絕對優(yōu)勢”，但我現(xiàn)在發(fā)現(xiàn)，這其實(shí)是一個(gè)很糟糕的衡量標(biāo)準(zhǔn)。

原因之一是：目前有很多數(shù)學(xué)家的能力遠(yuǎn)勝于我，他們寫出一篇《數(shù)學(xué)年刊》論文的邊際成本也低得多，一年就能寫一篇。我目前只發(fā)表過一篇《數(shù)學(xué)年刊》的論文，還有幾篇發(fā)表在同級(jí)別期刊上，但從某種意義上來說，這些數(shù)學(xué)家并沒有對我形成絕對優(yōu)勢 —— 我們的研究視角不同，做數(shù)學(xué)研究的方式也不同，在一些領(lǐng)域，我在證明有趣的定理、理解有趣的數(shù)學(xué)問題上，反而具有顯著的優(yōu)勢。

格雷格：如果五年后的模型，依然保持著如今的特性 —— 所有模型的解題方式都大同小異，就像一位風(fēng)格固定的數(shù)學(xué)家。

丹尼爾：沒錯(cuò)。你可以想象，未來的模型會(huì)在某些類型的數(shù)學(xué)研究中表現(xiàn)極其出色，甚至能證明各類不同的定理，但即便如此，就像馬克西姆?孔采維奇（Maxim Kontsevich）這樣的頂級(jí)數(shù)學(xué)家存在，并不意味著其他數(shù)學(xué)家就沒有存在的價(jià)值了。

格雷格：這里的成本條件其實(shí)有點(diǎn)關(guān)聯(lián)。假設(shè)算力成本為零，模型的運(yùn)算速度也不再受限，就好像把你的大腦放進(jìn)數(shù)據(jù)中心，一分鐘就能經(jīng)歷主觀上的 100 年，你能勝過世界上所有的數(shù)學(xué)家嗎？

丹尼爾：這個(gè)問題問得很好。目前，由于各種限制，我主要在自己擅長的領(lǐng)域做研究，偶爾需要學(xué)習(xí)或開發(fā)新的研究方法 —— 這也是目前模型還無法做到的事，而這需要花費(fèi)大量的精力。如果沒有這些限制，我就能更容易地學(xué)習(xí)其他研究者的方法，而這取決于我持續(xù)學(xué)習(xí)的能力。

當(dāng)我們把人類和模型對比時(shí)，結(jié)果可能也取決于模型在持續(xù)學(xué)習(xí)方面的發(fā)展。不過我的預(yù)期是，即便有這樣的條件，我或許能做出很多精彩的數(shù)學(xué)研究 —— 如果擁有這么多資源卻毫無建樹，那也太說不過去了。但其他數(shù)學(xué)家依然會(huì)有極高的價(jià)值，因?yàn)閿?shù)學(xué)研究中存在一些我并不適合的思考方式和研究模式。

格雷格：人工智能會(huì)打破我們熟知的比較優(yōu)勢格局嗎？

丹尼爾：我認(rèn)為沒有理由這么認(rèn)為。而且我們討論的是沒有資源限制的情況，而資源限制是分析比較優(yōu)勢的關(guān)鍵前提。

格雷格：五年后的場景，或許會(huì)是這樣：人工智能在某些數(shù)學(xué)領(lǐng)域表現(xiàn)不佳，人類就專注于這些領(lǐng)域，而少數(shù)人類研究者則指導(dǎo)人工智能在其擅長的領(lǐng)域開展研究。

丹尼爾：我認(rèn)為研究者也會(huì)嘗試為人工智能建立一種 “研究品味” 的評(píng)估體系，讓它能自主去研究有價(jià)值的問題。五年的時(shí)間，25% 的概率這個(gè)判斷，我基本還是保持不變，可能會(huì)稍微調(diào)高一點(diǎn)。我認(rèn)為，在 15 到 20 年內(nèi)，人工智能系統(tǒng)大概率會(huì)在很多數(shù)學(xué)領(lǐng)域?qū)θ祟愋纬蓛?yōu)勢，如果沒有出現(xiàn)這種情況，我會(huì)感到很意外。

格雷格：你是根據(jù)什么趨勢做出這個(gè)判斷的？

丹尼爾：主要還是直觀感受。我也延續(xù)了人工智能預(yù)測的老傳統(tǒng)：說五年，就是認(rèn)為這件事很快會(huì)發(fā)生；說超過五年，就是指從五年到永遠(yuǎn)的任何時(shí)間。上世紀(jì) 60、70 年代的人工智能發(fā)展預(yù)測，也是這樣說 5 到 20 年的。

格雷格：說白了，就是兩種判斷：一種是 “可能很快會(huì)發(fā)生，但我不確定”，另一種是 “天啊，誰知道呢”。

丹尼爾：我的意思是，如果當(dāng)前的發(fā)展趨勢持續(xù)下去，模型能開展高質(zhì)量的自主數(shù)學(xué)研究，是有合理可能性的 ——25%，但遠(yuǎn)非必然。

六、智能的收益究竟有多大？

[00:42:15]

安森：或許我們可以把時(shí)間拉到 15 或 20 年以后，甚至更久。一個(gè)人思考 100 年，和 100 個(gè)人思考 1 年，這兩種方式的研究成果該如何對比？有沒有辦法衡量，一個(gè)人持續(xù)思考 100 年，能力會(huì)提升多少？

丹尼爾：我把這個(gè)問題和我們之前聊的 “如何判斷問題難度” 結(jié)合起來說吧。有很多數(shù)學(xué)問題，明顯具有這樣的特質(zhì)：如果開展一個(gè)曼哈頓計(jì)劃式的專項(xiàng)研究，集中力量攻克，很快就能解決，這些問題缺少的只是研究者的關(guān)注。即便只是讓幾位數(shù)學(xué)家全身心投入研究，這些問題也幾乎肯定能被解決。

格雷格：你能舉幾個(gè)這樣的例子嗎？

丹尼爾：比如最后一個(gè)散在有限單群 ——馬蒂厄群（Mathieu group） M??的反問題，這大概率是一個(gè)難題，已經(jīng)有不少人研究過了。但我敢肯定，如果美國政府將其每年 2 億美元的數(shù)學(xué)研究經(jīng)費(fèi)中的相當(dāng)一部分，投入到這個(gè)問題的研究中，它很快就能被解決。

格雷格：這個(gè)例子很有參考價(jià)值。

丹尼爾：如果讓一個(gè)人長期專注思考，很多問題都能被解決。我從 2016 年開始思考一個(gè)問題，這個(gè)問題是我在一場報(bào)告中接觸到的，我很喜歡這個(gè)問題，嘗試解決過，但當(dāng)時(shí)沒有任何進(jìn)展，不過我一直把它放在心上，最終在 2024 年解決了它。

在這個(gè)過程中，你會(huì)學(xué)習(xí)新的知識(shí)，將不同的問題關(guān)聯(lián)起來，還會(huì)遇到一個(gè)問題：如何將自己的知識(shí)和猜想匹配起來，甚至首先要知道這個(gè)猜想的存在。隨著時(shí)間的推移，你嘗試各種思路，有時(shí)最終就能找到解決方法。事實(shí)上，這個(gè)問題的解決方法中，有一個(gè)核心要素直到 2023 年才被提出，有時(shí)候你就是需要等待其他人完成相關(guān)的研究工作。

格雷格：這么說來，單個(gè)數(shù)學(xué)家的研究過程，其實(shí)有點(diǎn)像一個(gè)數(shù)學(xué)家團(tuán)隊(duì)的研究過程，因?yàn)槠渌艘餐瓿闪似渲械牟糠止ぷ鳌?/p>

丹尼爾：沒錯(cuò)，一部分原因就是時(shí)間的推移：你會(huì)學(xué)習(xí)新知識(shí)，嘗試不同思路，成為更優(yōu)秀的數(shù)學(xué)家，掌握更多研究方法。數(shù)學(xué)研究的一個(gè)重要點(diǎn) —— 也是目前人類依然遠(yuǎn)勝于模型的一點(diǎn)，就是當(dāng)你接觸到一個(gè)新的研究對象時(shí)，你會(huì)嘗試去 “熟悉” 它：反復(fù)研究、推敲各類相關(guān)問題和例子，分析相關(guān)的特殊情況，通過這種方式了解這個(gè)研究對象，并為其建立相關(guān)的理論。

我真的很擔(dān)心當(dāng)前范式下的模型能力：現(xiàn)在，模型想要學(xué)習(xí)一個(gè)新的領(lǐng)域，必須重新訓(xùn)練一個(gè)新模型。比如彼得?舒爾茨（Peter Scholze）正在發(fā)展的 Gestalten（格式塔）理論，這是一種新的空間理論，目前所有的模型都不了解這個(gè)理論，它們可以上網(wǎng)查閱相關(guān)論文，但無法真正接觸這個(gè)研究對象并開展研究。

格雷格：也就是只能做到淺嘗輒止的程度。

丹尼爾：它們無法真正去 “熟悉” 一個(gè)研究對象，而人類可以隨著時(shí)間的推移做到這一點(diǎn)。時(shí)間對解決問題的最大幫助，就是讓你熟悉研究對象，并形成相關(guān)的直覺。而模型如果不重新訓(xùn)練，就無法做到這一點(diǎn)。解決一個(gè)涉及新研究對象或新思考方式的問題，其邊際成本就是訓(xùn)練一個(gè)新模型的成本 —— 這個(gè)成本極高，遠(yuǎn)比讓一個(gè)人類研究者去理解這個(gè)研究對象的成本高得多。

格雷格：即便是為了完成這類研究，持續(xù)學(xué)習(xí)能力也顯得至關(guān)重要。

丹尼爾：這種持續(xù)學(xué)習(xí)，不僅僅是像人類一樣讀一篇論文就能理解研究對象，還需要像人類一樣去 “探索嘗試”。我知道目前已經(jīng)有人嘗試讓模型在數(shù)學(xué)研究中進(jìn)行自博弈，但目前還不清楚其效果如何。

格雷格：在模型的思維鏈推理中，能看到一點(diǎn)這種探索嘗試的跡象：它們會(huì)嘗試不同的思路，進(jìn)行一些摸索，最終找到解決方法。這可能是因?yàn)樗鼈兊挠?xùn)練目標(biāo)就是解決具體的問題，而非基于研究品味去尋找 “更好的研究視角”，或許這種能力會(huì)隨著規(guī)?；l(fā)展而提升。

丹尼爾：對，我對此并非持懷疑態(tài)度。

安森：我還發(fā)現(xiàn)一個(gè)有趣的點(diǎn)，就是研究的并行化存在局限性。你剛才提到的那個(gè) 2024 年解決的問題，依賴于 2023 年的另一項(xiàng)研究成果。如果對比 “丹尼爾思考 100 年” 和 “100 個(gè)丹尼爾同時(shí)思考”，或許長期的持續(xù)思考，會(huì)因?yàn)槌掷m(xù)學(xué)習(xí)而更有成效，但研究的并行化也存在瓶頸，或者說，整個(gè)數(shù)學(xué)研究領(lǐng)域的發(fā)展，還需要其他方面的突破。

丹尼爾：你說得很對。這個(gè)問題的解決，借鑒了兩大深度理論的成果：非交換霍奇理論和函數(shù)域上的朗蘭茲綱領(lǐng)。而這項(xiàng)研究能推進(jìn)的關(guān)鍵，是其他人 —— 埃斯諾爾特（Esnault）、達(dá)德齊奧（D’Addezio）和格雷琴尼希（Groechenig），利用函數(shù)域上的朗蘭茲綱領(lǐng)和伴隨理論證明了一個(gè)結(jié)論。這一點(diǎn)是我自己想不到的，雖然它和我的研究領(lǐng)域很接近，我也有所了解，但這確實(shí)是一個(gè)極具創(chuàng)造性的重要研究成果，和我當(dāng)時(shí)的研究思路截然不同。

即便我獨(dú)自思考這個(gè)問題 100 年，也很難確定自己能發(fā)現(xiàn)這兩者之間的關(guān)聯(lián)。從歷史來看，讓一個(gè)人類研究者獨(dú)自長期專注于一個(gè)問題，研究效率大概率是很低的，你會(huì)嘗試各種思路，然后在某個(gè)時(shí)間點(diǎn)遭遇收益遞減。

格雷格：研究的并行化中，多樣性是很重要的一點(diǎn)。你有沒有嘗試讓模型去做一些令人意外、更具原創(chuàng)性的研究，即便結(jié)果是錯(cuò)誤的？

丹尼爾：當(dāng)然試過?，F(xiàn)在，每當(dāng)我思考一個(gè)開放問題時(shí)，第一件事就是讓模型給出一些思路，但這些思路幾乎都是無意義的。

格雷格：確實(shí)是這樣。

丹尼爾：我從來沒有從模型那里，得到過一個(gè)能通過初步檢驗(yàn)、適用于深度開放問題的思路。

格雷格：從某種抽象的角度來看，隨機(jī)初始化似乎應(yīng)該能解決這個(gè)問題，但我們目前還沒看到這種效果。

丹尼爾：你也可以嘗試 —— 我每天醒來，其實(shí)都是一次新的 “隨機(jī)初始化”。

格雷格：沒錯(cuò)。

丹尼爾：但我自身的思維定式依然存在，這限制了我去真正探索數(shù)學(xué)研究的全部可能性。

安森：這就牽扯到了智能的收益問題。如果有一百萬個(gè)安森，嘗試去做你現(xiàn)在的研究，我認(rèn)為不會(huì)有太多進(jìn)展。而如果把規(guī)模再擴(kuò)大，一百萬個(gè)丹尼爾和超級(jí)智能數(shù)學(xué)家對比，是否會(huì)出現(xiàn)同樣的情況：超級(jí)智能的能力遠(yuǎn)超人類，無論增加多少研究者數(shù)量，或是延長多少研究時(shí)間，都無法匹敵？

丹尼爾：我先反駁一下你說的 “安森做我的研究不會(huì)有進(jìn)展” 這個(gè)觀點(diǎn)。我認(rèn)為，如果你真的投入大量時(shí)間去學(xué)習(xí)有趣的數(shù)學(xué)知識(shí)，一定能做出精彩的數(shù)學(xué)研究，只是研究的方向大概率會(huì)和我不同，因?yàn)槲覀兊钠煤湍芰Σ煌５憧雌饋硎莻€(gè)很聰明的人，只要有足夠的動(dòng)力和資源，我相信你一定能做出有價(jià)值的數(shù)學(xué)研究。

同樣，對于超級(jí)智能人工智能 —— 無論這個(gè)概念具體指什么，即便是在數(shù)學(xué)研究這個(gè)相對狹窄的領(lǐng)域，智能也是一種極其高維度的能力。對比不同的人類數(shù)學(xué)家就能發(fā)現(xiàn)，我們各自在截然不同的方面表現(xiàn)出色。即便想象出一個(gè)能解決大量有趣研究問題的人工智能，也無法確定它能解決所有人類擅長的、有趣的數(shù)學(xué)研究問題。

格雷格：我們可以把問題說得更具體一點(diǎn)：在某個(gè)特定領(lǐng)域中，最適合該領(lǐng)域的、最聰明的研究者，其研究效率的天花板是怎樣的？有沒有這樣的情況：如果你知道某個(gè)頂尖研究者正在研究一個(gè)問題，你就會(huì)避開這個(gè)問題？

丹尼爾：這種情況在某種程度上是存在的，但我認(rèn)為這和能力無關(guān)。比如目前p 進(jìn)霍奇理論是一個(gè)非?；钴S的領(lǐng)域，我在多個(gè)方面和這個(gè)領(lǐng)域有所交集，但我并沒有真正投身其中，原因是這個(gè)領(lǐng)域的發(fā)展速度非常快，如果我想進(jìn)入這個(gè)領(lǐng)域，需要學(xué)習(xí)大量知識(shí)，跟上其他研究者的步伐，這更多的是機(jī)會(huì)成本的問題。

格雷格：所以在人類研究者中，我們并沒有看到所謂的 “智能收益” 的極致體現(xiàn)。

丹尼爾：我有一個(gè)兩歲半的女兒，她很可愛，也很聰明，但目前還無法進(jìn)行數(shù)學(xué)研究，畢竟她才兩歲半。人類的能力之間，確實(shí)存在絕對的差異，但在專業(yè)數(shù)學(xué)家之間，能力的差異更多體現(xiàn)在數(shù)學(xué)研究是一個(gè)高維度的領(lǐng)域，而研究者各自專注于不同的方向。

如果模型繼續(xù)沿著當(dāng)前的范式發(fā)展，保持能力的不均衡性，且相比人類，其能力范圍更狹窄，那它們依然能為數(shù)學(xué)研究帶來巨大的價(jià)值。人類研究者各自專注于極小的研究領(lǐng)域，這意味著幾乎所有的數(shù)學(xué)問題，都存在 “關(guān)注瓶頸”—— 甚至能理解一個(gè)問題表述中所有術(shù)語的人，可能只有十個(gè)。你可以想象，這些問題本身未必很難，只是沒有人有時(shí)間去研究而已。

安森：對于關(guān)心超級(jí)智能和人工智能快速發(fā)展的人來說，還有一個(gè)角度：假設(shè)我們通過某種方式提升了數(shù)學(xué)研究的進(jìn)展速度，并將其分解為三個(gè)因素 —— 更多的人工智能、人工智能更長時(shí)間的研究、更智能的人工智能。這三者的貢獻(xiàn)占比會(huì)是怎樣的？

丹尼爾：其實(shí)在人工智能出現(xiàn)之前，我都不確定過去 40 年數(shù)學(xué)研究的進(jìn)展速度是否真的提升了。我的感受是，研究效率的提升，很大程度上歸功于數(shù)學(xué)家數(shù)量的增加。一旦人工智能的能力達(dá)到人類的水平，或許研究效率的提升，也會(huì)主要取決于人工智能的數(shù)量。

有一個(gè)小問題需要關(guān)注：為什么人類研究者的數(shù)量增加，能帶來研究效率的提升？一部分原因是關(guān)注的問題變多了，另一部分是思考方式的多樣性。而人工智能能否帶來同樣的效果，取決于其發(fā)展方向。

數(shù)學(xué)家數(shù)量的增加，帶來的研究效率提升，大概率只是因?yàn)橛懈嗟臅r(shí)間被投入到不同的問題上，有更多的問題得到了關(guān)注。我認(rèn)為，即便是能力并不出眾的人工智能，其數(shù)量的增加也能帶來顯著的研究效率提升。

而關(guān)于 “智能的收益”，這個(gè)問題的定義本身就不夠清晰，在我看來，智能是一個(gè)非常高維度的概念。

你可以想象，擁有一種能巧妙搜索高維度證明空間的能力，會(huì)具有極高的價(jià)值。黎曼猜想的證明，大概率需要發(fā)展出目前尚未存在的各類研究對象和理論，而這需要在極高維度的搜索空間中進(jìn)行大量的探索。

在實(shí)際研究中，這種探索大多是這樣進(jìn)行的：普通數(shù)學(xué)家研究各類研究對象，進(jìn)行低維度的搜索，驗(yàn)證大量的例子，發(fā)現(xiàn)其中的規(guī)律；然后研究者開始將這些規(guī)律提煉為相關(guān)的研究對象和理論。那些我們認(rèn)為最頂尖的數(shù)學(xué)家所做的、高層次的理論構(gòu)建，其實(shí)高度依賴于底層的大量基礎(chǔ)工作和例子分析，而這在很大程度上，也歸功于數(shù)學(xué)家數(shù)量的增加帶來的規(guī)模效應(yīng)。

七、人工智能會(huì)解決千禧年數(shù)學(xué)難題嗎？

[00:59:50]

格雷格：來聊一個(gè)有趣的小問題：你認(rèn)為黎曼猜想，或是其他的千禧年難題，在不同時(shí)間被解決的概率是多少？

丹尼爾：我最熟悉的千禧年難題是黎曼猜想、BSD猜想（伯奇和斯溫納頓 - 戴爾猜想），以及霍奇猜想。其中，黎曼猜想是我們唯一能大致想象出證明框架的難題。

有一個(gè)與之類似的猜想 ——有限域上代數(shù)簇的黎曼猜想，由德利涅（Deligne）在上世紀(jì) 70 年代證明，而其中最接近黎曼猜想的部分，是更早由韋伊（Weil）證明的曲線的黎曼猜想。我們其實(shí)能大致想象出黎曼猜想的證明框架 —— 它應(yīng)該和韋伊的證明框架相似。

韋伊給出了曲線黎曼猜想的兩個(gè)證明，問題在于，證明中的各類推導(dǎo)步驟，在整數(shù)域中并不適用，只適用于有限域上的曲線。我們需要找到方法，讓這些推導(dǎo)步驟在整數(shù)域中也能成立。這聽起來像是科幻小說，但至少我們有一個(gè)看似合理的思考方向。

很多數(shù)學(xué)家都研究過如何讓這些推導(dǎo)步驟在整數(shù)域中成立，我認(rèn)為在未來十年內(nèi)，其中一種嘗試有可能成功，我給的概率大概是 15%—— 概率不算高，但也并非不可能。

總體而言，觀察重大開放問題的解決過程會(huì)發(fā)現(xiàn)，從掌握解決問題所需的最后一個(gè)關(guān)鍵思路，到最終完成證明，這段時(shí)間通常都很短。比如費(fèi)馬大定理，谷山-志村（Taniyama-Shimura）猜想的提出，到費(fèi)馬大定理最終被證明，時(shí)間間隔其實(shí)并不長。

格雷格：這么說來，既然曲線的韋伊猜想已經(jīng)被證明了幾十年，或許黎曼猜想的證明也離我們不遠(yuǎn)了？

丹尼爾：事實(shí)上，當(dāng)韋伊證明了曲線的黎曼猜想后，人們都認(rèn)為黎曼猜想的證明很快就會(huì)到來，這是我對這段數(shù)學(xué)史的理解。但結(jié)果并非如此，所以人們其實(shí)并不知道，解決黎曼猜想還缺少哪些關(guān)鍵的新想法，我們只是對這些想法的大致方向有一些模糊的感知。

事實(shí)上，當(dāng)韋伊證明了曲線領(lǐng)域的黎曼猜想后，人們都以為黎曼猜想的完整證明很快就會(huì)問世。這是我對這段歷史的理解?？山Y(jié)果并非如此。所以時(shí)至今日，人們依然不知道究竟缺失了哪些新的思路。我們只是隱約能感知到，這些新思路大概會(huì)是何種方向。

格雷格：人工智能的發(fā)展，有沒有讓你改變對相關(guān)時(shí)間的預(yù)判？

丹尼爾：其實(shí)并沒有 —— 我目前還沒看到，人工智能展現(xiàn)出開展高質(zhì)量數(shù)學(xué)研究所需的任何關(guān)鍵特質(zhì)。一絲火花都沒有。在我看來，解開一道國際數(shù)學(xué)奧林匹克競賽題，與開展高質(zhì)量的數(shù)學(xué)研究之間的差距，比很多人想象的要大得多。

我的預(yù)判基本沒什么變化。當(dāng)下人工智能能助力完成的任務(wù)，以及看似很快就能勝任的任務(wù)，似乎都并非解決重大未解猜想的核心瓶頸。話雖如此，我依然認(rèn)為人工智能有 25% 的可能性實(shí)現(xiàn)高質(zhì)量的數(shù)學(xué)研究。而這其中或許有 5% 的可能性 —— 具體取決于技術(shù)的發(fā)展路徑 —— 它會(huì)取得一些顛覆性的突破。

格雷格：聊個(gè)輕松的話題：千禧年大獎(jiǎng)難題。這些數(shù)學(xué)領(lǐng)域的重大目標(biāo)，你覺得它們被解決的可能性有多大？人工智能又是否會(huì)做出實(shí)質(zhì)性的貢獻(xiàn)？

丹尼爾：我的預(yù)判是，未來十年，沒有任何一個(gè)千禧年大獎(jiǎng)難題能由人工智能自主解決。

格雷格：十年？

丹尼爾：總的來說，未來十年能被解決的，我覺得可能是 0 到 1 個(gè)。納維 - 斯托克斯方程的研究據(jù)說有了一些進(jìn)展，不過這并非我的研究領(lǐng)域，但我并不認(rèn)為它被徹底解決是完全不可能的事。近期有消息稱，有一個(gè)團(tuán)隊(duì)正與深度思維公司合作研究這個(gè)問題 —— 他們用的或許更多是傳統(tǒng)的深度學(xué)習(xí)技術(shù)，而非大語言模型或推理模型。

格雷格：這七個(gè)難題中，龐加萊猜想在被正式提出后不久就被解決了。也就是說，我們的成功先例并非為零。

丹尼爾：但其中有幾個(gè)難題，比如霍奇猜想，目前來看完全毫無思路，BSD 猜想也是如此。至于黎曼猜想，我們之前也聊過，雖然有一些初步的思路，但根本說不清離最終證明還有多遠(yuǎn)?？赡苁陜?nèi)就能解決，也可能要等上百年。

格雷格：這和你對人工智能發(fā)展時(shí)間線的其他判斷能關(guān)聯(lián)起來 —— 你說五年內(nèi)人工智能寫出《數(shù)學(xué)年刊》級(jí)別的論文有 25% 的可能性，這其中是否也包含了……

丹尼爾：我的看法是，即便人工智能還沒開始攻克千禧年大獎(jiǎng)難題，實(shí)現(xiàn)這一目標(biāo)也是很有可能的。

格雷格：也就是說，這 25% 的可能性里，攻克千禧年難題的占比其實(shí)很小。而你預(yù)判的 20 年時(shí)間線，其實(shí)已經(jīng)超出了這個(gè)范疇 —— 是人工智能經(jīng)過更久的沉淀和發(fā)展之后的事。

丹尼爾：這取決于人工智能的發(fā)展速度是否會(huì)加快，或者說是否能實(shí)現(xiàn)自我迭代?？偟膩碚f，我對此持懷疑態(tài)度，就像我對所有領(lǐng)域的發(fā)展加速論都存疑一樣。

格雷格：那我們不妨聊聊數(shù)學(xué)研究的評(píng)估與基準(zhǔn)測試。先做一個(gè)假設(shè)：你說目前還沒看到人工智能展現(xiàn)出你認(rèn)為的關(guān)鍵特質(zhì)，那這些特質(zhì)具體是什么？

丹尼爾：我來設(shè)想一下，在我看來，人工智能具備這些特質(zhì)會(huì)有哪些信號(hào)。

第一，提出一個(gè)新穎且有價(jià)值的定義，這一點(diǎn)至關(guān)重要；

第二，展現(xiàn)出專業(yè)的研究品味 —— 比如提出一個(gè)有意義的問題，哪怕只是通過猜想發(fā)現(xiàn)某種新的數(shù)學(xué)現(xiàn)象。事實(shí)上，很多最重要的數(shù)學(xué)成果，最初都只是一個(gè)猜想。而這一點(diǎn)，目前的人工智能系統(tǒng)很難做到。

第三，構(gòu)建一套理論 —— 這和提出新定義相關(guān)，也就是建立理論體系的能力。目前來看，人工智能還從未展現(xiàn)出過這種能力。不過讓我頗感意外的是，現(xiàn)在的模型能在訓(xùn)練中學(xué)習(xí)人類使用的方法，并加以應(yīng)用。這也是推理模型的重大突破 —— 它們能掌握成熟的方法，并以較高的可靠性落地應(yīng)用。

如果人工智能能開發(fā)出一種新的研究方法 —— 新方法和舊方法之間本就存在一個(gè)連續(xù)的發(fā)展譜系 —— 只要我能識(shí)別出這種創(chuàng)新，那就是一個(gè)重要信號(hào)。但目前來看，這些特質(zhì)人工智能一個(gè)都不具備。它們會(huì)很快擁有嗎？或許吧。

格雷格：在數(shù)學(xué)研究的各項(xiàng)任務(wù)中，哪些是人工智能最難攻克的？你提到的構(gòu)建理論和提出猜想似乎是核心難點(diǎn)，還有其他的嗎？

丹尼爾：我要求自己的每一篇論文都包含新的思路，雖然并非所有論文都能做到 —— 有時(shí)候你只是找到一個(gè)技巧，解決了一個(gè)古老的猜想。其實(shí)大多數(shù)人都很難產(chǎn)生大量新想法，數(shù)學(xué)家通常一年也就發(fā)表 1 到 2 篇論文。和其他學(xué)科相比，我們的總產(chǎn)出其實(shí)并不算高。

而開發(fā)一種新的研究方法，本質(zhì)上就是提出真正的新想法?？删烤故裁床潘闶切孪敕ǎ窟@正是最難的地方。

格雷格：只有當(dāng)你真正看到時(shí)，才會(huì)明白。

丹尼爾：沒錯(cuò)，這就是核心難點(diǎn)。人們總喜歡拿AlphaGo舉例 —— 它的第 37 步棋被稱作 “非人類的一步”，是人類棋手永遠(yuǎn)不會(huì)想到的走法。這一步，讓人工智能跳出了人類棋手的搜索范圍。但如果人工智能只是提出了一個(gè)新想法，哪怕這個(gè)想法人類也能想到，這算不算另一種形式的 “第 37 步棋”？

有意思的是，其實(shí)在這些人工智能系統(tǒng)出現(xiàn)之前，類似的情況就已經(jīng)存在了。開普勒猜想的證明、四色定理的證明，都是 “非人類的證明”。研究的主導(dǎo)者是人，但絕大部分工作都是由計(jì)算機(jī)完成的海量案例分析 —— 你可以說這是繁瑣的案例分析，也可以說是精妙的，因?yàn)閿?shù)學(xué)里沒有糟糕的研究，所有正確的結(jié)論都是美的。

格雷格：你說過，你會(huì)鼓勵(lì)自己的研究生去適應(yīng)這種研究方式。

丹尼爾：解決數(shù)學(xué)問題，本就該不擇手段，為什么要自我設(shè)限？從這個(gè)角度來說，上述的計(jì)算機(jī)輔助證明其實(shí)也算一種 “第 37 步棋”，只不過和人工智能無關(guān)。但如果人工智能只是復(fù)刻這種證明方式 —— 把海量的案例分析自動(dòng)化，我不會(huì)認(rèn)為這是它的 “第 37 步棋”，因?yàn)槿祟愒缇妥龅竭^這一點(diǎn)了。

你也可以想象，用Lean定理證明器給出某個(gè)難題的證明過程，全程沒有任何注釋，人類根本無法從中提煉出清晰的論證思路。只要看過Lean的代碼就知道，這絕非易事。

但如果我看到人工智能提出了一種我認(rèn)為的新方法 —— 一種在現(xiàn)有文獻(xiàn)中完全找不到先例的方法，那我會(huì)感到無比興奮。

格雷格：我之所以格外關(guān)注你的觀點(diǎn)，是因?yàn)槟阋恢痹谂ψ龅綄?shí)事求是，不隨意抬高評(píng)價(jià)的門檻。

丹尼爾：人總是很容易忍不住抬高門檻。當(dāng)下，人工智能解決一個(gè)問題所能說明的，一方面是 “人工智能具備相應(yīng)能力”，另一方面也可能是 “這個(gè)問題本身并不難”。

數(shù)學(xué)家們總愛說：“這個(gè)問題雖然被人工智能解決了，但它其實(shí)很簡單，所以我們不必過分高估人工智能的能力?！?在某種程度上，這話是對的。但我們也應(yīng)該客觀評(píng)估模型的實(shí)際表現(xiàn)，不妨問問自己：如果這是人類寫出的答案，我會(huì)感到興奮嗎？對于近期人工智能解決的那些數(shù)學(xué)問題，如果有人告訴我，這是人類用這種方法解決的 —— 現(xiàn)實(shí)中也確實(shí)有人類做到過 —— 我會(huì)說：“哇，這很酷?！?對待人工智能的成果，我也是同樣的態(tài)度。

格雷格：“哇，這很酷。生活繼續(xù)。但當(dāng)下不必貶低這份成果?！?/p>

——上篇完，下篇待續(xù)——

原文參考資料：

歐拉冪和猜想：

蘭德與帕金（Lander & Parkin，1966 年，首個(gè)反例）https://www.ams.org/journals/bull/1966-72-06/S0002-9904-1966-11654-3/S0002-9904-1966-11654-3.pdf

埃爾基斯（Elkies，1988 年，四次冪情形）https://www.ams.org/journals/mcom/1988-51-184/S0025-5718-1988-0930224-9/S0025-5718-1988-0930224-9.pdf

埃斯諾爾特與格羅申尼希（Esnault & Groechenig，相伴理論與朗蘭茲綱領(lǐng)）https://arxiv.org/abs/1707.00752

德利涅（Deligne）對韋伊猜想的證明（1974 年）http://www.numdam.org/item/PMIHES_1974__43__273_0/

澤塔ζ函數(shù)值的無理性：

阿佩里（Apéry）的證明（1978-1979 年）http://www.numdam.org/item/AST_1979__61__11_0/

范德普滕（Van der Poorten）的闡釋https://doi.org/10.1007/BF03028234

扎吉爾（Zagier）的計(jì)算https://people.mpim-bonn.mpg.de/zagier/files/tex/AperylikeRecEqs/fulltext.pdf

卡萊加里 - 季米特洛夫 - 唐云清（Calegari-Dimitrov-Tang）的近期進(jìn)展https://arxiv.org/abs/2408.15403

數(shù)論中的隨機(jī)模型：

梅蘭妮?馬切特?伍德（Melanie Matchett Wood）關(guān)于隨機(jī)矩陣的研究https://doi.org/10.1353/ajm.2019.0008

科恩 - 倫斯特拉（Cohen-Lenstra）啟發(fā)式https://doi.org/10.1007/BFb0099440

提及的千禧年大獎(jiǎng)難題：

黎曼猜想https://www.claymath.org/millennium/riemann-hypothesis/

霍奇猜想https://www.claymath.org/millennium/hodge-conjecture/

貝赫和斯維訥通 - 戴爾（BSD）猜想https://www.claymath.org/millennium/birch-and-swinnerton-dyer-conjecture/

納維 - 斯托克斯方程https://www.claymath.org/millennium/navier-stokes-equation/

前沿?cái)?shù)學(xué)：開放式問題基準(zhǔn)測試 https://epoch.ai/frontiermath/open-problems

參考資料

https://epoch.ai/epoch-after-hours/daniel-litt-ai-math-capabilities-could-be-jagged-for-a-long-time

小樂數(shù)學(xué)科普近期文章

·開放 · 友好 · 多元 · 普適 · 守拙·

讓數(shù)學(xué)

更加

易學(xué)易練

易教易研

易賞易玩

易見易得

易傳易及

歡迎評(píng)論、點(diǎn)贊、在看、在聽

收藏、分享、轉(zhuǎn)載、投稿

查看原始文章出處

點(diǎn)擊zzllrr小樂

公眾號(hào)主頁

右上角

置頂加星★

數(shù)學(xué)科普不迷路！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.