国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

專訪數(shù)學(xué)家Daniel Litt(丹尼爾?利特):AI人工智能的數(shù)學(xué)能力或長期處于不均衡發(fā)展?fàn)顟B(tài)(上)

0
分享至

置頂zzllrr小樂公眾號(hào)(主頁右上角)數(shù)學(xué)科普不迷路!


訪談背景簡介:

丹尼爾?利特(Daniel Litt)是多倫多大學(xué)數(shù)學(xué)系教授。他一直密切關(guān)注AI人工智能在推動(dòng)數(shù)學(xué)發(fā)現(xiàn)領(lǐng)域的發(fā)展進(jìn)程,對此態(tài)度時(shí)而審慎懷疑,時(shí)而滿懷期待。

本期Epoch.ai與其探討的話題包括:當(dāng)下的模型能解決的最難數(shù)學(xué)問題究竟是什么;是否有確鑿證據(jù)表明人工智能正推動(dòng)數(shù)學(xué)研究提速;以及人工智能能否攻克千禧年大獎(jiǎng)難題。

他們還探討如何評(píng)估數(shù)學(xué)研究的進(jìn)展,其中包括Epoch.ai全新推出的「FrontierMath前沿?cái)?shù)學(xué):開放式問題」基準(zhǔn)測試 —— 該測試以數(shù)學(xué)領(lǐng)域具有研究價(jià)值的未解問題為依據(jù),對人工智能模型的能力進(jìn)行評(píng)估。

詳情參閱:

訪談人簡介:


丹尼爾·利特(Daniel Litt是多倫多大學(xué)數(shù)學(xué)助理教授。他獲得斯坦福大學(xué)博士學(xué)位,研究重點(diǎn)是代數(shù)幾何與數(shù)論之間的相互作用。


格雷格?伯納姆(Greg Burnham是 Epoch AI 的研究員。在此之前,他曾在Elemental Cognition和Bridgewater Associates工作。他擁有普林斯頓大學(xué)數(shù)學(xué)學(xué)士學(xué)位。


安森(Anson Ho是 Epoch AI 的研究員。他致力于幫助對人工智能未來發(fā)展及其社會(huì)影響進(jìn)行更嚴(yán)謹(jǐn)?shù)睦斫狻?/p>

時(shí)間節(jié)點(diǎn)目錄:

(采訪時(shí)間和內(nèi)容較長,分成十四小節(jié),上下兩篇。本篇為上篇,涉及前七小節(jié))

00:00:00 一、如今人工智能能解決的最難數(shù)學(xué)問題是什么?

00:16:08 二、當(dāng)下的人工智能模型對數(shù)學(xué)研究的助力有多大?

00:23:36 三、垃圾論文、大語言模型生成的證明與審稿危機(jī)

00:27:21 四、人工智能實(shí)現(xiàn)數(shù)學(xué)問題的大規(guī)模篩選

00:33:49 五、人工智能何時(shí)能發(fā)展到足以在頂級(jí)數(shù)學(xué)期刊發(fā)表成果的水平?

00:42:15 六、智能的價(jià)值回報(bào)體現(xiàn)在何處?

00:59:50 七、人工智能能否攻克千禧年大獎(jiǎng)難題?

01:11:54 八、數(shù)學(xué)領(lǐng)域還存在大量易解的「低垂果實(shí)」嗎?

01:18:47 九、丹尼爾如何調(diào)整職業(yè)發(fā)展,以適應(yīng)人工智能的發(fā)展進(jìn)程?

01:25:28 十、人工智能數(shù)學(xué)基準(zhǔn)測試,實(shí)際在評(píng)估什么能力?

01:33:05 十一、開放式問題基準(zhǔn)測試的設(shè)計(jì)思路

01:56:35 十二、數(shù)學(xué)家會(huì)相信關(guān)于數(shù)學(xué)猜想的啟發(fā)式論證嗎?

02:01:24 十三、若人工智能攻克「FrontierMath前沿?cái)?shù)學(xué):開放式問題」基準(zhǔn)測試,會(huì)帶來什么影響?

02:06:53 十四、人工智能是否即將推動(dòng)數(shù)學(xué)研究邁入加速發(fā)展階段?

作者:epoch.ai 2026-1-29

譯者:zzllrr小樂(數(shù)學(xué)科普公眾號(hào))2026-1-30

訪談實(shí)錄(上):
一、如今的人工智能能攻克哪些最難的數(shù)學(xué)難題?
[00:00:00]

格雷格:大家好,我是Epoch人工智能研究院(Epoch AI)的研究員格雷格?伯納姆(Greg Burnham),這位是我的同事安森(Anson Ho)。

安森:我也是Epoch人工智能研究院的研究員。

格雷格:今天我們還邀請到了丹尼爾,你好,丹尼爾。

丹尼爾:你們好,很高興和大家見面,能線下交流很開心。我是丹尼爾?利特( Daniel Litt ),多倫多大學(xué)的數(shù)學(xué)教授。

格雷格:我們先從一個(gè)有趣的問題開始吧。你能否說說,如今的人工智能系統(tǒng)能解決的最難的數(shù)學(xué)難題,大概處于什么水平?

丹尼爾:這個(gè)問題問得很好。目前所有的前沿大模型,基本都能在最新的國際數(shù)學(xué)奧林匹克競賽(IMO)中拿到金牌,這可以作為衡量其能力的一個(gè)不錯(cuò)基準(zhǔn)。后面我們也會(huì)聊到幾個(gè)已經(jīng)被解決的數(shù)學(xué)開放問題,這些問題要么是在人工智能的輔助下解決的,要么是由人工智能自主攻克的。客觀來說,這些問題的難度大概相當(dāng)于國際數(shù)學(xué)奧林匹克競賽中難度中等或偏低的題目。

格雷格:明白了。

丹尼爾:有跡象表明,現(xiàn)在的人工智能系統(tǒng)其實(shí)能做到更好一些。如果加以優(yōu)化,當(dāng)前這一代的模型大概率能發(fā)揮出更優(yōu)的性能。但總體而言,其解題水平還是停留在競賽題層面 —— 也就是優(yōu)秀的高中生或大學(xué)生能在幾小時(shí)內(nèi)解決的題目。

格雷格:你曾大膽斷言,未來一年內(nèi),我們或許能看到一些些許有價(jià)值的數(shù)學(xué)猜想被人工智能解決。這句話具體是什么意思?

丹尼爾:在我看來,“些許有價(jià)值的猜想”,指的是有人正式發(fā)表過、至少有一個(gè)研究者真正關(guān)注過,且大概率有人為其花費(fèi)過至少數(shù)小時(shí)研究的猜想。這類難度的猜想數(shù)量不少,我認(rèn)為當(dāng)前的人工智能系統(tǒng),在算力支持達(dá)到約 100 萬次運(yùn)算量級(jí)的情況下,就能解決其中一部分。

格雷格:懂了。

丹尼爾:其實(shí)近期已經(jīng)有一些例子符合這個(gè)標(biāo)準(zhǔn)了,或許這個(gè)預(yù)測已經(jīng)成真,只是對于這些問題的實(shí)際價(jià)值,還存在一些爭議。

格雷格:也就是爭議在于這些問題的價(jià)值到底有多大。

丹尼爾:對,核心就是這些問題的實(shí)際研究價(jià)值究竟如何。

格雷格:你多次提到用 “人類解決該問題所需的時(shí)間” 作為衡量標(biāo)準(zhǔn),你總體來說認(rèn)可這個(gè)衡量維度嗎?

丹尼爾:說實(shí)話,并不認(rèn)可。我覺得這不是衡量難題難度的好方法。拿國際數(shù)學(xué)奧林匹克競賽的題目來說,全世界最頂尖的參賽學(xué)生大概有一個(gè)半小時(shí)的解題時(shí)間,這能給難度設(shè)定一個(gè)上限,但對于很多這類題目,如果你交給專業(yè)數(shù)學(xué)家來做,他們實(shí)際花費(fèi)的時(shí)間反而會(huì)更長 —— 因?yàn)樗麄儠?huì)反復(fù)推敲,也沒有競賽中那種強(qiáng)烈的解題動(dòng)力。此外,解決競賽題所用到的方法是非常有限的,而在數(shù)學(xué)研究中,研究者沒有任何方法上的束縛,會(huì)嘗試所有思路、反復(fù)摸索,甚至?xí)柚?jì)算機(jī)演算具體的例子。

難度本身是個(gè)很微妙的概念,該如何評(píng)判呢?很多時(shí)候,或許最好的評(píng)判方式是事后復(fù)盤:當(dāng)你看到證明過程的邏輯結(jié)構(gòu)后,會(huì)覺得 “其實(shí)這個(gè)問題也沒那么難”。但這種方式也有隱患 —— 如果用它來評(píng)估人工智能模型的能力,很容易導(dǎo)致不斷改變評(píng)判標(biāo)準(zhǔn):模型給出了證明,你卻會(huì)說 “這題本來就不難,我不過是點(diǎn)了個(gè)按鈕而已”。

安森:你經(jīng)常在推特上提到,這些人工智能系統(tǒng)能為數(shù)學(xué)研究帶來的實(shí)際助力其實(shí)相當(dāng)有限,但也有人認(rèn)為這種助力要大得多。你如何解釋這種認(rèn)知差異?

丹尼爾:人工智能模型在某些領(lǐng)域的表現(xiàn)確實(shí)更出色。比如最優(yōu)化理論領(lǐng)域,我的了解是,OpenAI 有不少該領(lǐng)域的專家,他們生成了大量相關(guān)數(shù)據(jù),還結(jié)合自身的人類專業(yè)知識(shí)指導(dǎo)模型訓(xùn)練。所以該領(lǐng)域的研究者能從模型中獲得更多幫助,我一點(diǎn)也不意外。相比之下,在代數(shù)幾何和數(shù)論領(lǐng)域,人工智能模型的表現(xiàn)就沒那么好了。

有些研究領(lǐng)域,更適配人工智能模型當(dāng)前所具備的工具使用能力。比如你想為某個(gè)不等式找反例,編寫代碼驗(yàn)證是很自然的做法;但如果你想為 “三次三維簇的中間雅可比簇相關(guān)猜想” (

intermediate Jacobian of a cubic threefold
)找反例,大概率沒有任何代碼能幫上忙。

除此之外,我認(rèn)為很多人可能夸大了模型對自己的幫助。新工具的出現(xiàn),使用起來確實(shí)很有趣,但很多人在談?wù)撊斯ぶ悄芗铀倏茖W(xué)研究時(shí),并沒有嘗試進(jìn)行嚴(yán)謹(jǐn)?shù)膶?shí)證檢驗(yàn)。我愿意相信,人工智能確實(shí)消除了研究中的一些阻礙,但數(shù)學(xué)研究中還有很多瓶頸,是當(dāng)前的模型無法觸及的。如果人工智能只是解決了 “打開論文找到引理 3.7” 這類小問題,卻無法幫研究者產(chǎn)生好的想法,那這真的能算加速研究嗎?

安森:我通常會(huì)用莫拉維克(Moravec)悖論來解釋人工智能在不同領(lǐng)域的能力差異或能力的不均衡性,而在數(shù)學(xué)領(lǐng)域內(nèi)部,這種能力的不均衡性同樣存在。一部分原因來自訓(xùn)練數(shù)據(jù),一部分是因?yàn)橛行?shù)學(xué)領(lǐng)域更適配人工智能的特性。這兩點(diǎn)能解釋大部分的能力差異嗎?還是說還有其他因素?

丹尼爾:開展數(shù)學(xué)研究需要的是一種高維度的綜合能力,這和競賽解題有一點(diǎn)不同 —— 研究中沒有一套固定的、已知的有效方法。那些需要?jiǎng)?chuàng)造性思維的數(shù)學(xué)問題,模型至今都沒能成功解決。

我們在數(shù)學(xué)領(lǐng)域看到的這種能力不均衡,其實(shí)和在其他所有領(lǐng)域看到的情況是一樣的,并沒有什么特殊性。人工智能模型無法自主開展高質(zhì)量數(shù)學(xué)研究的最大障礙,和自動(dòng)化任何工作的最大障礙是同一個(gè):它們無法完成長上下文任務(wù)。人類需要花費(fèi)六個(gè)月解決的任務(wù),模型目前完全做不到。一旦未來的模型能完成這個(gè)量級(jí)的軟件工程任務(wù),那么它們開始開展高質(zhì)量的數(shù)學(xué)研究,也就不足為奇了。在這一點(diǎn)上,數(shù)學(xué)研究并沒有什么特殊之處。

格雷格:我有一個(gè)腦洞大開的想法:人工智能模型在空間推理和視覺空間直覺方面的能力較弱,或許當(dāng)一個(gè)數(shù)學(xué)問題能通過符號(hào)運(yùn)算的方式解決時(shí),它們的表現(xiàn)會(huì)格外出色?

丹尼爾:或許是這樣,但我對這種解釋持一點(diǎn)懷疑態(tài)度。數(shù)學(xué)家思考數(shù)學(xué)問題的方式千差萬別,我們中有些人是空間視覺型思考者,有些人則更偏向語言文字型思考者。

格雷格:我很好奇,有沒有數(shù)學(xué)家患有心象缺失癥(aphantasia)?

丹尼爾:當(dāng)然有,甚至有些幾何學(xué)家都患有心象缺失癥,這是很有名的事。有大量數(shù)學(xué)家在用截然不同的方法研究問題,這也是為什么有些數(shù)學(xué)家的整體數(shù)學(xué)水平遠(yuǎn)高于我,卻無法在相同時(shí)間內(nèi)證明我能證明的定理,甚至根本證明不了。核心原因就是我們的研究方法不同。

目前能較好解決數(shù)學(xué)問題的人工智能模型大概有三四款,它們的解題方法略有差異,但這種差異性遠(yuǎn)小于人類數(shù)學(xué)家之間的差異,這一點(diǎn)在各項(xiàng)基準(zhǔn)測試中也能體現(xiàn)出來:不同模型能解決的問題有很高的重合度,而基準(zhǔn)測試中的所有問題,至少有一位人類數(shù)學(xué)家能解決。在我看來,我們可以把人工智能模型看作一位獨(dú)立的數(shù)學(xué)家 —— 它們會(huì)在某些問題上表現(xiàn)出色,也會(huì)在某些問題上束手無策。但或許我們不必過度解讀模型擅長或不擅長的問題類型,這只是因?yàn)槟壳翱晒┭芯康哪P椭挥袃扇疃?,只是一種客觀結(jié)果。

格雷格:你認(rèn)為人工智能的能力,在數(shù)學(xué)的不同子領(lǐng)域之間,存在多大的遷移性?

丹尼爾:我的感受是,當(dāng)你讓模型證明一個(gè)代數(shù)幾何領(lǐng)域的命題時(shí),它大概率只會(huì)嘗試在文獻(xiàn)中找到相關(guān)命題,或是極其相似的結(jié)論,然后在此基礎(chǔ)上進(jìn)行一兩步推理。而當(dāng)你問它一個(gè)組合數(shù)學(xué)的問題時(shí),它并不會(huì)做出同樣的、真正的解題嘗試。

和一個(gè)掌握了所有模型所知的代數(shù)幾何或數(shù)論知識(shí)的研究生相比,這個(gè)研究生能進(jìn)行的推理要多得多,也能真正嘗試去證明定理。在部分?jǐn)?shù)學(xué)領(lǐng)域,模型的知識(shí)儲(chǔ)備已經(jīng)超越人類,但它們未必掌握了擁有相同知識(shí)儲(chǔ)備的人類研究生所具備的研究方法。這只是我的直觀感受。

格雷格:你覺得模型在哪些數(shù)學(xué)領(lǐng)域的原生推理能力更強(qiáng)?

丹尼爾:在證明不等式這類問題上,它們的能力絕對比我強(qiáng)。我猜測原因是這類問題更容易生成訓(xùn)練數(shù)據(jù),而且相關(guān)的訓(xùn)練數(shù)據(jù)量可能遠(yuǎn)多于代數(shù)幾何領(lǐng)域。

格雷格:你說的不等式,是競賽類型的不等式嗎?還是分析學(xué)中更有研究價(jià)值的不等式?

丹尼爾:是那些編寫代碼能輔助解決的不等式問題,模型在這類問題上的表現(xiàn)通常都很出色。現(xiàn)在我每次需要證明不等式時(shí),第一步都會(huì)借助模型編寫代碼,來探究問題的解空間特征。

格雷格:你之前提到的兩個(gè)觀點(diǎn),看起來存在一定矛盾:一方面,你說模型缺少的是產(chǎn)生好想法的能力;另一方面,你又說如果模型能在多個(gè)領(lǐng)域持續(xù)工作六個(gè)月,或許也能做好數(shù)學(xué)研究。

丹尼爾:這個(gè)問題問得很好,這兩個(gè)觀點(diǎn)確實(shí)存在矛盾。在我看來,從單純應(yīng)用已知方法,到開發(fā)新的研究方法,這之間是一個(gè)連續(xù)的過程。而開發(fā)一種新方法,說白了就是把上百種不同的思路以某種方式結(jié)合起來,而完成這件事的關(guān)鍵要素之一,就是時(shí)間。只是目前還不確定,時(shí)間是不是唯一的要素。

我自己做數(shù)學(xué)研究的經(jīng)歷是,極少會(huì)出現(xiàn) “突然想到一個(gè)絕妙的想法,一下子就解決了問題” 的情況。偶爾會(huì)有半夜醒來,問題突然有了答案的時(shí)刻,但通常這種情況的發(fā)生,前提是你已經(jīng)為這個(gè)問題鉆研了數(shù)月。時(shí)間的積累確實(shí)有其獨(dú)特的價(jià)值,只是我不確定自己的自我反思是否足夠可靠,能判斷時(shí)間是不是唯一的核心要素。

研究中還會(huì)發(fā)生其他事:你會(huì)形成自己的研究思路,或是找到不同問題之間的類比關(guān)系 —— 數(shù)學(xué)研究中存在一種難以言喻的玄妙特質(zhì),而這種特質(zhì),目前的模型還無法展現(xiàn)。但或許這也只是一種主觀感受,這種玄妙的特質(zhì),可能只是把你讀過、吸收的大量想法濃縮成人類能理解的形式而已,或許和上下文壓縮的原理很接近。

格雷格:目前有一些關(guān)于智能的核心類比觀點(diǎn) —— 比如 “智能是一種搜索行為”,或是 “智能是一種信息壓縮能力”,而人類目前只是在這些方面做得更好而已。

丹尼爾:我總體上對這類類比持懷疑態(tài)度。在我看來,做好數(shù)學(xué)研究的方式有很多種??纯床煌瑪?shù)學(xué)家的研究能力就會(huì)發(fā)現(xiàn),彼此的能力重疊度其實(shí)很低。我敢肯定,沒有哪位數(shù)學(xué)家能證明我能證明的所有定理,也有很多數(shù)學(xué)家的思考方式和我截然不同。

二、如今的人工智能模型對數(shù)學(xué)研究的幫助有多大?

[00:16:08]

格雷格:能否結(jié)合前代研究工具,說說你認(rèn)為當(dāng)前人工智能工具的實(shí)際效用?比如文獻(xiàn)檢索功能,現(xiàn)在的模型確實(shí)做得更好,但谷歌學(xué)術(shù)早就實(shí)現(xiàn)了文獻(xiàn)檢索。

丹尼爾:目前的人工智能工具,其實(shí)和前代工具處于同一發(fā)展脈絡(luò)中。文獻(xiàn)檢索方面,模型至少在部分任務(wù)上,已經(jīng)比谷歌或谷歌學(xué)術(shù)做得更好了,這確實(shí)能節(jié)省一些時(shí)間,但具體能省多少,我也不確定。和過去去圖書館查資料相比,能節(jié)省多少時(shí)間呢?

格雷格:大概就是長期來看,能提升 2% 左右的工作效率這種水平。

丹尼爾:沒錯(cuò),基本就是這個(gè)趨勢。總體而言,這些提升都相當(dāng)有限,我懷疑其帶來的效率提升不會(huì)超過 1% 或 2%。

格雷格:如果今天人工智能的發(fā)展突然停滯,你認(rèn)為當(dāng)前的技術(shù)水平,不足以推動(dòng)數(shù)學(xué)研究質(zhì)量出現(xiàn)爆發(fā)式提升?

丹尼爾:我認(rèn)為數(shù)學(xué)研究的效率會(huì)保持我們以往看到的增長速度,這種增長在一定程度上可能歸功于技術(shù),但大概率主要是因?yàn)檠芯咳丝诘脑鲩L。你也可以對谷歌提出同樣的問題:谷歌或電子郵件,到底提升了多少工作效率?

格雷格:你經(jīng)歷過谷歌出現(xiàn)前后的時(shí)代嗎?那段變化對你有什么感受?

丹尼爾:沒有,我出生于 1988 年,2015 年拿到博士學(xué)位,所以在我開始接觸數(shù)學(xué)研究時(shí),谷歌就已經(jīng)存在了。我問過一些年長的數(shù)學(xué)家這個(gè)問題,他們的普遍共識(shí)是,谷歌確實(shí)提升了數(shù)學(xué)研究的效率,但這種提升很難直觀看到,也很難找到一個(gè)指標(biāo)來衡量。從直觀感受來看,谷歌的出現(xiàn)并沒有帶來優(yōu)秀數(shù)學(xué)新思想的爆發(fā)式增長,我認(rèn)為核心原因是,文獻(xiàn)檢索并非數(shù)學(xué)研究的主要瓶頸。

人工智能工具還有一個(gè)前身,那就是計(jì)算機(jī)技術(shù)的發(fā)展。上世紀(jì) 60、70、80 年代,計(jì)算機(jī)技術(shù)的發(fā)展推動(dòng)了多個(gè)數(shù)學(xué)領(lǐng)域的重大進(jìn)展。有一個(gè)經(jīng)典的例子:歐拉曾提出冪和猜想,探討何時(shí)存在若干個(gè) k 次冪的和等于另一個(gè) k 次冪。這個(gè)猜想的第一個(gè)反例,就是通過計(jì)算機(jī)搜索找到的。更著名的是,四次冪的情況在 1988 年由埃爾基斯解決,他用到了一種非常巧妙的計(jì)算機(jī)搜索方法。

格雷格:如果沒有計(jì)算機(jī),這種方法根本無從施展,盡管其中包含了大量人類的巧思。

丹尼爾:沒錯(cuò)。他找到了一種方法,讓 1988 年的計(jì)算機(jī)能處理這類問題,即便是現(xiàn)在,單純的暴力窮舉也依然無法解決這些問題。但這確實(shí)是數(shù)學(xué)研究的一大突破。如果我們的人工智能模型停留在當(dāng)前水平,數(shù)學(xué)研究也會(huì)沿著這個(gè)趨勢自然發(fā)展。

格雷格:具體會(huì)呈現(xiàn)出怎樣的發(fā)展?fàn)顟B(tài)?目前我們主要將模型用于文獻(xiàn)檢索和代碼編寫,或許未來會(huì)在代碼編寫方面進(jìn)一步發(fā)展,比如朝著 AlphaEvolve 的方向?

丹尼爾:有時(shí)候,數(shù)學(xué)研究的突破需要進(jìn)行大量的搜索驗(yàn)證,而這類搜索往往需要一定的研究技巧。比如你需要驗(yàn)證上千個(gè)不同的例子,卻沒有固定的算法來處理每個(gè)例子,每個(gè)例子都需要一點(diǎn)新的想法,或是運(yùn)用一些標(biāo)準(zhǔn)的研究方法,這種工作很難用計(jì)算機(jī)程序自動(dòng)化實(shí)現(xiàn)。

在代數(shù)幾何領(lǐng)域,你可能需要完成一系列推導(dǎo)步驟,其中一部分可以用 Python 程序自動(dòng)化,另一部分則需要真正的研究思路。以目前模型的能力,我認(rèn)為可以想象,一些這類例子的搜索驗(yàn)證工作,能以較高的可靠性實(shí)現(xiàn)自動(dòng)化。

格雷格:這類工作過去大多需要人工完成,工作量會(huì)隨著問題規(guī)模線性增加,而現(xiàn)在 ——

丹尼爾:現(xiàn)在其中一部分工作的工作量能大幅減少,這也是我非常期待的一點(diǎn)。有時(shí)候我發(fā)表的論文,核心就是一個(gè)精妙的構(gòu)造,而找到這個(gè)構(gòu)造,需要我進(jìn)行大量搜索,還要思考該從哪個(gè)方向入手。AlphaEvolve 的出現(xiàn),或許就是這種自動(dòng)化搜索的雛形 —— 也就是由智能大語言模型輔助的自動(dòng)化搜索。我能想象,這會(huì)對數(shù)學(xué)研究產(chǎn)生非常重大的影響,但這種影響和計(jì)算機(jī)技術(shù)的影響一脈相承,并不意味著數(shù)學(xué)研究的完全自動(dòng)化。

格雷格:也就是繼續(xù)探索如何利用計(jì)算機(jī)減少人工勞動(dòng),或是開辟新的研究方向。

丹尼爾:對,就像四色定理的證明、開普勒猜想的證明一樣,這類問題需要驗(yàn)證大量的案例,而計(jì)算機(jī)能幫助我們完成這項(xiàng)工作。

格雷格:如果大幅提升算力,能讓這類工作實(shí)現(xiàn)更大的突破嗎?

丹尼爾:其實(shí)數(shù)學(xué)家已經(jīng)在這么做了。我和計(jì)算數(shù)論領(lǐng)域的研究者聊過,他們的對話非常有趣 —— 有人會(huì)拿著一個(gè)問題說,“根據(jù)摩爾定律,等到算力不再成為限制時(shí),這個(gè)問題在今年就能被解決”,而這些預(yù)測的準(zhǔn)確率還相當(dāng)高。

你或許聽過這個(gè)例子:一個(gè)整數(shù)能否表示為三個(gè)立方數(shù)的和。我們知道每個(gè)具體案例的解決難度,提升兩倍、三倍算力,就能找到更多有研究價(jià)值的整數(shù)解。但問題是,這種進(jìn)展究竟能算真正的數(shù)學(xué)突破嗎?有人對此比我更興奮。

我想象的場景是,當(dāng)你要尋找某種構(gòu)造的例子,卻沒有已知的算法時(shí),讓 GPT 進(jìn)行巧妙的搜索,讓它自己產(chǎn)生思路。

格雷格:如果給它足夠的測試時(shí)間 ——

丹尼爾:或許最終它能找到一些結(jié)果。我并不認(rèn)為隨著測試時(shí)間的增加,它能產(chǎn)生越來越精妙的想法,只是能嘗試更多的思路而已。

三、垃圾論文、大語言模型生成的證明,以及數(shù)學(xué)審稿危機(jī)

[00:23:36]

格雷格:目前人工智能是否給數(shù)學(xué)研究帶來了一些問題?大學(xué)中的作弊問題顯然已經(jīng)出現(xiàn),那垃圾論文的問題呢?

丹尼爾:垃圾論文的問題肯定存在。大概從 9 月份開始,我開始統(tǒng)計(jì)預(yù)印本平臺(tái) arXiv 上標(biāo)題或摘要中包含 “霍奇猜想(Hodge conjecture)” 的論文?;羝娌孪胧乾F(xiàn)存的六大千禧年難題之一,也是普通人最難理解其表述的一個(gè)猜想。長期以來,這個(gè)猜想都能避開一些非專業(yè)研究者的胡亂嘗試,因?yàn)槠胀ㄈ烁緦懖怀鲫P(guān)于它的、看似合理的內(nèi)容,但現(xiàn)在情況不同了,前沿模型能寫出關(guān)于霍奇猜想的、看起來言之有理的文本。

9 月和 10 月,arXiv 的數(shù)學(xué) - 代數(shù)幾何分類下,有 12 到 13 篇論文的標(biāo)題或摘要包含霍奇猜想,其中除了一篇,其余全是無意義的垃圾論文。我無法證明這些論文是大語言模型生成的,但從寫作風(fēng)格來看,答案非常明顯,而且其中有大概六位作者是反復(fù)發(fā)表這類垃圾論文的。

這個(gè)問題的影響有多大呢?它不過是浪費(fèi)了我?guī)追昼姷臅r(shí)間。但隨著大語言模型越來越擅長寫看似連貫的文本,過去你花 10 秒就能看出一篇論文是無意義的,現(xiàn)在卻需要花幾分鐘。其中最離譜的一篇,論證邏輯完全不通,但你必須讀到論文中間,才能發(fā)現(xiàn)一些命題純粹是胡說八道 —— 它的引言部分寫得完全合理、有趣,還提出了非常大膽的結(jié)論,想要驗(yàn)證它是垃圾論文,并不是一件容易的事。我認(rèn)為這個(gè)問題會(huì)越來越嚴(yán)重。

在目前形式化驗(yàn)證并不實(shí)用的數(shù)學(xué)領(lǐng)域,這會(huì)成為一個(gè)大問題。你可以想象更糟糕的情況:一個(gè)卡在某個(gè)問題上的研究生,利用模型生成某個(gè)關(guān)鍵步驟的無意義證明,論文的 99% 都是正確的,但因?yàn)檫@一處無意義的證明,整篇論文變得毫無價(jià)值。

格雷格:人類從很久以前就開始在研究中弄虛作假了。

丹尼爾:現(xiàn)在確實(shí)有很多錯(cuò)誤的論文,但核心問題在于邊際成本:說謊和作弊的邊際成本,現(xiàn)在變得低多了。

格雷格:如果人工智能的能力就此停滯,這個(gè)問題在社會(huì)層面能得到管控嗎?

丹尼爾:這個(gè)問題正在加劇數(shù)學(xué)領(lǐng)域的審稿危機(jī) —— 目前產(chǎn)生的論文數(shù)量,遠(yuǎn)超過了能被嚴(yán)謹(jǐn)審稿的數(shù)量,而且情況會(huì)持續(xù)惡化。這在很大程度上是由數(shù)學(xué)學(xué)術(shù)界的激勵(lì)機(jī)制造成的,而非模型本身的問題。我們會(huì)沿用以往的方式管控,但效果會(huì)不盡如人意。不過我也看到了一些希望:模型也能幫助檢查論文,目前已經(jīng)有一些不錯(cuò)的相關(guān)工具在開發(fā)中了。

四、人工智能實(shí)現(xiàn)了大規(guī)模的數(shù)學(xué)問題搜索驗(yàn)證

[00:27:21]

安森:我想從更長遠(yuǎn)的角度聊聊這個(gè)問題。人工智能和數(shù)學(xué)研究的發(fā)展,很大一部分都依賴于算力和規(guī)?;覀冎耙擦牡?,讓人工智能進(jìn)行大量的例子驗(yàn)證。當(dāng)我們擁有了大規(guī)模開展這類數(shù)學(xué)實(shí)驗(yàn)的能力后,數(shù)學(xué)各領(lǐng)域的發(fā)展會(huì)呈現(xiàn)出怎樣的趨勢?

丹尼爾:你問的正是我之前提到的,讓模型進(jìn)行大量的例子驗(yàn)證,而非讓模型去解決黎曼猜想這類頂級(jí)難題。

安森:對,就是這個(gè)意思。

丹尼爾:我認(rèn)為這會(huì)是以往研究趨勢的延續(xù) —— 我們能驗(yàn)證更多有研究價(jià)值的例子,核心優(yōu)勢在于,嘗試第一個(gè)直觀思路的成本變得極低。在過去,我想要找到一個(gè)精妙的構(gòu)造,必須坐下來嘗試各種思路,即便這些思路幾乎不需要什么巧思,也依然要花費(fèi)我?guī)滋斓臅r(shí)間,而我本身還有很多其他工作。更何況,這個(gè)問題可能只是一個(gè)偶然想到的問題,我還有更感興趣的研究方向,嘗試解決它存在機(jī)會(huì)成本。

而現(xiàn)在,嘗試一種思路的邊際成本變得極低,即便用的是能力并不出眾的模型,這也具有極高的價(jià)值。數(shù)學(xué)研究的推進(jìn)方式之一,就是尋找各類有趣的案例,而偶爾就能從中發(fā)現(xiàn)有價(jià)值的結(jié)論,這并不一定需要深刻的洞見或絕妙的想法,只需要花費(fèi)時(shí)間。讓人工智能自動(dòng)化地搜索這些有趣的案例,會(huì)是一件意義重大的事。

數(shù)學(xué)中有一些零散的經(jīng)典案例,比如散在有限單群、例外李群,研究者會(huì)用相當(dāng)系統(tǒng)的方法去尋找它們,但最終還是需要靠發(fā)現(xiàn)。很多時(shí)候,發(fā)現(xiàn)的過程就是看到有人推導(dǎo)出了一個(gè)有趣的例子,然后從中觀察到一些有價(jià)值的性質(zhì)。我最引以為傲的一些研究成果,就是從文獻(xiàn)中發(fā)現(xiàn)了有趣的結(jié)論,然后推導(dǎo)出了相關(guān)的推論。

格雷格:這種研究方式的效率確實(shí)很高。

丹尼爾:這是數(shù)學(xué)研究推進(jìn)的重要方式,數(shù)學(xué)的發(fā)展并非只依靠最頂尖的數(shù)學(xué)家證明驚天定理,還有大量研究者在做著基礎(chǔ)性的工作,研究各類有趣的問題,他們偶爾就能發(fā)現(xiàn)重要的結(jié)論。即便自動(dòng)化的水平達(dá)不到普通專業(yè)數(shù)學(xué)家的程度,這種自動(dòng)化的搜索驗(yàn)證,也會(huì)對數(shù)學(xué)研究產(chǎn)生巨大的影響。

安森:這類數(shù)學(xué)實(shí)驗(yàn)的收益遞減速度有多快?驗(yàn)證一千個(gè)例子,會(huì)比驗(yàn)證一百個(gè)例子有用得多嗎?

丹尼爾:這取決于搜索的方式。至少對我而言,最有價(jià)值的例子,往往出現(xiàn)在需要從無限多的對象中尋找少數(shù)特殊對象的場景中,比如找 26 個(gè)特殊對象,這些對象都是極其罕見、極具特殊性的。這時(shí)候就不能用暴力窮舉,而是需要一定的巧思,而模型能將這部分巧思的工作實(shí)現(xiàn)一定程度的自動(dòng)化。我能想象,在一些場景中,驗(yàn)證一百萬個(gè)例子的價(jià)值,遠(yuǎn)高于驗(yàn)證一百個(gè)例子。

安森:哪些數(shù)學(xué)領(lǐng)域最適配這種大規(guī)模的實(shí)驗(yàn)驗(yàn)證?

丹尼爾:我認(rèn)為所有領(lǐng)域都適配。代數(shù)幾何中有一些我很喜歡的特殊構(gòu)造,比如三次曲面上的 27 條直線、平面四次曲線的 28 條雙切線,這些例子都有有趣的性質(zhì),還和例外李群相關(guān)。這些都是1800年代的經(jīng)典結(jié)論,但如果能找到新的、類似的精妙特殊構(gòu)造,會(huì)是一件非常了不起的事,而且這并非不可能,研究者也一直在發(fā)現(xiàn)這類有趣的例子。

安森:這么說來,算力確實(shí)至關(guān)重要。那為什么不是所有數(shù)學(xué)家都想去大型實(shí)驗(yàn)室,和 OpenAI、深度思維(DeepMind)這類擁有海量算力的機(jī)構(gòu)合作呢?

丹尼爾:因?yàn)槟壳澳P偷哪芰€沒達(dá)到那個(gè)水平?,F(xiàn)在想要實(shí)現(xiàn)這種自動(dòng)化,方式大概是讓模型循環(huán)執(zhí)行 “尋找該現(xiàn)象的有趣例子” 的指令,并記錄已經(jīng)驗(yàn)證過的例子,但當(dāng)你真的讓模型這么做時(shí),它基本會(huì) 100% 失敗。至少在代數(shù)幾何領(lǐng)域,模型的能力還達(dá)不到,它們甚至無法完成一個(gè)有研究價(jià)值的例子的驗(yàn)證。不過這種情況可能很快就會(huì)改變。

安森:如果根據(jù) FrontierMath 的發(fā)展趨勢推斷,或許到明年年底,這個(gè)基準(zhǔn)測試就會(huì)被模型完全攻克。

丹尼爾:但我認(rèn)為,攻克 FrontierMath,和實(shí)現(xiàn)這種大規(guī)模的例子驗(yàn)證,并沒有什么關(guān)聯(lián)。

五、人工智能何時(shí)能寫出登上頂級(jí)數(shù)學(xué)期刊的論文?

[00:33:49]

格雷格:聊聊你關(guān)心的時(shí)間維度吧。你曾和塔梅伊?貝西羅格盧(Tamay Besiroglu)打賭,以 3 比 1 的賠率賭:到 2030 年初,人工智能系統(tǒng)無法自主寫出符合當(dāng)前標(biāo)準(zhǔn)、能發(fā)表在你所在領(lǐng)域頂級(jí)期刊《數(shù)學(xué)年刊》(Annals)上的論文。這意味著你認(rèn)為這件事發(fā)生的概率只有 25%。

丹尼爾:我覺得自己當(dāng)時(shí)可能有點(diǎn)過于自信了,不過從那之后,我的預(yù)估其實(shí)更偏向于自己的判斷了。

格雷格:我記得,塔梅伊的預(yù)估向你靠攏了,而你的預(yù)估也向他靠攏了一點(diǎn)。

丹尼爾:對,還挺有意思的。這個(gè)打賭還有一些附加條件:首先,人工智能的這種能力必須是可復(fù)現(xiàn)的 —— 當(dāng)然,如果模型證明了黎曼猜想,那這條條件就另當(dāng)別論了。

格雷格:要求可復(fù)現(xiàn),是為了避免只是偶然的成功。

丹尼爾:對,不能是模型恰好找到一個(gè)反例,推翻了某個(gè)重要猜想這種偶然情況,而是能穩(wěn)定地產(chǎn)出高質(zhì)量論文。還有一個(gè)成本條件:每篇論文的邊際成本必須約為 10 萬美元,這個(gè)數(shù)字是估算的人類數(shù)學(xué)家寫出一篇《數(shù)學(xué)年刊》論文的邊際成本。

格雷格:畢竟數(shù)學(xué)家的年薪也到不了上百萬美元,所以 ——

丹尼爾:大概率我們不會(huì)花費(fèi) 10 萬美元的算力去做這件事,不過也有可能。但如果到 2031 年,模型寫出這樣的論文只需要 1000 美元,那這個(gè)賭局就很容易判定結(jié)果了。

格雷格:客觀來說,五年內(nèi)有 25% 的概率實(shí)現(xiàn)這件事,從當(dāng)前的技術(shù)水平來看,這已經(jīng)是非常大的進(jìn)步了。

丹尼爾:我認(rèn)為這個(gè)預(yù)測是很合理的。

格雷格:從打賭到現(xiàn)在,你的判斷有哪些變化?

丹尼爾:25% 這個(gè)概率感覺有點(diǎn)偏低,這其實(shí)只是我的直觀感受,沒有什么實(shí)際依據(jù)。我認(rèn)為,模型在這段時(shí)間內(nèi),大概率能自主開展高質(zhì)量的數(shù)學(xué)研究。這個(gè)打賭原本是為了衡量 “模型是否會(huì)在數(shù)學(xué)研究中對人類形成絕對優(yōu)勢”,但我現(xiàn)在發(fā)現(xiàn),這其實(shí)是一個(gè)很糟糕的衡量標(biāo)準(zhǔn)。

原因之一是:目前有很多數(shù)學(xué)家的能力遠(yuǎn)勝于我,他們寫出一篇《數(shù)學(xué)年刊》論文的邊際成本也低得多,一年就能寫一篇。我目前只發(fā)表過一篇《數(shù)學(xué)年刊》的論文,還有幾篇發(fā)表在同級(jí)別期刊上,但從某種意義上來說,這些數(shù)學(xué)家并沒有對我形成絕對優(yōu)勢 —— 我們的研究視角不同,做數(shù)學(xué)研究的方式也不同,在一些領(lǐng)域,我在證明有趣的定理、理解有趣的數(shù)學(xué)問題上,反而具有顯著的優(yōu)勢。

格雷格:如果五年后的模型,依然保持著如今的特性 —— 所有模型的解題方式都大同小異,就像一位風(fēng)格固定的數(shù)學(xué)家。

丹尼爾:沒錯(cuò)。你可以想象,未來的模型會(huì)在某些類型的數(shù)學(xué)研究中表現(xiàn)極其出色,甚至能證明各類不同的定理,但即便如此,就像馬克西姆?孔采維奇(Maxim Kontsevich)這樣的頂級(jí)數(shù)學(xué)家存在,并不意味著其他數(shù)學(xué)家就沒有存在的價(jià)值了。

格雷格:這里的成本條件其實(shí)有點(diǎn)關(guān)聯(lián)。假設(shè)算力成本為零,模型的運(yùn)算速度也不再受限,就好像把你的大腦放進(jìn)數(shù)據(jù)中心,一分鐘就能經(jīng)歷主觀上的 100 年,你能勝過世界上所有的數(shù)學(xué)家嗎?

丹尼爾:這個(gè)問題問得很好。目前,由于各種限制,我主要在自己擅長的領(lǐng)域做研究,偶爾需要學(xué)習(xí)或開發(fā)新的研究方法 —— 這也是目前模型還無法做到的事,而這需要花費(fèi)大量的精力。如果沒有這些限制,我就能更容易地學(xué)習(xí)其他研究者的方法,而這取決于我持續(xù)學(xué)習(xí)的能力。

當(dāng)我們把人類和模型對比時(shí),結(jié)果可能也取決于模型在持續(xù)學(xué)習(xí)方面的發(fā)展。不過我的預(yù)期是,即便有這樣的條件,我或許能做出很多精彩的數(shù)學(xué)研究 —— 如果擁有這么多資源卻毫無建樹,那也太說不過去了。但其他數(shù)學(xué)家依然會(huì)有極高的價(jià)值,因?yàn)閿?shù)學(xué)研究中存在一些我并不適合的思考方式和研究模式。

格雷格:人工智能會(huì)打破我們熟知的比較優(yōu)勢格局嗎?

丹尼爾:我認(rèn)為沒有理由這么認(rèn)為。而且我們討論的是沒有資源限制的情況,而資源限制是分析比較優(yōu)勢的關(guān)鍵前提。

格雷格:五年后的場景,或許會(huì)是這樣:人工智能在某些數(shù)學(xué)領(lǐng)域表現(xiàn)不佳,人類就專注于這些領(lǐng)域,而少數(shù)人類研究者則指導(dǎo)人工智能在其擅長的領(lǐng)域開展研究。

丹尼爾:我認(rèn)為研究者也會(huì)嘗試為人工智能建立一種 “研究品味” 的評(píng)估體系,讓它能自主去研究有價(jià)值的問題。五年的時(shí)間,25% 的概率這個(gè)判斷,我基本還是保持不變,可能會(huì)稍微調(diào)高一點(diǎn)。我認(rèn)為,在 15 到 20 年內(nèi),人工智能系統(tǒng)大概率會(huì)在很多數(shù)學(xué)領(lǐng)域?qū)θ祟愋纬蓛?yōu)勢,如果沒有出現(xiàn)這種情況,我會(huì)感到很意外。

格雷格:你是根據(jù)什么趨勢做出這個(gè)判斷的?

丹尼爾:主要還是直觀感受。我也延續(xù)了人工智能預(yù)測的老傳統(tǒng):說五年,就是認(rèn)為這件事很快會(huì)發(fā)生;說超過五年,就是指從五年到永遠(yuǎn)的任何時(shí)間。上世紀(jì) 60、70 年代的人工智能發(fā)展預(yù)測,也是這樣說 5 到 20 年的。

格雷格:說白了,就是兩種判斷:一種是 “可能很快會(huì)發(fā)生,但我不確定”,另一種是 “天啊,誰知道呢”。

丹尼爾:我的意思是,如果當(dāng)前的發(fā)展趨勢持續(xù)下去,模型能開展高質(zhì)量的自主數(shù)學(xué)研究,是有合理可能性的 ——25%,但遠(yuǎn)非必然。

六、智能的收益究竟有多大?

[00:42:15]

安森:或許我們可以把時(shí)間拉到 15 或 20 年以后,甚至更久。一個(gè)人思考 100 年,和 100 個(gè)人思考 1 年,這兩種方式的研究成果該如何對比?有沒有辦法衡量,一個(gè)人持續(xù)思考 100 年,能力會(huì)提升多少?

丹尼爾:我把這個(gè)問題和我們之前聊的 “如何判斷問題難度” 結(jié)合起來說吧。有很多數(shù)學(xué)問題,明顯具有這樣的特質(zhì):如果開展一個(gè)曼哈頓計(jì)劃式的專項(xiàng)研究,集中力量攻克,很快就能解決,這些問題缺少的只是研究者的關(guān)注。即便只是讓幾位數(shù)學(xué)家全身心投入研究,這些問題也幾乎肯定能被解決。

格雷格:你能舉幾個(gè)這樣的例子嗎?

丹尼爾:比如最后一個(gè)散在有限單群 ——馬蒂厄群(Mathieu group) M??的反問題,這大概率是一個(gè)難題,已經(jīng)有不少人研究過了。但我敢肯定,如果美國政府將其每年 2 億美元的數(shù)學(xué)研究經(jīng)費(fèi)中的相當(dāng)一部分,投入到這個(gè)問題的研究中,它很快就能被解決。

格雷格:這個(gè)例子很有參考價(jià)值。

丹尼爾:如果讓一個(gè)人長期專注思考,很多問題都能被解決。我從 2016 年開始思考一個(gè)問題,這個(gè)問題是我在一場報(bào)告中接觸到的,我很喜歡這個(gè)問題,嘗試解決過,但當(dāng)時(shí)沒有任何進(jìn)展,不過我一直把它放在心上,最終在 2024 年解決了它。

在這個(gè)過程中,你會(huì)學(xué)習(xí)新的知識(shí),將不同的問題關(guān)聯(lián)起來,還會(huì)遇到一個(gè)問題:如何將自己的知識(shí)和猜想匹配起來,甚至首先要知道這個(gè)猜想的存在。隨著時(shí)間的推移,你嘗試各種思路,有時(shí)最終就能找到解決方法。事實(shí)上,這個(gè)問題的解決方法中,有一個(gè)核心要素直到 2023 年才被提出,有時(shí)候你就是需要等待其他人完成相關(guān)的研究工作。

格雷格:這么說來,單個(gè)數(shù)學(xué)家的研究過程,其實(shí)有點(diǎn)像一個(gè)數(shù)學(xué)家團(tuán)隊(duì)的研究過程,因?yàn)槠渌艘餐瓿闪似渲械牟糠止ぷ鳌?/p>

丹尼爾:沒錯(cuò),一部分原因就是時(shí)間的推移:你會(huì)學(xué)習(xí)新知識(shí),嘗試不同思路,成為更優(yōu)秀的數(shù)學(xué)家,掌握更多研究方法。數(shù)學(xué)研究的一個(gè)重要點(diǎn) —— 也是目前人類依然遠(yuǎn)勝于模型的一點(diǎn),就是當(dāng)你接觸到一個(gè)新的研究對象時(shí),你會(huì)嘗試去 “熟悉” 它:反復(fù)研究、推敲各類相關(guān)問題和例子,分析相關(guān)的特殊情況,通過這種方式了解這個(gè)研究對象,并為其建立相關(guān)的理論。

我真的很擔(dān)心當(dāng)前范式下的模型能力:現(xiàn)在,模型想要學(xué)習(xí)一個(gè)新的領(lǐng)域,必須重新訓(xùn)練一個(gè)新模型。比如彼得?舒爾茨(Peter Scholze)正在發(fā)展的 Gestalten(格式塔)理論,這是一種新的空間理論,目前所有的模型都不了解這個(gè)理論,它們可以上網(wǎng)查閱相關(guān)論文,但無法真正接觸這個(gè)研究對象并開展研究。

格雷格:也就是只能做到淺嘗輒止的程度。

丹尼爾:它們無法真正去 “熟悉” 一個(gè)研究對象,而人類可以隨著時(shí)間的推移做到這一點(diǎn)。時(shí)間對解決問題的最大幫助,就是讓你熟悉研究對象,并形成相關(guān)的直覺。而模型如果不重新訓(xùn)練,就無法做到這一點(diǎn)。解決一個(gè)涉及新研究對象或新思考方式的問題,其邊際成本就是訓(xùn)練一個(gè)新模型的成本 —— 這個(gè)成本極高,遠(yuǎn)比讓一個(gè)人類研究者去理解這個(gè)研究對象的成本高得多。

格雷格:即便是為了完成這類研究,持續(xù)學(xué)習(xí)能力也顯得至關(guān)重要。

丹尼爾:這種持續(xù)學(xué)習(xí),不僅僅是像人類一樣讀一篇論文就能理解研究對象,還需要像人類一樣去 “探索嘗試”。我知道目前已經(jīng)有人嘗試讓模型在數(shù)學(xué)研究中進(jìn)行自博弈,但目前還不清楚其效果如何。

格雷格:在模型的思維鏈推理中,能看到一點(diǎn)這種探索嘗試的跡象:它們會(huì)嘗試不同的思路,進(jìn)行一些摸索,最終找到解決方法。這可能是因?yàn)樗鼈兊挠?xùn)練目標(biāo)就是解決具體的問題,而非基于研究品味去尋找 “更好的研究視角”,或許這種能力會(huì)隨著規(guī)?;l(fā)展而提升。

丹尼爾:對,我對此并非持懷疑態(tài)度。

安森:我還發(fā)現(xiàn)一個(gè)有趣的點(diǎn),就是研究的并行化存在局限性。你剛才提到的那個(gè) 2024 年解決的問題,依賴于 2023 年的另一項(xiàng)研究成果。如果對比 “丹尼爾思考 100 年” 和 “100 個(gè)丹尼爾同時(shí)思考”,或許長期的持續(xù)思考,會(huì)因?yàn)槌掷m(xù)學(xué)習(xí)而更有成效,但研究的并行化也存在瓶頸,或者說,整個(gè)數(shù)學(xué)研究領(lǐng)域的發(fā)展,還需要其他方面的突破。

丹尼爾:你說得很對。這個(gè)問題的解決,借鑒了兩大深度理論的成果:非交換霍奇理論函數(shù)域上的朗蘭茲綱領(lǐng)。而這項(xiàng)研究能推進(jìn)的關(guān)鍵,是其他人 —— 埃斯諾爾特(Esnault)、達(dá)德齊奧(D’Addezio)和格雷琴尼希(Groechenig),利用函數(shù)域上的朗蘭茲綱領(lǐng)和伴隨理論證明了一個(gè)結(jié)論。這一點(diǎn)是我自己想不到的,雖然它和我的研究領(lǐng)域很接近,我也有所了解,但這確實(shí)是一個(gè)極具創(chuàng)造性的重要研究成果,和我當(dāng)時(shí)的研究思路截然不同。

即便我獨(dú)自思考這個(gè)問題 100 年,也很難確定自己能發(fā)現(xiàn)這兩者之間的關(guān)聯(lián)。從歷史來看,讓一個(gè)人類研究者獨(dú)自長期專注于一個(gè)問題,研究效率大概率是很低的,你會(huì)嘗試各種思路,然后在某個(gè)時(shí)間點(diǎn)遭遇收益遞減。

格雷格:研究的并行化中,多樣性是很重要的一點(diǎn)。你有沒有嘗試讓模型去做一些令人意外、更具原創(chuàng)性的研究,即便結(jié)果是錯(cuò)誤的?

丹尼爾:當(dāng)然試過?,F(xiàn)在,每當(dāng)我思考一個(gè)開放問題時(shí),第一件事就是讓模型給出一些思路,但這些思路幾乎都是無意義的。

格雷格:確實(shí)是這樣。

丹尼爾:我從來沒有從模型那里,得到過一個(gè)能通過初步檢驗(yàn)、適用于深度開放問題的思路。

格雷格:從某種抽象的角度來看,隨機(jī)初始化似乎應(yīng)該能解決這個(gè)問題,但我們目前還沒看到這種效果。

丹尼爾:你也可以嘗試 —— 我每天醒來,其實(shí)都是一次新的 “隨機(jī)初始化”。

格雷格:沒錯(cuò)。

丹尼爾:但我自身的思維定式依然存在,這限制了我去真正探索數(shù)學(xué)研究的全部可能性。

安森:這就牽扯到了智能的收益問題。如果有一百萬個(gè)安森,嘗試去做你現(xiàn)在的研究,我認(rèn)為不會(huì)有太多進(jìn)展。而如果把規(guī)模再擴(kuò)大,一百萬個(gè)丹尼爾和超級(jí)智能數(shù)學(xué)家對比,是否會(huì)出現(xiàn)同樣的情況:超級(jí)智能的能力遠(yuǎn)超人類,無論增加多少研究者數(shù)量,或是延長多少研究時(shí)間,都無法匹敵?

丹尼爾:我先反駁一下你說的 “安森做我的研究不會(huì)有進(jìn)展” 這個(gè)觀點(diǎn)。我認(rèn)為,如果你真的投入大量時(shí)間去學(xué)習(xí)有趣的數(shù)學(xué)知識(shí),一定能做出精彩的數(shù)學(xué)研究,只是研究的方向大概率會(huì)和我不同,因?yàn)槲覀兊钠煤湍芰Σ煌5憧雌饋硎莻€(gè)很聰明的人,只要有足夠的動(dòng)力和資源,我相信你一定能做出有價(jià)值的數(shù)學(xué)研究。

同樣,對于超級(jí)智能人工智能 —— 無論這個(gè)概念具體指什么,即便是在數(shù)學(xué)研究這個(gè)相對狹窄的領(lǐng)域,智能也是一種極其高維度的能力。對比不同的人類數(shù)學(xué)家就能發(fā)現(xiàn),我們各自在截然不同的方面表現(xiàn)出色。即便想象出一個(gè)能解決大量有趣研究問題的人工智能,也無法確定它能解決所有人類擅長的、有趣的數(shù)學(xué)研究問題。

格雷格:我們可以把問題說得更具體一點(diǎn):在某個(gè)特定領(lǐng)域中,最適合該領(lǐng)域的、最聰明的研究者,其研究效率的天花板是怎樣的?有沒有這樣的情況:如果你知道某個(gè)頂尖研究者正在研究一個(gè)問題,你就會(huì)避開這個(gè)問題?

丹尼爾:這種情況在某種程度上是存在的,但我認(rèn)為這和能力無關(guān)。比如目前p 進(jìn)霍奇理論是一個(gè)非?;钴S的領(lǐng)域,我在多個(gè)方面和這個(gè)領(lǐng)域有所交集,但我并沒有真正投身其中,原因是這個(gè)領(lǐng)域的發(fā)展速度非常快,如果我想進(jìn)入這個(gè)領(lǐng)域,需要學(xué)習(xí)大量知識(shí),跟上其他研究者的步伐,這更多的是機(jī)會(huì)成本的問題。

格雷格:所以在人類研究者中,我們并沒有看到所謂的 “智能收益” 的極致體現(xiàn)。

丹尼爾:我有一個(gè)兩歲半的女兒,她很可愛,也很聰明,但目前還無法進(jìn)行數(shù)學(xué)研究,畢竟她才兩歲半。人類的能力之間,確實(shí)存在絕對的差異,但在專業(yè)數(shù)學(xué)家之間,能力的差異更多體現(xiàn)在數(shù)學(xué)研究是一個(gè)高維度的領(lǐng)域,而研究者各自專注于不同的方向。

如果模型繼續(xù)沿著當(dāng)前的范式發(fā)展,保持能力的不均衡性,且相比人類,其能力范圍更狹窄,那它們依然能為數(shù)學(xué)研究帶來巨大的價(jià)值。人類研究者各自專注于極小的研究領(lǐng)域,這意味著幾乎所有的數(shù)學(xué)問題,都存在 “關(guān)注瓶頸”—— 甚至能理解一個(gè)問題表述中所有術(shù)語的人,可能只有十個(gè)。你可以想象,這些問題本身未必很難,只是沒有人有時(shí)間去研究而已。

安森:對于關(guān)心超級(jí)智能和人工智能快速發(fā)展的人來說,還有一個(gè)角度:假設(shè)我們通過某種方式提升了數(shù)學(xué)研究的進(jìn)展速度,并將其分解為三個(gè)因素 —— 更多的人工智能、人工智能更長時(shí)間的研究、更智能的人工智能。這三者的貢獻(xiàn)占比會(huì)是怎樣的?

丹尼爾:其實(shí)在人工智能出現(xiàn)之前,我都不確定過去 40 年數(shù)學(xué)研究的進(jìn)展速度是否真的提升了。我的感受是,研究效率的提升,很大程度上歸功于數(shù)學(xué)家數(shù)量的增加。一旦人工智能的能力達(dá)到人類的水平,或許研究效率的提升,也會(huì)主要取決于人工智能的數(shù)量。

有一個(gè)小問題需要關(guān)注:為什么人類研究者的數(shù)量增加,能帶來研究效率的提升?一部分原因是關(guān)注的問題變多了,另一部分是思考方式的多樣性。而人工智能能否帶來同樣的效果,取決于其發(fā)展方向。

數(shù)學(xué)家數(shù)量的增加,帶來的研究效率提升,大概率只是因?yàn)橛懈嗟臅r(shí)間被投入到不同的問題上,有更多的問題得到了關(guān)注。我認(rèn)為,即便是能力并不出眾的人工智能,其數(shù)量的增加也能帶來顯著的研究效率提升。

而關(guān)于 “智能的收益”,這個(gè)問題的定義本身就不夠清晰,在我看來,智能是一個(gè)非常高維度的概念。

你可以想象,擁有一種能巧妙搜索高維度證明空間的能力,會(huì)具有極高的價(jià)值。黎曼猜想的證明,大概率需要發(fā)展出目前尚未存在的各類研究對象和理論,而這需要在極高維度的搜索空間中進(jìn)行大量的探索。

在實(shí)際研究中,這種探索大多是這樣進(jìn)行的:普通數(shù)學(xué)家研究各類研究對象,進(jìn)行低維度的搜索,驗(yàn)證大量的例子,發(fā)現(xiàn)其中的規(guī)律;然后研究者開始將這些規(guī)律提煉為相關(guān)的研究對象和理論。那些我們認(rèn)為最頂尖的數(shù)學(xué)家所做的、高層次的理論構(gòu)建,其實(shí)高度依賴于底層的大量基礎(chǔ)工作和例子分析,而這在很大程度上,也歸功于數(shù)學(xué)家數(shù)量的增加帶來的規(guī)模效應(yīng)。

七、人工智能會(huì)解決千禧年數(shù)學(xué)難題嗎?

[00:59:50]

格雷格:來聊一個(gè)有趣的小問題:你認(rèn)為黎曼猜想,或是其他的千禧年難題,在不同時(shí)間被解決的概率是多少?

丹尼爾:我最熟悉的千禧年難題是黎曼猜想、BSD猜想(伯奇和斯溫納頓 - 戴爾猜想),以及霍奇猜想。其中,黎曼猜想是我們唯一能大致想象出證明框架的難題。

有一個(gè)與之類似的猜想 ——有限域上代數(shù)簇的黎曼猜想,由德利涅(Deligne)在上世紀(jì) 70 年代證明,而其中最接近黎曼猜想的部分,是更早由韋伊(Weil)證明的曲線的黎曼猜想。我們其實(shí)能大致想象出黎曼猜想的證明框架 —— 它應(yīng)該和韋伊的證明框架相似。

韋伊給出了曲線黎曼猜想的兩個(gè)證明,問題在于,證明中的各類推導(dǎo)步驟,在整數(shù)域中并不適用,只適用于有限域上的曲線。我們需要找到方法,讓這些推導(dǎo)步驟在整數(shù)域中也能成立。這聽起來像是科幻小說,但至少我們有一個(gè)看似合理的思考方向。

很多數(shù)學(xué)家都研究過如何讓這些推導(dǎo)步驟在整數(shù)域中成立,我認(rèn)為在未來十年內(nèi),其中一種嘗試有可能成功,我給的概率大概是 15%—— 概率不算高,但也并非不可能。

總體而言,觀察重大開放問題的解決過程會(huì)發(fā)現(xiàn),從掌握解決問題所需的最后一個(gè)關(guān)鍵思路,到最終完成證明,這段時(shí)間通常都很短。比如費(fèi)馬大定理,谷山-志村(Taniyama-Shimura)猜想的提出,到費(fèi)馬大定理最終被證明,時(shí)間間隔其實(shí)并不長。

格雷格:這么說來,既然曲線的韋伊猜想已經(jīng)被證明了幾十年,或許黎曼猜想的證明也離我們不遠(yuǎn)了?

丹尼爾:事實(shí)上,當(dāng)韋伊證明了曲線的黎曼猜想后,人們都認(rèn)為黎曼猜想的證明很快就會(huì)到來,這是我對這段數(shù)學(xué)史的理解。但結(jié)果并非如此,所以人們其實(shí)并不知道,解決黎曼猜想還缺少哪些關(guān)鍵的新想法,我們只是對這些想法的大致方向有一些模糊的感知。

事實(shí)上,當(dāng)韋伊證明了曲線領(lǐng)域的黎曼猜想后,人們都以為黎曼猜想的完整證明很快就會(huì)問世。這是我對這段歷史的理解??山Y(jié)果并非如此。所以時(shí)至今日,人們依然不知道究竟缺失了哪些新的思路。我們只是隱約能感知到,這些新思路大概會(huì)是何種方向。

格雷格:人工智能的發(fā)展,有沒有讓你改變對相關(guān)時(shí)間的預(yù)判?

丹尼爾:其實(shí)并沒有 —— 我目前還沒看到,人工智能展現(xiàn)出開展高質(zhì)量數(shù)學(xué)研究所需的任何關(guān)鍵特質(zhì)。一絲火花都沒有。在我看來,解開一道國際數(shù)學(xué)奧林匹克競賽題,與開展高質(zhì)量的數(shù)學(xué)研究之間的差距,比很多人想象的要大得多。

我的預(yù)判基本沒什么變化。當(dāng)下人工智能能助力完成的任務(wù),以及看似很快就能勝任的任務(wù),似乎都并非解決重大未解猜想的核心瓶頸。話雖如此,我依然認(rèn)為人工智能有 25% 的可能性實(shí)現(xiàn)高質(zhì)量的數(shù)學(xué)研究。而這其中或許有 5% 的可能性 —— 具體取決于技術(shù)的發(fā)展路徑 —— 它會(huì)取得一些顛覆性的突破。

格雷格:聊個(gè)輕松的話題:千禧年大獎(jiǎng)難題。這些數(shù)學(xué)領(lǐng)域的重大目標(biāo),你覺得它們被解決的可能性有多大?人工智能又是否會(huì)做出實(shí)質(zhì)性的貢獻(xiàn)?

丹尼爾:我的預(yù)判是,未來十年,沒有任何一個(gè)千禧年大獎(jiǎng)難題能由人工智能自主解決。

格雷格:十年?

丹尼爾:總的來說,未來十年能被解決的,我覺得可能是 0 到 1 個(gè)。納維 - 斯托克斯方程的研究據(jù)說有了一些進(jìn)展,不過這并非我的研究領(lǐng)域,但我并不認(rèn)為它被徹底解決是完全不可能的事。近期有消息稱,有一個(gè)團(tuán)隊(duì)正與深度思維公司合作研究這個(gè)問題 —— 他們用的或許更多是傳統(tǒng)的深度學(xué)習(xí)技術(shù),而非大語言模型或推理模型。

格雷格:這七個(gè)難題中,龐加萊猜想在被正式提出后不久就被解決了。也就是說,我們的成功先例并非為零。

丹尼爾:但其中有幾個(gè)難題,比如霍奇猜想,目前來看完全毫無思路,BSD 猜想也是如此。至于黎曼猜想,我們之前也聊過,雖然有一些初步的思路,但根本說不清離最終證明還有多遠(yuǎn)??赡苁陜?nèi)就能解決,也可能要等上百年。

格雷格:這和你對人工智能發(fā)展時(shí)間線的其他判斷能關(guān)聯(lián)起來 —— 你說五年內(nèi)人工智能寫出《數(shù)學(xué)年刊》級(jí)別的論文有 25% 的可能性,這其中是否也包含了……

丹尼爾:我的看法是,即便人工智能還沒開始攻克千禧年大獎(jiǎng)難題,實(shí)現(xiàn)這一目標(biāo)也是很有可能的。

格雷格:也就是說,這 25% 的可能性里,攻克千禧年難題的占比其實(shí)很小。而你預(yù)判的 20 年時(shí)間線,其實(shí)已經(jīng)超出了這個(gè)范疇 —— 是人工智能經(jīng)過更久的沉淀和發(fā)展之后的事。

丹尼爾:這取決于人工智能的發(fā)展速度是否會(huì)加快,或者說是否能實(shí)現(xiàn)自我迭代??偟膩碚f,我對此持懷疑態(tài)度,就像我對所有領(lǐng)域的發(fā)展加速論都存疑一樣。

格雷格:那我們不妨聊聊數(shù)學(xué)研究的評(píng)估與基準(zhǔn)測試。先做一個(gè)假設(shè):你說目前還沒看到人工智能展現(xiàn)出你認(rèn)為的關(guān)鍵特質(zhì),那這些特質(zhì)具體是什么?

丹尼爾:我來設(shè)想一下,在我看來,人工智能具備這些特質(zhì)會(huì)有哪些信號(hào)。

第一,提出一個(gè)新穎且有價(jià)值的定義,這一點(diǎn)至關(guān)重要;

第二,展現(xiàn)出專業(yè)的研究品味 —— 比如提出一個(gè)有意義的問題,哪怕只是通過猜想發(fā)現(xiàn)某種新的數(shù)學(xué)現(xiàn)象。事實(shí)上,很多最重要的數(shù)學(xué)成果,最初都只是一個(gè)猜想。而這一點(diǎn),目前的人工智能系統(tǒng)很難做到。

第三,構(gòu)建一套理論 —— 這和提出新定義相關(guān),也就是建立理論體系的能力。目前來看,人工智能還從未展現(xiàn)出過這種能力。不過讓我頗感意外的是,現(xiàn)在的模型能在訓(xùn)練中學(xué)習(xí)人類使用的方法,并加以應(yīng)用。這也是推理模型的重大突破 —— 它們能掌握成熟的方法,并以較高的可靠性落地應(yīng)用。

如果人工智能能開發(fā)出一種新的研究方法 —— 新方法和舊方法之間本就存在一個(gè)連續(xù)的發(fā)展譜系 —— 只要我能識(shí)別出這種創(chuàng)新,那就是一個(gè)重要信號(hào)。但目前來看,這些特質(zhì)人工智能一個(gè)都不具備。它們會(huì)很快擁有嗎?或許吧。

格雷格:在數(shù)學(xué)研究的各項(xiàng)任務(wù)中,哪些是人工智能最難攻克的?你提到的構(gòu)建理論和提出猜想似乎是核心難點(diǎn),還有其他的嗎?

丹尼爾:我要求自己的每一篇論文都包含新的思路,雖然并非所有論文都能做到 —— 有時(shí)候你只是找到一個(gè)技巧,解決了一個(gè)古老的猜想。其實(shí)大多數(shù)人都很難產(chǎn)生大量新想法,數(shù)學(xué)家通常一年也就發(fā)表 1 到 2 篇論文。和其他學(xué)科相比,我們的總產(chǎn)出其實(shí)并不算高。

而開發(fā)一種新的研究方法,本質(zhì)上就是提出真正的新想法??删烤故裁床潘闶切孪敕ǎ窟@正是最難的地方。

格雷格:只有當(dāng)你真正看到時(shí),才會(huì)明白。

丹尼爾:沒錯(cuò),這就是核心難點(diǎn)。人們總喜歡拿AlphaGo舉例 —— 它的第 37 步棋被稱作 “非人類的一步”,是人類棋手永遠(yuǎn)不會(huì)想到的走法。這一步,讓人工智能跳出了人類棋手的搜索范圍。但如果人工智能只是提出了一個(gè)新想法,哪怕這個(gè)想法人類也能想到,這算不算另一種形式的 “第 37 步棋”?

有意思的是,其實(shí)在這些人工智能系統(tǒng)出現(xiàn)之前,類似的情況就已經(jīng)存在了。開普勒猜想的證明、四色定理的證明,都是 “非人類的證明”。研究的主導(dǎo)者是人,但絕大部分工作都是由計(jì)算機(jī)完成的海量案例分析 —— 你可以說這是繁瑣的案例分析,也可以說是精妙的,因?yàn)閿?shù)學(xué)里沒有糟糕的研究,所有正確的結(jié)論都是美的。

格雷格:你說過,你會(huì)鼓勵(lì)自己的研究生去適應(yīng)這種研究方式。

丹尼爾:解決數(shù)學(xué)問題,本就該不擇手段,為什么要自我設(shè)限?從這個(gè)角度來說,上述的計(jì)算機(jī)輔助證明其實(shí)也算一種 “第 37 步棋”,只不過和人工智能無關(guān)。但如果人工智能只是復(fù)刻這種證明方式 —— 把海量的案例分析自動(dòng)化,我不會(huì)認(rèn)為這是它的 “第 37 步棋”,因?yàn)槿祟愒缇妥龅竭^這一點(diǎn)了。

你也可以想象,用Lean定理證明器給出某個(gè)難題的證明過程,全程沒有任何注釋,人類根本無法從中提煉出清晰的論證思路。只要看過Lean的代碼就知道,這絕非易事。

但如果我看到人工智能提出了一種我認(rèn)為的新方法 —— 一種在現(xiàn)有文獻(xiàn)中完全找不到先例的方法,那我會(huì)感到無比興奮。

格雷格:我之所以格外關(guān)注你的觀點(diǎn),是因?yàn)槟阋恢痹谂ψ龅綄?shí)事求是,不隨意抬高評(píng)價(jià)的門檻。

丹尼爾:人總是很容易忍不住抬高門檻。當(dāng)下,人工智能解決一個(gè)問題所能說明的,一方面是 “人工智能具備相應(yīng)能力”,另一方面也可能是 “這個(gè)問題本身并不難”。

數(shù)學(xué)家們總愛說:“這個(gè)問題雖然被人工智能解決了,但它其實(shí)很簡單,所以我們不必過分高估人工智能的能力?!?在某種程度上,這話是對的。但我們也應(yīng)該客觀評(píng)估模型的實(shí)際表現(xiàn),不妨問問自己:如果這是人類寫出的答案,我會(huì)感到興奮嗎?對于近期人工智能解決的那些數(shù)學(xué)問題,如果有人告訴我,這是人類用這種方法解決的 —— 現(xiàn)實(shí)中也確實(shí)有人類做到過 —— 我會(huì)說:“哇,這很酷?!?對待人工智能的成果,我也是同樣的態(tài)度。

格雷格:“哇,這很酷。生活繼續(xù)。但當(dāng)下不必貶低這份成果?!?/p>

——上篇完,下篇待續(xù)——

原文參考資料:

歐拉冪和猜想:

蘭德與帕金(Lander & Parkin,1966 年,首個(gè)反例)https://www.ams.org/journals/bull/1966-72-06/S0002-9904-1966-11654-3/S0002-9904-1966-11654-3.pdf

埃爾基斯(Elkies,1988 年,四次冪情形)https://www.ams.org/journals/mcom/1988-51-184/S0025-5718-1988-0930224-9/S0025-5718-1988-0930224-9.pdf

埃斯諾爾特與格羅申尼希(Esnault & Groechenig,相伴理論與朗蘭茲綱領(lǐng))https://arxiv.org/abs/1707.00752

德利涅(Deligne)對韋伊猜想的證明(1974 年)http://www.numdam.org/item/PMIHES_1974__43__273_0/

澤塔ζ函數(shù)值的無理性:

阿佩里(Apéry)的證明(1978-1979 年)http://www.numdam.org/item/AST_1979__61__11_0/

范德普滕(Van der Poorten)的闡釋https://doi.org/10.1007/BF03028234

扎吉爾(Zagier)的計(jì)算https://people.mpim-bonn.mpg.de/zagier/files/tex/AperylikeRecEqs/fulltext.pdf

卡萊加里 - 季米特洛夫 - 唐云清(Calegari-Dimitrov-Tang)的近期進(jìn)展https://arxiv.org/abs/2408.15403

數(shù)論中的隨機(jī)模型:

梅蘭妮?馬切特?伍德(Melanie Matchett Wood)關(guān)于隨機(jī)矩陣的研究https://doi.org/10.1353/ajm.2019.0008

科恩 - 倫斯特拉(Cohen-Lenstra)啟發(fā)式https://doi.org/10.1007/BFb0099440

提及的千禧年大獎(jiǎng)難題:

黎曼猜想https://www.claymath.org/millennium/riemann-hypothesis/

霍奇猜想https://www.claymath.org/millennium/hodge-conjecture/

貝赫和斯維訥通 - 戴爾(BSD)猜想https://www.claymath.org/millennium/birch-and-swinnerton-dyer-conjecture/

納維 - 斯托克斯方程https://www.claymath.org/millennium/navier-stokes-equation/

前沿?cái)?shù)學(xué):開放式問題基準(zhǔn)測試 https://epoch.ai/frontiermath/open-problems

參考資料

https://epoch.ai/epoch-after-hours/daniel-litt-ai-math-capabilities-could-be-jagged-for-a-long-time

小樂數(shù)學(xué)科普近期文章

·開放 · 友好 · 多元 · 普適 · 守拙·

讓數(shù)學(xué)

更加

易學(xué)易練

易教易研

易賞易玩

易見易得

易傳易及

歡迎評(píng)論、點(diǎn)贊、在看、在聽

收藏、分享、轉(zhuǎn)載、投稿

查看原始文章出處

點(diǎn)擊zzllrr小樂

公眾號(hào)主頁

右上角

置頂加星

數(shù)學(xué)科普不迷路!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
綠色是生命的顏色:它不是背景,是主角

綠色是生命的顏色:它不是背景,是主角

疾跑的小蝸牛
2026-04-23 21:36:36
徐帆回應(yīng)離婚5個(gè)月,馮小剛近況曝光,他的“小心思”再藏不住了

徐帆回應(yīng)離婚5個(gè)月,馮小剛近況曝光,他的“小心思”再藏不住了

天天熱點(diǎn)見聞
2026-04-19 08:13:15
手握20多個(gè)冠軍,嫁外國名將帶夫定居廣州,如今是中山大學(xué)副教授

手握20多個(gè)冠軍,嫁外國名將帶夫定居廣州,如今是中山大學(xué)副教授

以茶帶書
2026-04-16 14:50:51
迪麗熱巴上學(xué)時(shí)無人追求,看到她早期照片,網(wǎng)友:這誰敢追啊

迪麗熱巴上學(xué)時(shí)無人追求,看到她早期照片,網(wǎng)友:這誰敢追啊

喬話
2026-04-22 20:36:30
壞消息,掘金隊(duì)阿隆·戈登因小腿受傷缺席打森林狼的第三場比賽

壞消息,掘金隊(duì)阿隆·戈登因小腿受傷缺席打森林狼的第三場比賽

好火子
2026-04-24 07:07:03
四十年來最大的謎:包產(chǎn)到戶后農(nóng)民馬上就吃上了飽飯,是真的嗎?

四十年來最大的謎:包產(chǎn)到戶后農(nóng)民馬上就吃上了飽飯,是真的嗎?

興趣知識(shí)
2026-04-22 03:35:27
關(guān)系修復(fù):從"地毯式掩蓋"到主動(dòng)對話

關(guān)系修復(fù):從"地毯式掩蓋"到主動(dòng)對話

晚風(fēng)也遺憾
2026-04-23 07:36:03
令人遺憾!懷特塞德正式退出,原因曝光,盧偉表明態(tài)度,上海謹(jǐn)慎

令人遺憾!懷特塞德正式退出,原因曝光,盧偉表明態(tài)度,上海謹(jǐn)慎

萌蘭聊個(gè)球
2026-04-23 08:52:23
死了這條心!人民日報(bào)攤牌:中國不會(huì)救菲律賓,馬科斯投機(jī)到頭了

死了這條心!人民日報(bào)攤牌:中國不會(huì)救菲律賓,馬科斯投機(jī)到頭了

黑翼天使
2026-04-23 19:51:23
如今定居廣東的朱芳雨,大兒走籃球路,二兒優(yōu)秀低調(diào),三兒最瀟灑

如今定居廣東的朱芳雨,大兒走籃球路,二兒優(yōu)秀低調(diào),三兒最瀟灑

翰飛觀事
2026-04-22 14:42:17
特朗普的嘴,開了掛了

特朗普的嘴,開了掛了

牛彈琴
2026-04-24 07:38:45
央國企的幾大亂象:關(guān)系戶橫行、巨大的虛假繁榮......

央國企的幾大亂象:關(guān)系戶橫行、巨大的虛假繁榮......

燈錦年
2026-04-22 17:16:25
吳法憲出獄后,安置在濟(jì)南,同時(shí)告訴他有四個(gè)安排

吳法憲出獄后,安置在濟(jì)南,同時(shí)告訴他有四個(gè)安排

歷史甄有趣
2026-04-24 07:25:10
印尼的豪賭大潰敗,給全世界提了個(gè)醒:中國行我也行,純粹是幻覺

印尼的豪賭大潰敗,給全世界提了個(gè)醒:中國行我也行,純粹是幻覺

壹知眠羊
2026-04-24 07:21:00
我有罪,大導(dǎo)演昆汀花1萬美金,在包房舔腳半小時(shí),直到皮膚起皺

我有罪,大導(dǎo)演昆汀花1萬美金,在包房舔腳半小時(shí),直到皮膚起皺

西樓知趣雜談
2026-04-20 08:40:47
“秀才”相當(dāng)于如今什么學(xué)歷?說出來可別不信,別被電視劇誤導(dǎo)了

“秀才”相當(dāng)于如今什么學(xué)歷?說出來可別不信,別被電視劇誤導(dǎo)了

瑩瑩的歷史說
2026-04-23 00:44:55
不到1日,中國鄰國犯下兩大惡行,王毅直奔東盟內(nèi)部,將待足五天

不到1日,中國鄰國犯下兩大惡行,王毅直奔東盟內(nèi)部,將待足五天

影孖看世界
2026-04-22 23:53:06
場外收入頗豐,太陽報(bào):帕爾默的個(gè)人公司總資產(chǎn)突破730萬鎊

場外收入頗豐,太陽報(bào):帕爾默的個(gè)人公司總資產(chǎn)突破730萬鎊

懂球帝
2026-04-24 00:13:04
日本“最上”級(jí)護(hù)衛(wèi)艦出口澳大利亞:一筆改變亞太格局的百億大單

日本“最上”級(jí)護(hù)衛(wèi)艦出口澳大利亞:一筆改變亞太格局的百億大單

武器鑒賞
2026-04-22 09:02:13
腦震蕩保護(hù)協(xié)議期!文班已參加輕度投籃訓(xùn)練 G3狀態(tài)升級(jí)出戰(zhàn)存疑

腦震蕩保護(hù)協(xié)議期!文班已參加輕度投籃訓(xùn)練 G3狀態(tài)升級(jí)出戰(zhàn)存疑

醉臥浮生
2026-04-24 00:52:42
2026-04-24 09:39:00
小樂數(shù)學(xué)科普 incentive-icons
小樂數(shù)學(xué)科普
zzllrr小樂,小樂數(shù)學(xué)科普,讓前沿?cái)?shù)學(xué)流行起來~
324文章數(shù) 7關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!GPT-5.5正式上線:跑分更猛

頭條要聞

用了16年的學(xué)位證"失效"男子舉報(bào)自己 高校最新通報(bào)

頭條要聞

用了16年的學(xué)位證"失效"男子舉報(bào)自己 高校最新通報(bào)

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財(cái)經(jīng)要聞

19家企業(yè)要"鋁代銅",格力偏不

汽車要聞

預(yù)售30.29萬起 嵐圖泰山X8配896線激光雷達(dá)

態(tài)度原創(chuàng)

時(shí)尚
藝術(shù)
本地
手機(jī)
數(shù)碼

今年最好看的3個(gè)顏色,太適合夏天了!

藝術(shù)要聞

江青對聯(lián)驚艷眾人,書法與寫字的界限究竟在哪?

本地新聞

SAGA GIRLS 2026女團(tuán)選秀

手機(jī)要聞

2026年最后一款不加價(jià)的旗艦!OPPO Find X9s Pro首銷:5299元起

數(shù)碼要聞

重磅回歸!當(dāng)貝超級(jí)盒子正式開啟預(yù)約 4月27日全網(wǎng)開售

無障礙瀏覽 進(jìn)入關(guān)懷版