国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

菲爾茲獎得主Michael Freedman新作揭開數(shù)學真相

0
分享至

機器之心編輯部


當談及數(shù)學時,我們近乎本能地認為,數(shù)學是一個嚴謹、精確、不容置疑的完美邏輯體系,但在菲爾茲獎得主邁克爾?弗里德曼(Michael Freedman)眼中,人類真正創(chuàng)造和關(guān)心的數(shù)學,本質(zhì)上是「柔軟且可塑」的。

Michael Freedman 是當代最具影響力的數(shù)學家之一,曾因解決四維龐加萊猜想獲得菲爾茲獎。這一成果被認為是拓撲學領(lǐng)域的里程碑。

此后,他并未停留在純數(shù)學領(lǐng)域,而是轉(zhuǎn)向應用前沿,創(chuàng)立了 Microsoft StationQ,成為拓撲量子計算的重要推動者之一。

近年來,Michael Freedman又將研究興趣延伸至人工智能,嘗試用數(shù)學視角理解人類知識的結(jié)構(gòu)與生成機制。



想象一下,一個僅需要 600 個 token 寫就的命題,展開后長度竟能達到 10 的 104 次方,比古戈爾(googol)還要龐大的天文數(shù)字。這并非科幻,而是 Michael Freedman 及其團隊在分析現(xiàn)代數(shù)學庫 Mathlib 時發(fā)現(xiàn)的真實現(xiàn)象。

這種數(shù)學家們在幾十層抽象之上輕松將龐大的演繹鏈條凝練為簡潔的概念背后,揭示了一個被數(shù)學家們使用了 3000 年、卻很少被言明的秘密:數(shù)學的本質(zhì),不是證明,而是壓縮。

近日,Michael Freedman 在最新論文中直接喊出這一宣言:「壓縮,就是你所需要的全部」(Compression is all you need)。



  • 論文鏈接:https://arxiv.org/pdf/2603.20396

在最近的一次采訪中,Michael Freedman 對此論文進行了介紹,探討了人類數(shù)學直覺與機器邏輯之間的巨大鴻溝。

他認為,人類數(shù)學數(shù)千年的演進,本質(zhì)上是一部不斷創(chuàng)造「宏」、構(gòu)建抽象層級的壓縮史。從 3000 年前的位值表示法,到現(xiàn)代復雜的微分方程,人類文明實際上一直在進行「數(shù)據(jù)壓縮」實驗。

人類做數(shù)學,從來不是在窮舉推理路徑,而是在一個幾乎無限的空間中,不斷尋找可以被壓縮的結(jié)構(gòu)。相較之下,AI 卻是一直在「窮舉」……

因此,在 AI 正處于關(guān)鍵發(fā)展階段的當下,理解這一機制,或許正是人類與 AI 在數(shù)學領(lǐng)域?qū)崿F(xiàn)真正協(xié)作的起點。

下面是此次 Michael Freedman 的采訪內(nèi)容,為了更好地閱讀,我們在不改變原意的基礎(chǔ)上進行了調(diào)整。

主持人:當我們談到數(shù)學時,通常會認為它是一個嚴密、完美的邏輯體系,但你的研究似乎在說,人類真正使用的數(shù)學并不是這樣。你能否從「壓縮」這個概念開始講起?

Michael Freedman:當然可以。在我們的論文中有個小玩笑:壓縮其實早在 3000 年前就被發(fā)明了,也許就是數(shù)學的第一個偉大定理 —— 位值記數(shù)法(Place notation)。

比如「10」可以用一個「1」放在特定位置表示,「100」也是類似。就是通過把「1」放在不同的位置,從而用極少的符號表示極大的數(shù)。這種表示方式讓整數(shù)的表達具備對數(shù)級增長,卻能在有限符號中表達指數(shù)級數(shù)量的數(shù)。

這就是一種極其強大的壓縮方式,它甚至和現(xiàn)代物理中的一些思想(比如自旋鏈狀態(tài))有關(guān)。但壓縮遠不止是數(shù)字表示,它貫穿整個數(shù)學體系。

主持人:能舉一個更具體的例子嗎?

Michael Freedman:我剛上大學時,第一次上微分方程課,教授在黑板上寫下一個一個巨大的 Ω,并說它是「向量叢截面的芽層」(sheaf of germs of sections of a vector bundle)。

那一刻,我甚至不知道什么是向量叢?后來我才意識到要理解這句話,你需要理解背后的多層概念:向量叢、截面、層、芽,以及它們之間的映射關(guān)系。如果再往下深思,還涉及自然數(shù)、整數(shù)、有理數(shù)、實數(shù)、向量空間、流形等基礎(chǔ)結(jié)構(gòu)。

也就是說,數(shù)學家在思考時,其實是站在十幾層抽象之上。這就是為什么微分方程「看起來不難」,因為大量信息已經(jīng)被壓縮了。

這就是「壓縮」的力量:大量信息被隱藏在高層概念中。

而如果你用 Lean 這樣的形式化語言表達,就必須把這些壓縮全部展開。所以可以說:壓縮是數(shù)學的核心,而且已經(jīng)存在了 3000 年。

在論文中,我們試圖把這種直覺變成可量化的東西。我們使用 Lean 的數(shù)學庫(mathlib,約 50 萬行代碼)作為「人類數(shù)學」的一個近似模型,對其結(jié)構(gòu)進行了統(tǒng)計分析:一個定理如何調(diào)用其他引理、定義如何復合并相互嵌套。我們可以看到一種分層結(jié)構(gòu)和壓縮結(jié)構(gòu),它使得 Mathlib 中的命題以高層級( Wrapped,包裝態(tài))編寫,但隨后可以展開為基礎(chǔ)的 Lean 術(shù)語(Unwrapped,解包態(tài))。

我們研究了兩者的關(guān)系,發(fā)現(xiàn)這種層次關(guān)系將相對簡單的數(shù)學命題變成了源自基礎(chǔ) Lean 術(shù)語的、極其巨大的樹狀結(jié)構(gòu)。

主持人:我記得這可以達到一個非?;闹嚨臄?shù)字:10 的 104 次方,對吧?那我想問,你做這些事因為你想強調(diào)這本質(zhì)上是數(shù)學的核心,對嗎?

Michael Freedman:是的,我們將這個庫中的內(nèi)容視為人類行為的一個良好樣本,雖然它在數(shù)學各領(lǐng)域的分布并不完美 —— 數(shù)論和代數(shù)幾何比分析或拓撲多得多。它不是人類數(shù)學思想的完美副本,但它與「從一組公理出發(fā)進行每一種可能的邏輯推演」截然不同,后者會導致「混沌數(shù)學」。

而無論如何進行形式化,發(fā)現(xiàn)結(jié)構(gòu)都會呈雙指數(shù)級增長。最終的結(jié)果就像你說的,我們在 Lean 庫中找到的最長的解包命題(Unwrapped statement),其大小為 10 的 104 次方),比 Googol(10 的 100 次方)還要大。而它對應的包裝命題(Wrapped statement)只有 600 個 Token。

這展示了驚人的膨脹,但反過來也展示了通過使用概念所獲得的巨大壓縮。

我想說的是,數(shù)學家和他們的智能體實際上在同一條船上。但當你看到像 Googol 這樣的數(shù)字,即使我們的機器比我們快 100 萬倍,100 萬在 Googol 的尺度下也是微不足道的。

所以,真正的問題不是人類與機器將探索什么,而是在龐大的形式推理空間中,哪一部分是可以被壓縮成我們和智能體能夠理解的形式(我稱之為形式數(shù)學)。

我相信人類數(shù)學(在此將我們的智能體也視為「人類」的一部分)正是如此。

主持人:在你們分析的這些方程中,是否發(fā)現(xiàn)存在某些方程或過程,不具備與其他事物相同的「公分母」?如果是這樣,如何決定什么是「最基礎(chǔ)」的?或如何知道自己「觸底」?

Michael Freedman:對于 Lean 來說,很容易知道什么時候觸底,因為庫的結(jié)構(gòu)就是這樣設(shè)計的。

基本上,有原始項,你可以用它們構(gòu)建更復雜的命題,所以這個「展開后長度」有時被稱為樹表示法。每個命題,你看它的子節(jié)點,即它是由什么構(gòu)建的,然后你看那些子節(jié)點的子節(jié)點,形成一棵越來越深的樹,直到它終止于原始的 Lean 項。之后統(tǒng)計所有這些節(jié)點的調(diào)用,每個節(jié)點根據(jù)其調(diào)用的先前節(jié)點的權(quán)重被賦予權(quán)重,從原始項權(quán)重為 1 開始。當把樹上頂層的權(quán)重加起來時,就得到了展開后命題的巨大數(shù)字。

而壓縮在于,人類設(shè)計并利用 Lean 表達了一種語言,可以用大約 600 個 token 寫下這個 Googol 量級的數(shù)字。

我們在論文中使用的方法則是從數(shù)學物理中汲取了靈感。在物理學中嘗試為自然的某部分建立一個模型以幫助進行數(shù)學分析時,這就是「玩具模型」(toy model),并非試圖捕捉全部真相,而是抓住核心結(jié)構(gòu),有意選擇一個現(xiàn)實的粗略投影,希望能夠?qū)ζ渥龀鐾暾姆治?,從而指導對更復雜問題的直覺。比如電磁學、量子力學、BCS 超導理論等,都是這樣。

在論文中,我們使用「幺半群」(monoid)來建模數(shù)學。

幺半群類似于群,只是未必有逆元,最簡單的幺半群就是計數(shù)數(shù)字,即自然數(shù)。在幺半群一側(cè),可以放入「宏」(macros),即「新思想」,代表新的抽象,可以幫助我們更高效地表達信息。

比如「10 的冪次方」,就是一個能實現(xiàn)壓縮、高效表示整數(shù)的宏的例子。一旦在幺半群中有宏,就可以推導出層級屬性、衡量壓縮程度。

研究結(jié)果顯示,宏越多,實現(xiàn)的壓縮程度就越高;宏越少,壓縮就越少,表達能力越弱。

而在數(shù)學這一側(cè),在 Lean 庫中,我們不知道宏是什么,這有點像在問數(shù)學的使用手冊,我們對此獲得的洞察越多,「人類」(我們和智能體)在探索數(shù)學時就會越順利,想法是去學習已經(jīng)在數(shù)學中使用的機制:原則是什么?推論是如何組織的?

現(xiàn)在的主要挑戰(zhàn)是解決「逆問題」,即看看在數(shù)學側(cè)對應的「宏」到底是什么。

主持人:在數(shù)學推理中,機器往往需要遍歷指數(shù)級的可能性,而人類卻能以更慢、近似多項式的(速率)方式直接切中要點。這種差異是否源于一種「數(shù)學品味」?我們是如何從海量可能性中篩選出真正有意義的路徑的,以及這種能力是否可以被建模和復制到機器中?

Michael Freedman:這是實驗科學,正是我們試圖發(fā)現(xiàn)的。我們試圖在某種程度上循環(huán)分析數(shù)學的歷史,試圖理解是什么引導我們走向這些高度可壓縮的形式推理領(lǐng)域,也許澄清這個概念,舉一些宏的例子會更好,就能看到什么是可壓縮、什么是不可壓縮的。

主持人:有沒有更為直觀的例子?

Michael Freedman:比如有一個定理:任何整數(shù)都可以表示為四個平方數(shù)之和(拉格朗日定理)。

這意味著,如果你將「平方數(shù)」當作宏,那使用這種增長極快的宏,每個整數(shù)只需要四步就可以表示。

聽起來很瘋狂,但解釋是表達這些平方數(shù)本身需要很多比特,所以這并不違背信息論。它只是,說明如果有更稠密的宏集,就可以用更少的步驟表達更多內(nèi)容,即宏的「密度」決定表達效率,而「10 的冪次方」正好處于平衡點,在宏的簡潔性(不要太大)和表達能力(能夠大量擴展)之間找到了一個最佳平衡點。

我們在論文中有一個結(jié)論是:多項式增長的幺半群容易壓縮,而指數(shù)增長的幺半群難以壓縮。

而根據(jù)經(jīng)驗和數(shù)值研究,我們發(fā)現(xiàn)數(shù)學具有高度可壓縮性。如果它能被一個幺半群很好地表示,那么它必須是一個多項式增長的幺半群,才能展現(xiàn)出我們面前看到的這種壓縮。

因此可以推測:數(shù)學的結(jié)構(gòu)本質(zhì)上是多項式的。

主持人:論文中還提到,建議使用類似 PageRank 算法來識別數(shù)學中高中心性的節(jié)點和核心定義,即那些支撐整個結(jié)構(gòu)發(fā)揮最大作用的節(jié)點。那我們?nèi)绾卧谶@些龐大的證明網(wǎng)絡中識別、找到它們?如果能識別出,是否定義了一種數(shù)學家與 AI 協(xié)作的新模式?

Michael Freedman:這是個好問題。PageRank 基本上是一種尋找馬爾可夫鏈平衡的算法。

換句話說,它是尋找某個微分方程的吸引不動點,你有許多互相交流的節(jié)點,想通過觀察誰調(diào)用了誰來確定誰最重要。這是一種分配重要性的自然想法,但它需要對結(jié)構(gòu)和互連有全局性的了解 。

但論文中我們提出了更簡單的指標,因為數(shù)學依賴抽象,有一些比例我們分別稱為「還原壓縮」(Reductive compression)和「演繹壓縮」(Deductive compression)。

「還原壓縮」是「展開長度」與「壓縮長度」的比值,如果一個陳述處于極高的抽象水平,展開后會變得巨大,那么這個比值就會非常大。這不僅是自動智能體可以使用的局部指標,還可以用來判斷是在提升還是降低抽象層級。

「演繹壓縮」則是觀察證明長度與命題長度的比值,這個比例告訴我們有多少數(shù)學工作被壓縮進了那個命題中。比如費馬大定理,可以用一句話描述,但證明需要數(shù)百頁。這個比例證明了現(xiàn)象級的力量:該命題具有極高的「壓縮密度」。

AI 可以在探索證明路徑時追蹤這些指標,以此感知它正在穿越的「景觀」。

主持人:其實從整體來看,這篇論文在研究數(shù)學智能的本質(zhì)時提出了一個非常大膽的宣言,且似乎與 LLM 發(fā)展有關(guān),當初為什么選擇這個特定方向?想傳達的核心是什么?

Michael Freedman:我們論文標題「Compression is all you need」(「壓縮,就是你所需要的全部」)本身就是一個強觀點。大膽的措辭陳述觀點是好事,這樣人們可以反駁它,從而引發(fā)更好的討論。

而至于我個人為什么選擇這個研究方向?

從宏觀上來看,我認為我們正處于一個非常特殊的歷史節(jié)點。從文藝復興到科學革命、工業(yè)革命,再到高科技革命和現(xiàn)在的 AI,歷史似乎真的在奔向「奇點」時刻,世界即將發(fā)生巨變。你可以說「外星人已經(jīng)抵達了」,只是它們是我們制造出來的。而我,更想作為參與者而非觀察者進入這個時代。

更具體來說,我們正在學習,尋找能夠引導發(fā)現(xiàn)「有趣數(shù)學」(即人類數(shù)學)的簡單組織原則將是富有成效的。我們已經(jīng)看到,這種可壓縮性在數(shù)學中有著非常不同的形式。

論文中提到的可壓縮性是「局部」的:你將一組符號壓縮成新符號(如 10 的冪次方)。但像柯爾莫哥洛夫(Kolmogorov)這樣的人通過算法研究了更一般類型的可壓縮性,即「全局」壓縮。

所以,數(shù)學家使用局部壓縮,而全局壓縮是不可計算的。但可能存在某種中間地帶,通過仔細研究壓縮,我們和智能體也許能探索超越局部壓縮的新思維模式。這是一個模糊的想法,但我想呈現(xiàn)給大家。

所以,我認為我們和 AI 在某種意義上是「同一條船上的人」。它們也無法通過暴力計算探索全部空間,必須像我們一樣依賴「直覺」。而未來的關(guān)鍵是:我們?nèi)绾闻c AI 一起,發(fā)展新的數(shù)學直覺。

這篇論文,其實是在嘗試畫出一張「數(shù)學的地形圖」,幫助我們理解這個空間。

https://arxiv.org/abs/2603.20396

https://x.com/SAIRfoundation/status/2036916216913330552

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
CBA最新積分榜:廣東無緣前4!上海雙殺遼寧,季后賽12強決出11席

CBA最新積分榜:廣東無緣前4!上海雙殺遼寧,季后賽12強決出11席

小火箭愛體育
2026-04-20 22:01:36
女人一旦開口要這個,就是生理性喜歡,裝不出來!男人千萬別不懂

女人一旦開口要這個,就是生理性喜歡,裝不出來!男人千萬別不懂

小影的娛樂
2026-04-20 18:24:19
CBA一夜確定前11名!上海22連勝,廣東輸山西無緣前4,寧波創(chuàng)歷史

CBA一夜確定前11名!上海22連勝,廣東輸山西無緣前4,寧波創(chuàng)歷史

薇說體育
2026-04-20 22:10:07
封神!短劇《極品家丁》吊打陳赫爛劇,網(wǎng)文神作也能有良心改編

封神!短劇《極品家丁》吊打陳赫爛劇,網(wǎng)文神作也能有良心改編

迷影映畫
2026-04-18 20:10:17
研究表明:我國男性的早泄率只有2.3%,勃起功能障礙卻高達35%!

研究表明:我國男性的早泄率只有2.3%,勃起功能障礙卻高達35%!

黯泉
2026-04-14 18:19:30
為什么腦梗逐年增多?提醒:與肥肉無關(guān),有一樣東西要少碰

為什么腦梗逐年增多?提醒:與肥肉無關(guān),有一樣東西要少碰

芹姐說生活
2026-04-19 08:33:41
美國終于開始害怕?比稀土更致命王牌出手了,萬斯:中國要冷靜

美國終于開始害怕?比稀土更致命王牌出手了,萬斯:中國要冷靜

混沌錄
2026-04-10 22:53:19
被豆包害慘了的大學生們!網(wǎng)友:豆包就是愚蠢且勤勞的老實人

被豆包害慘了的大學生們!網(wǎng)友:豆包就是愚蠢且勤勞的老實人

夜深愛雜談
2025-12-02 20:51:10
日本又在歷史傷口上公然撒鹽

日本又在歷史傷口上公然撒鹽

烽火瞭望者
2026-04-20 11:26:11
李煜有一首詞,近七百年無人能及,清朝詞人仿一首,竟超越了原作

李煜有一首詞,近七百年無人能及,清朝詞人仿一首,竟超越了原作

千秋文化
2026-02-21 19:33:41
48歲大S在東京離世,臨終留紫檀佛珠,京都神社通靈師揭轉(zhuǎn)世秘密

48歲大S在東京離世,臨終留紫檀佛珠,京都神社通靈師揭轉(zhuǎn)世秘密

詭譎怪談
2025-02-26 23:01:37
“豬八戒”扮演者馬德華,妻子顏值不輸“嫦娥”,一家人事業(yè)有成

“豬八戒”扮演者馬德華,妻子顏值不輸“嫦娥”,一家人事業(yè)有成

芳芳歷史燴
2026-04-20 23:09:25
全球最慘男子,眼睜睜看著自己“融化”

全球最慘男子,眼睜睜看著自己“融化”

郁郁乎文
2025-08-28 20:39:07
傷得很深!男子打賞女主播近300萬,想結(jié)婚時才知對方女兒都20歲了:我只顧為愛沖鋒,結(jié)果她全是假話

傷得很深!男子打賞女主播近300萬,想結(jié)婚時才知對方女兒都20歲了:我只顧為愛沖鋒,結(jié)果她全是假話

極目新聞
2026-04-10 15:54:54
越來越多人不裝“玻璃淋浴房”了,這5個替代方案,美觀又實用!

越來越多人不裝“玻璃淋浴房”了,這5個替代方案,美觀又實用!

家居設(shè)計師宅哥
2026-04-19 23:32:23
房子遭人強拆,因反抗坐3年牢!出獄后揚言:不贏官司就殺人!

房子遭人強拆,因反抗坐3年牢!出獄后揚言:不贏官司就殺人!

談史論天地
2026-04-20 12:16:17
舒淇不再隱瞞!多年無子的她終于承認:我們不是丁克,是生不出來

舒淇不再隱瞞!多年無子的她終于承認:我們不是丁克,是生不出來

長歌侃娛
2026-04-19 09:54:43
“保障房”真搶不起來了?北京昌平放號當天,中介刷起了短視頻

“保障房”真搶不起來了?北京昌平放號當天,中介刷起了短視頻

石辰搞笑日常
2026-04-20 14:50:09
浙江一男子收到陌生賬號轉(zhuǎn)賬8萬余元,三天后奢侈品牌CELINE商家找來:員工誤將其收款碼給客戶

浙江一男子收到陌生賬號轉(zhuǎn)賬8萬余元,三天后奢侈品牌CELINE商家找來:員工誤將其收款碼給客戶

臺州交通廣播
2026-04-20 14:13:51
革命衛(wèi)隊與伊朗政府矛盾公開化,伊朗內(nèi)部分裂愈演愈烈

革命衛(wèi)隊與伊朗政府矛盾公開化,伊朗內(nèi)部分裂愈演愈烈

修明札記
2026-04-19 11:47:24
2026-04-20 23:47:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12813文章數(shù) 142633關(guān)注度
往期回顧 全部

科技要聞

HUAWEI Pura X Max發(fā)布 售價10999元起

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經(jīng)要聞

利潤暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

家居
教育
親子
藝術(shù)
軍事航空

家居要聞

自然慢調(diào) 慢享時光

教育要聞

南方電網(wǎng)招了7308人,華南理工485個,這所學校把南網(wǎng)變成了"自家后院"

親子要聞

【孤獨癥科普】啥是孤獨癥,哪些孩子易發(fā)生,如何應對?

藝術(shù)要聞

王羲之《換鵝帖》尚在人間,驚艷無比!

軍事要聞

特朗普:美艦向伊朗貨船開火炸出個洞

無障礙瀏覽 進入關(guān)懷版