国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

宇宙尺度壓縮:Scaling Law的邊界,柏拉圖表征收斂于物質和信息交匯,解決P與NP問題,Simulation假說……

0
分享至

作者 | 超對稱技術

出品丨AI 科技大本營(ID:rgznai100)

超對稱公司成功在 BigBang-Proton 實現(xiàn)跨尺度跨結構的科學多任務學習,并從這個基礎出發(fā)提出將科學多任務學習擴展到極限,就是將宇宙當做一個完整整體進行預訓練,進而提出宇宙尺度壓縮 Universe Compression 的構想。本文將從多個方面論證這個構想的科學基礎,工程可行性,以及科學意義。


Scientific Multitask Learning 是通往宇宙尺度壓縮的基石

傳統(tǒng)的 LLM 開發(fā)的觀點認為,DNA 序列、數(shù)學方程式、水質數(shù)據(jù)、粒子噴注、材料結構這多學科的數(shù)據(jù)相互比較差異太大,與自然語言相比差異更大,放在一起訓練不可能收斂,loss 無法下降。

BigBang-Proton 的預訓練過程顯示,高度異質的數(shù)據(jù)集在正確的表征和合適的架構上可以收斂,這就預示了跨尺度、跨結構、跨學科的數(shù)據(jù)集,在高維度 latent space 中可以產生遷移學習。

ChatGPT 展示“寫出李清照風格的代碼”以及 Dalle 畫出“騎馬的宇航員”是典型的遷移學習的結果,在語言和藝術領域屢屢讓人驚訝,但在科學領域遷移學習至今未有成功案例,原因就是科學領域的多任務學習(multitask learning)在預訓練上沒有進展。相比于語言和藝術,科學的遷移學習的價值要大得多。大腦的神經(jīng)元是否發(fā)生了量子力學過程,研究這樣的問題正需要多學科的遷移學習。


超對稱團隊將算術運算能力作為科學多任務學習的核心,因為實驗結果主要是數(shù)值形式的。BigBang-Proton 驗證了夸克衰變產生的粒子噴注、材料結構、水質、DNA 序列、傳感器、股價、算術運算這些高度異質的數(shù)據(jù)集可以收斂,則將宇宙視為一個統(tǒng)一的實體來進行訓練和推理就已經(jīng)沒有障礙。這樣的科研范式融合了還原論和涌現(xiàn)輪兩種方法論。


Scaling Law 的邊界

在語言和專用科學多任務數(shù)據(jù)集上的預訓練能夠平滑收斂,這表明大語言模型(LLMs)的 Scaling Law 可以超越語言范疇,延伸至物理世界。那么 Scaling Law 的邊界是什么?

柏拉圖表征、數(shù)據(jù)空間流形與宇宙流形

Minyoung Huh 等作者提出柏拉圖表征(Platonic Representation Hypothesis, 他們統(tǒng)計了數(shù)百個在不同深度網(wǎng)絡架構和模態(tài)(圖像和文本)上訓練的 AI 模型,發(fā)現(xiàn)這些模型傾向于在其表征空間中收斂到一個相近的統(tǒng)計結果,這種統(tǒng)計結果是對現(xiàn)實的映射。他們假設這種收斂會到達一個理想化現(xiàn)實的表征,稱為柏拉圖表征,這一術語參考了柏拉圖在《理想國》中的洞穴寓言。

BigBang-Proton 在跨尺度跨結構跨學科預訓練上的進展和柏拉圖的表征相互印證。物質世界,或者說宇宙本身,構成了柏拉圖表征中的理想化現(xiàn)實,而物理學、化學和生物學中的所有科學定律都是從特定視角對這一現(xiàn)實的統(tǒng)計反映。

物質世界是一個單一的、統(tǒng)一的實體,由于人類腦力和資源有限才將科學探索的對象劃分為不同學科。宇宙起源于 137 億年前的大爆炸,演化過程中不同尺度涌現(xiàn)出不同的物質結構,最終形成其當前狀態(tài),演化過程產生了人類文明,人類語言從中涌現(xiàn)并通過互聯(lián)網(wǎng)被記錄下來。在全部互聯(lián)網(wǎng)數(shù)據(jù)上訓練的主流 LLMs,僅捕獲了嵌入在物質世界中的信息的一小部分。

與普遍認為由于可用互聯(lián)網(wǎng)數(shù)據(jù)耗盡,基座 LLM 預訓練已觸及瓶頸的判斷相反,超對稱團隊從 BigBang-Proton 的工作中得出結論:預訓練的極限最終就是宇宙本身的極限。由此超對稱團隊提出了柏拉圖表征的宇宙和文明版本,即只要有足夠的資源,在整個宇宙歷史和人類文明所產生的全部數(shù)據(jù)上進行預訓練單一模型,模型將收斂到一個植根于大爆炸和支配宇宙起源的基本定律的表征,即信息與物質的交匯點,因為我們今天所居住的物質世界正是從那個奇點衍生而來的。



圖:
宇宙尺度的預訓練收斂到基本物理定律,從宇宙的演化和科學發(fā)展歷史可看出來。超對稱假設,在人類文明產生的完整數(shù)據(jù)上訓練的模型傾向于收斂到基本自然定律,而在自然界和宇宙演化產生的完整數(shù)據(jù)上訓練的模型傾向于收斂到基本物理定律。在一個從宇宙完整歷史產生的數(shù)據(jù)上訓練的單一模型,傾向于收斂到大爆炸時刻、奇點處的基本物理定律以及信息與物質的交匯點。

假設 1 | 自回歸LLMs 的縮放定律尚未觸及瓶頸。LLMs 縮放的極限是宇宙的終極邊界。LLMs 的縮放最終將收斂到大爆炸時刻的基本物理定律以及信息與物質的交匯點。

為什么我們所處的世界具有隨機性和不確定性,所以我們需要用統(tǒng)計的工具來理解現(xiàn)實?現(xiàn)實的內在統(tǒng)計性質源于量子力學,起源于大爆炸期間的量子漲落。這些漲落驅動了跨越宇宙和物質尺度的層級結構形成。統(tǒng)計力學在不同的物質尺度之間架起橋梁,熱力學熵揭示了概率分布如何構成物理系統(tǒng)中相變的基礎。而和熱力學熵平行的信息熵,則揭示了語言的結構源于概率分布。

從前沿物理學的視角,熱力學熵和信息熵可以相互轉換,給我們理解自然語言提供另一個角度。人類語言也是物質世界的一部分,語言的概率分布來自人類在物理世界活動形成一種模式,最終是空間、時間和能量等自由度的組合和波動在現(xiàn)實中的投射;字、詞、語法、段落所包含的人類智能的邏輯,是從時空和能量的海量排列中涌現(xiàn),形成的一個由自由能最小化支配的系統(tǒng)。從能量角度理解語言則能解釋為什么 BigBang-Proton 在結合語言的多學科預訓練能收斂。

LLMs 在預訓練過程近似模擬總體語言概率分布,這些分布在數(shù)百萬年的時間里被精煉,以編碼時間、空間和能量關系。BigBang-Neutron 和 BigBang-Proton 的工作都表明,當映射到高維 latent space 時,這些語言分布與基本物理結構(如粒子對撞、材料晶體晶格、DNA 序列和水的時空模式)可緊密對齊。這種對齊使得語言引導的科學計算成為可能,并促進了科學領域間的遷移學習。這使得 LLMs 不僅僅是語言模式學習者,更可以延伸至物理世界來重構現(xiàn)實。


圖:
將多學科數(shù)據(jù)和自然語言投射到同一個 embedding space 中實現(xiàn)了收斂。訓練收斂圖中所示的收斂驗證了自然語言和看似高度不同的科學領域共享一種相近的統(tǒng)計結果,其本質可能根植于量子力學和其他基本物理原理。這一見解啟發(fā)超對稱團隊在構建表征和模型時將宇宙視為一個統(tǒng)一的實體。

深度學習中的流形假設 Manifold Hypothesis 可幫助我們進一步理解在整個宇宙數(shù)據(jù)上進行預訓練如何收斂到基本物理定律,并實現(xiàn)跨領域表征遷移。該假設認為,當嵌入到高維環(huán)境空間 RD 中時,真實世界的數(shù)據(jù)會集中在遠低于維度的流形 M 附近,這一說法得到了理論研究和實證研究的支持。流形學習也在大語言模型中得到了研究。根據(jù)流形假設的聯(lián)合,宇宙尺度預訓練中跨任務、學科、空間尺度和物理結構的低維結構形成流形,并收斂到一個不連通流形的聯(lián)合。這種流形的收斂可能對應于基本的宇宙流形,并與宇宙全息原理相一致。全息原理指出宇宙的完整物理描述可以從其邊界表征中涌現(xiàn)。

早在 1989 年,物理學家約翰. 惠勒提出了著名的 It from Bit,即粒子無限細分的盡頭是比特,而惠勒的學生貝肯斯坦和霍金研究黑洞輻射時提出了 Bekenstein Bound, 即黑洞熵的上限與表面積而非體積成正比。這啟發(fā)了't Hooft 首次假設,在普朗克尺度下,3+1 時空維度會減為 2+1,即“世界即全息圖”假說,此假說得到反德西特空間與共形場論(AdS/CFT)對應關系的支持,這屬于量子引力的研究范疇。

而降維正是流形學習的一種基本能力的目標。在宇宙尺度數(shù)據(jù)進行預訓練,模型可能學習到普朗克尺度的時空結構,并揭示量子引力層面的隱藏定律。這種時空結構學習遠遠超出當前基于圖像學習的空間智能和世界模型范式。

貝肯斯坦的工作也啟發(fā)了 computational universe 領域的研究,基本的概念是,物質和信息可以互相轉換。物理學的前沿理論帶來了哲學上的熱潮,硅谷核心文化圈有一種哲學認為現(xiàn)實世界來自 simulation,深受哲學家 Nick Bostrom, 馬斯克熱追,以至于形成了 simulation 宗教的說法。

因此,用計算對整個宇宙進行模擬并不遙遠,這是前沿物理學研究了接近半個世紀的課題,也具有深層的社會文化基礎。而超對稱公司提出用自回歸 LLM 對物質世界進行壓縮,是對 computational universe 和 simulation hypothesis 的一次實踐。當前熱議的用 AI 來開發(fā)戴森球或近地軌道工業(yè),被認為遠期未來才會落地,當 LLM 壓縮的尺度從地球擴展到星系和整個可觀測宇宙,這些工作就變得可著手。

考慮到物理約束,包括光速、自由度和 Bekenstein Bound, Lloyd 計算了宇宙的總信息容量。宇宙包含大約 個重子,并且最多可以容納 比特的信息,當考慮引力時,最多可以執(zhí)行 次浮點邏輯運算。

Sutskever 引入了數(shù)據(jù)壓縮和柯爾莫哥洛夫復雜度作為解釋無監(jiān)督學習泛化的數(shù)學形式主義。假設將宇宙中所有重子的自由度信息轉換為一個二進制字符串。令 為編碼 個重子的自由度 (包括位置、動量和自旋, 存儲在 比特中) 的二進制字符串,其中 通過以下方式生成:

其中 L = 作為壓縮算法的基座 LLM;Y= 基于尺度、結構和學科的完整科學知識作為約束, = 初始條件。沒有 Y 時,由完全隨機重子組成的 X 接近最大熵:

其中 是來自全息原理的宇宙總信息熵界:

使用宇宙學參數(shù): , , 。

當 Y 施加來自量子力學、廣義相對論、流體動力學或蛋白質結構的約束,規(guī)定粒子如何相互作用和分布時,復雜度會急劇降低:

給定完整物理定律 Y 的條件柯爾莫哥洛夫復雜度 滿足:

其中 是二元熵函數(shù)。對于宇宙尺度的 , 這簡化為:

基本比率 可以作為科學發(fā)現(xiàn)的指標。由于將 LLM 預訓練擴展到宇宙尺度將匹配宇宙的復雜性,當計算復雜度和問題可驗證度都可通過一個統(tǒng)一模型可獲得, 這個模型也可能為 P 與 NP 問題提供一種新的理解。


宇宙尺度的壓縮

在理論上,超對稱團隊提出了以下宇宙尺度壓縮的計劃,暫不考慮現(xiàn)實中計算資源和數(shù)據(jù)的挑戰(zhàn),以在一個二進制序列中重建物理世界。首先,建立一個統(tǒng)一的時空框架,跨越宇宙、星系、地球到夸克尺度,將每個自由度置于一個一致的時空結構中。其次,整合人類科學探究在所有尺度、結構和學科上產生的所有理論和實驗數(shù)據(jù),這相當于整個可觀測宇宙歷史的總數(shù)據(jù)內容。最后,通過整合所有天然材料和人造物體及活動(包括建筑、城市、工廠、車輛、飛機以及經(jīng)濟、政治、戰(zhàn)爭等)的數(shù)據(jù),從重子組分中重建地球和人類文明。

BigBang-Proton 的創(chuàng)新為宇宙尺度數(shù)據(jù)的預訓練提供了不可或缺的方法論。二進制塊編碼為自然界和人類活動中的超復雜模態(tài)提供了一種簡單、統(tǒng)一且有效的分詞方法。理論-實驗學習范式將由自然語言表示的理論知識與由數(shù)值數(shù)據(jù)表示的大規(guī)模實驗數(shù)據(jù)相融合。Monte Carlo Attention 提供了與宇宙中重子數(shù)量 相當?shù)纳舷挛拈L度。

通過將宇宙視為一個單一、連貫的實體,并在宇宙尺度數(shù)據(jù)上預訓練一個大型語言模型,可以推動科學發(fā)現(xiàn)的范式轉變。這種方法將構建一個統(tǒng)一的高維表征空間,捕捉物理現(xiàn)實的全部復雜性,并實現(xiàn)跨尺度、結構和學科的深度類比的涌現(xiàn)。這樣的框架將揭示結構的同質性,例如對偶性、對稱性和相變,這些現(xiàn)象從量子場到數(shù)和幾何結構中反復出現(xiàn),反映了數(shù)學、物理、化學和生物學中的深刻統(tǒng)一,例如朗蘭茲綱領、波粒二象性、材料晶體和海洋流中的拓撲結構。在早期宇宙、超導體、生物大腦和 LLMs 中出現(xiàn)的相變和臨界現(xiàn)象表明了一個共享的統(tǒng)計力學基礎。

智能是宇宙演化產生的系統(tǒng),反映了宇宙本身。不將智能置于宇宙演化的背景下,我們就無法理解智能的真正原因和底層機制。宇宙尺度壓縮的收斂可以進一步揭示智能與物質世界和宇宙這個智能演化的大舞臺之間深層次的關系。只有理解這種深層次的關系,我們才能真正意義創(chuàng)造出新的智能。

基于 BigBang-Proton 的工作和以上分析,超對稱團隊提出第二個假設。

假設 2 | 僅通過“下一個詞預測”,就可以從微觀粒子尺度重建宇宙中存在的任何物理結構。

這個假設推動超對稱的下一步工作,即在一個具有增強語言推理能力的單一 BigBang 模型中模擬更復雜的物理結構,包括大爆炸核合成、核聚變、量子材料、虛擬細胞系統(tǒng)、地球系統(tǒng)、機器人技術和飛機。前面五種是典型的自然界的物質結構,而對于人造結構如機器人和飛機汽車這樣的精密機械,BigBang 模型也有天然優(yōu)勢。對物質世界進行全面壓縮可以將具身智能的兩大核心即高精度環(huán)境和感知、推理、計劃、決策能力通過 next-word-prediction 整合在同一個隱空間,極大提高具身智能的泛化能力,這也是當前行業(yè)的難點。

對于飛機、汽車、船艦等精密復雜機械,BigBang 可以從原子尺度復建原材料、零部件、組裝的結構,將上千萬零部件以及操控其運行的物理化學生物原理整合在同一個隱空間,從原子層級上加速復雜裝備的設計、生產和迭代。

開源鏈接:

論文 | https://arxiv.org/abs/2510.00129

GitHub | https://github.com/supersymmetry-technologies/BigBang-Proton

HuggingFace | https://huggingface.co/SuperSymmetryTechnologies/BigBang-Proton

* 本文為 BigBang-Proton 系列報道第三篇。歡迎回顧前兩篇文章,對這個項目進行更全面的了解。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
他倆官宣結婚,朋友圈都炸了!

他倆官宣結婚,朋友圈都炸了!

黎兜兜
2026-03-07 21:19:02
朝鮮副國級高官叛逃脫北,曝光金家秘聞:酒池肉林、80萬買軒尼詩

朝鮮副國級高官叛逃脫北,曝光金家秘聞:酒池肉林、80萬買軒尼詩

貓眼觀史
2024-03-25 14:31:14
CBA常規(guī)賽3月11日重燃戰(zhàn)火,首日8場對決深遼疆粵看點解析

CBA常規(guī)賽3月11日重燃戰(zhàn)火,首日8場對決深遼疆粵看點解析

格斗聯(lián)盟有話說
2026-03-09 23:13:26
拉波爾塔:我給梅西父親發(fā)過合同,但他說梅西回歸會壓力太大

拉波爾塔:我給梅西父親發(fā)過合同,但他說梅西回歸會壓力太大

懂球帝
2026-03-09 17:15:18
嬰兒行割禮,嘴吸小雞雞,弄死無數(shù)小孩,愚蠢儀式還在

嬰兒行割禮,嘴吸小雞雞,弄死無數(shù)小孩,愚蠢儀式還在

老土歷史
2026-03-09 07:10:03
中國女足VS朝鮮!裁判2次誤判,朝鮮抵制罷賽,恐遭亞足聯(lián)重罰

中國女足VS朝鮮!裁判2次誤判,朝鮮抵制罷賽,恐遭亞足聯(lián)重罰

詹妹侃體育
2026-03-09 20:17:26
哈蘇2億四攝!OPPO官宣:3月17日,新機正式發(fā)布

哈蘇2億四攝!OPPO官宣:3月17日,新機正式發(fā)布

高科技愛好者
2026-03-09 23:12:04
890億美元,600架飛機,特朗普訪華之前,中國要送美國一份大禮?

890億美元,600架飛機,特朗普訪華之前,中國要送美國一份大禮?

墨蘭史書
2026-03-09 12:40:03
阿隆索敲定新東家!與利物浦達成口頭協(xié)議,下賽季重返安菲爾德

阿隆索敲定新東家!與利物浦達成口頭協(xié)議,下賽季重返安菲爾德

大嘴說臺球
2026-03-09 21:49:58
600714,實控人變更為國家電投!

600714,實控人變更為國家電投!

證券時報e公司
2026-03-09 20:46:31
媒體調查曝光:北京一律所主任卷走公款9億,逃亡海外

媒體調查曝光:北京一律所主任卷走公款9億,逃亡海外

深度報
2026-03-09 22:49:23
王思聰送珠寶高調表白懶懶:老婆我愛你,兩人同框照曝光很恩愛

王思聰送珠寶高調表白懶懶:老婆我愛你,兩人同框照曝光很恩愛

銀河史記
2026-03-09 19:12:35
價格暴漲69倍!美企高管無奈承認:除了找中國,我們別無他法

價格暴漲69倍!美企高管無奈承認:除了找中國,我們別無他法

藍色海邊
2026-03-09 19:55:02
地中海傳來一聲巨響,俄6萬噸巨輪慘遭擊沉,普京:絕不輕饒!

地中海傳來一聲巨響,俄6萬噸巨輪慘遭擊沉,普京:絕不輕饒!

嫹筆牂牂
2026-03-07 11:46:10
哈佛大學:一個人的命運,決定于晚上8點到10點之間

哈佛大學:一個人的命運,決定于晚上8點到10點之間

洞見
2026-03-06 21:37:47
2026年農村“五拆”全面啟動!這三類房子不拆,村民千萬別慌!

2026年農村“五拆”全面啟動!這三類房子不拆,村民千萬別慌!

細說職場
2026-03-06 20:42:07
華為新機突然官宣:4月15日,完全發(fā)售!

華為新機突然官宣:4月15日,完全發(fā)售!

科技堡壘
2026-03-08 12:30:18
命中帶福!這5個農歷生日尾數(shù)的人,晚年生活安穩(wěn)又富足

命中帶福!這5個農歷生日尾數(shù)的人,晚年生活安穩(wěn)又富足

智慧生活筆記
2026-03-07 05:49:44
價格上調!加1箱油將多花27.5元!

價格上調!加1箱油將多花27.5元!

甘肅圈圈
2026-03-10 00:14:29
央視怒批,目不識丁、洋相百出,難怪兩會上馮遠征建議演員多學習

央視怒批,目不識丁、洋相百出,難怪兩會上馮遠征建議演員多學習

傲傲講歷史
2026-03-05 16:08:43
2026-03-10 02:08:49
AI科技大本營 incentive-icons
AI科技大本營
連接AI技術的創(chuàng)造者和使用者
2640文章數(shù) 7660關注度
往期回顧 全部

科技要聞

OpenClaw更新,"養(yǎng)蝦"再也不會犯健忘癥了

頭條要聞

媒體:美軍用極殘酷方式擊沉伊朗軍艦 令世界不寒而栗

頭條要聞

媒體:美軍用極殘酷方式擊沉伊朗軍艦 令世界不寒而栗

體育要聞

36連勝終結!大魔王也是可以戰(zhàn)勝的

娛樂要聞

薛之謙老婆懷二胎,現(xiàn)身產檢心情愉快

財經(jīng)要聞

油價破100美元年內漲80% 全球市場劇震

汽車要聞

對標奔馳小號G級 路虎小型衛(wèi)士最新消息曝光

態(tài)度原創(chuàng)

教育
健康
本地
游戲
公開課

教育要聞

請來1v1模擬面試——

轉頭就暈的耳石癥,能開車上班嗎?

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

到底怎么裝飾手柄,才不像內褲?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版