国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

清華2年前預(yù)言,正成為全球共識(shí)!Meta等三大AI機(jī)構(gòu)已得出同一結(jié)論

0
分享至


新智元報(bào)道

編輯:好困 桃子

【新智元導(dǎo)讀】太瘋狂了!Meta和METR剛測(cè)出的AI進(jìn)化數(shù)據(jù),與中國團(tuán)隊(duì)兩年前提出的「密度定律」完美重合。硅谷猛然回頭,發(fā)現(xiàn)中國研究者在這條路上已領(lǐng)先兩年!

全球三家最嚴(yán)肅的AI研究機(jī)構(gòu),過去一周集體撞車了!

4月3日,美國研究機(jī)構(gòu)METR悄悄更新了一份技術(shù)報(bào)告,核心結(jié)論壓成一句話。

AI能力每88.6天翻倍一次。


5天后,4月8日,Meta超級(jí)智能實(shí)驗(yàn)室發(fā)布全新模型Muse Spark,公開了一條內(nèi)部叫做scaling ladder的訓(xùn)練效率曲線,結(jié)論也是一句話。

要追上一年前Llama 4 Maverick的性能,新模型只需要不到十分之一的訓(xùn)練算力。


一份測(cè)任務(wù)時(shí)長,一份測(cè)訓(xùn)練算力。兩家機(jī)構(gòu)沒有任何往來,研究方法毫無重合。

但當(dāng)兩條曲線被換算到同一坐標(biāo)系里,斜率幾乎完全重合

到這里,事情已經(jīng)夠離譜了。

更離譜的是,這條曲線,被一個(gè)中國團(tuán)隊(duì)兩年前就完整地畫出來過,還登上了Nature子刊。

它叫密度定律。



兩年前,有人提前畫過這條線

這個(gè)概念最早出現(xiàn)在一篇叫「Densing Law of LLMs」的論文里。

作者是面壁智能和清華大學(xué)的聯(lián)合團(tuán)隊(duì),孫茂松和劉知遠(yuǎn)兩位教授領(lǐng)銜,第一作者是博士生肖朝軍。

論文2024年12月掛上arXiv,2025年11月被Nature Machine Intelligence接收。


論文地址:https://arxiv.org/abs/2412.04315


論文地址:https://www.nature.com/articles/s42256-025-01137-0

論文的核心判斷只有一句話。

模型智能密度隨時(shí)間呈指數(shù)級(jí)增強(qiáng),達(dá)到特定智能水平所需的參數(shù)量,每3.5個(gè)月下降一半

放在2024年底,這話聽上去有點(diǎn)過激。

那時(shí)全行業(yè)都在崇拜scaling law。OpenAI在堆模型,Anthropic在堆模型,Meta也在堆模型。

所有人都覺得參數(shù)越大智能越強(qiáng),把GPU燒到極致才是正道。


但研究團(tuán)隊(duì)不這么看。

他們把當(dāng)時(shí)所有有影響力的開源基礎(chǔ)模型,從Llama-1一路到Gemma-2、MiniCPM-3,總共51個(gè)模型都放進(jìn)了同一把尺子里去量。

五大基準(zhǔn)跑完,結(jié)果是幾乎完美的指數(shù)關(guān)系,R2達(dá)到0.934。

考慮到大模型評(píng)測(cè)很容易被數(shù)據(jù)污染干擾,他們又用一個(gè)新構(gòu)建的污染過濾數(shù)據(jù)集MMLU-CF重測(cè)了一次。R2=0.953。

兩次擬合都拿到了接近1的R2。統(tǒng)計(jì)學(xué)上,這幾乎不可能是巧合。

換句話說就是,這兩年發(fā)布的每一個(gè)主流開源模型,不管來自哪個(gè)團(tuán)隊(duì)、用什么架構(gòu),都落在了同一條「每3.5個(gè)月翻倍」的指數(shù)線上。


到這里,故事還只是「一個(gè)中國團(tuán)隊(duì)提出了一個(gè)看上去很激進(jìn)的經(jīng)驗(yàn)規(guī)律」。

真正讓這件事變成一個(gè)「時(shí)刻」的,是接下來這小半年發(fā)生的事。

三家機(jī)構(gòu),三種方法,同一個(gè)斜率

把面壁、Meta、METR三方的結(jié)論攤開看。

  • 面壁的密度定律衡量的是「同樣的智能水平需要多少參數(shù)」。結(jié)論是參數(shù)需求每3.5個(gè)月減半。

  • Meta的scaling ladder衡量的是「同樣的智能水平需要多少訓(xùn)練算力」。結(jié)論是Muse Spark比一年前的Llama 4 Maverick節(jié)省了一個(gè)數(shù)量級(jí)。

  • METR的時(shí)間跨度報(bào)告衡量的是「同樣的模型能搞定多長任務(wù)」。結(jié)論是任務(wù)時(shí)長每88.6天翻倍。

三把尺子。三個(gè)學(xué)術(shù)機(jī)構(gòu)。三種沒有任何重合的研究路徑。

但當(dāng)所有數(shù)字被換算到同一坐標(biāo)系里看時(shí),它們的曲線斜率幾乎完全重合。

這事最容易被忽略的一點(diǎn)是,密度定律是這三者里最早提出的。比Meta的scaling ladder早了近兩年,比METR的完整建模也早了一年多。

而當(dāng)Meta在四月初的發(fā)布博客里畫出那條scaling ladder時(shí),他們大概自己都沒意識(shí)到。這張圖的形狀,和2024年北京一個(gè)學(xué)術(shù)會(huì)議PPT上的曲線,幾乎是同一條線。

什么樣的觀察,才配得上「定律」兩個(gè)字

在科學(xué)界,有一套不成文的標(biāo)準(zhǔn),來判斷一條經(jīng)驗(yàn)觀察是否有資格被叫做「定律」。

不是看數(shù)據(jù)有多漂亮,是看它能不能在多個(gè)獨(dú)立的測(cè)量系統(tǒng)下同時(shí)成立。

摩爾定律之所以是定律,因?yàn)榘雽?dǎo)體行業(yè)從光刻精度、晶體管密度、單位算力成本三個(gè)完全不同的維度,幾十年來一遍遍驗(yàn)證過它。


密度定律走的是同一條路。

它最初只是來自單一團(tuán)隊(duì)的一條擬合曲線。到Nature子刊接收時(shí),它已經(jīng)能在污染過濾后的數(shù)據(jù)集上重現(xiàn)。到這個(gè)月,它在Meta的訓(xùn)練數(shù)據(jù)和METR的任務(wù)評(píng)測(cè)里又被兩次獨(dú)立驗(yàn)證。

放在更大的坐標(biāo)系里看,這一刻像極了1880年代電力剛進(jìn)入紐約的時(shí)候。

那時(shí)也是幾個(gè)不同的發(fā)明家、不同的工程師、不同的城市,各自在搞各自的電網(wǎng)。直到有人把所有項(xiàng)目的發(fā)展曲線畫在一張紙上,人們才反應(yīng)過來。這不是幾個(gè)零散的工程進(jìn)步,這是一個(gè)新時(shí)代正在悄悄鋪開。

只是這一次,從論文發(fā)表到被全球同行驗(yàn)證,只用了不到一年。

三個(gè)推論,每一個(gè)都在改寫行業(yè)假設(shè)

如果密度定律站得住腳,它會(huì)同時(shí)改寫很多東西。

第一,推理成本會(huì)比所有人預(yù)期的都崩得更快。

密度定律的一個(gè)推論是,達(dá)到同樣性能的LLM,推理成本大概每2.6個(gè)月減半

如今,這個(gè)降幅已經(jīng)被現(xiàn)實(shí)超過了。

Epoch AI最新追蹤數(shù)據(jù)顯示,達(dá)到Claude 3.5 Sonnet性能水平的LLM,過去一年token價(jià)格降了400倍。同檔位性能的最快降幅觸到900倍/年。

2022年底GPT-3.5開價(jià)20美元/百萬token那種水平,今天Mistral Nemo只要0.02美元,便宜了1000倍,模型還更強(qiáng)。

回頭來看,論文里的預(yù)測(cè)還是保守了。

第二,端側(cè)智能的爆發(fā)點(diǎn),比所有人預(yù)想的都近。

把密度定律和摩爾定律相乘,會(huì)得到一個(gè)更刺激的數(shù)字。

按目前估算,在同價(jià)格芯片上能跑的最大有效模型規(guī)模,大約每88天翻一倍。

這個(gè)數(shù)字和METR算出的88.6天幾乎一致。兩家完全不同的推算路徑,在小數(shù)點(diǎn)后撞了車。

未來三五年,在一臺(tái)普通筆記本甚至一部手機(jī)上跑當(dāng)下頂級(jí)GPT級(jí)別模型這件事,可能不再是科幻。

第三,大模型行業(yè)的最優(yōu)策略,正在悄悄反轉(zhuǎn)。

過去三年,行業(yè)對(duì)scaling law的理解一直停留在「堆參數(shù)堆數(shù)據(jù)」

但密度定律給出了一個(gè)反直覺的判斷。在密度持續(xù)指數(shù)增長的前提下,任何狀態(tài)的最強(qiáng)模型都只有幾個(gè)月的最優(yōu)窗口期。

砸全部資源去訓(xùn)一個(gè)更大的模型,然后等三個(gè)月被一個(gè)體積一半的新模型超越,在經(jīng)濟(jì)賬上是不劃算的。

真正可持續(xù)的路,是把資源砸在密度本身的提升上。更好的架構(gòu),更高質(zhì)量的數(shù)據(jù),更聰明的訓(xùn)練算法。

面壁,一直在沿著自己畫的尺子走

值得說一句的是,密度定律不是一篇發(fā)完就結(jié)束的論文。

提出這套理論的面壁智能,過去兩年一直在用自家的「小鋼炮」MiniCPM系列模型驗(yàn)證它。

MiniCPM-1-2.4B在2024年2月發(fā)布的時(shí)候,跑分能打平或超過2023年9月的Mistral-7B。也就是說,四個(gè)月時(shí)間,35%的參數(shù),達(dá)到了同等性能。

這個(gè)數(shù)字被直接寫進(jìn)了Nature子刊那篇論文里,作為密度定律的第一個(gè)實(shí)證案例。

從那之后,小鋼炮系列一路開源,覆蓋10B以下參數(shù)的文本、多模態(tài)、語音、全模態(tài)四大方向。這個(gè)開源完整度,在國內(nèi)除了阿里之外,只有面壁一家做到。

到目前為止,小鋼炮系列在全球的開源下載量已經(jīng)突破2400萬次。

它不是行業(yè)里最大的模型。但它是行業(yè)里第一個(gè)把「密度優(yōu)先」當(dāng)作公司方法論來執(zhí)行的團(tuán)隊(duì)。

而當(dāng)Meta和METR在2026年4月這一周用各自的方式驗(yàn)證密度定律時(shí),這家2024年就開始按這套方法論訓(xùn)練模型的中國公司,其實(shí)已經(jīng)領(lǐng)先了兩年的工程經(jīng)驗(yàn)。

這一次,中國研究者站在了曲線的起點(diǎn)

一個(gè)中國研究團(tuán)隊(duì)兩年前提出的理論框架,正在被Meta、METR這些海外最嚴(yán)肅的機(jī)構(gòu),用他們各自的方式,一次次重新發(fā)現(xiàn)。

這件事的份量,可能需要一點(diǎn)時(shí)間才能完全理解。

它不是一個(gè)「我們也行」的故事。它是一個(gè)「我們更早一點(diǎn)看見」的故事。

科學(xué)史上這樣的瞬間不算多。一個(gè)在2024年被懷疑的判斷,在2026年變成了多個(gè)獨(dú)立證據(jù)指向的同一條曲線。

這種跨地域、跨方法、跨機(jī)構(gòu)的「不約而同」,在物理學(xué)里發(fā)生過幾次,每一次都標(biāo)志著一個(gè)舊范式的終結(jié)和一個(gè)新范式的開始。

中國AI研究者這一次站在了那個(gè)起點(diǎn)上。

而那條曲線,還在以每88天翻一倍的速度往上走。

參考資料:

面壁智能首創(chuàng)的「密度定律」,獲 Meta 等海外頂級(jí)機(jī)構(gòu)認(rèn)可

https://arxiv.org/abs/2412.04315

https://www.nature.com/articles/s42256-025-01137-0

https://metr.org/blog/2026-1-29-time-horizon-1-1/

https://ai.meta.com/blog/introducing-muse-spark-msl/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
北京朝陽區(qū)梁先生有7個(gè)兒子,這事兒你們聽說了嗎?

北京朝陽區(qū)梁先生有7個(gè)兒子,這事兒你們聽說了嗎?

木子默
2026-04-19 21:10:55
女籃世界杯分檔出爐!中國隊(duì)直接避開5大勁敵:這下沖擊四強(qiáng)穩(wěn)了

女籃世界杯分檔出爐!中國隊(duì)直接避開5大勁敵:這下沖擊四強(qiáng)穩(wěn)了

籃球快餐車
2026-04-19 06:07:20
5月1日起,10類行為全國嚴(yán)查!誰碰誰倒霉

5月1日起,10類行為全國嚴(yán)查!誰碰誰倒霉

石辰搞笑日常
2026-04-19 01:06:37
曼城阿森納剩余賽程:皆無BIG6交鋒,曼城收官戰(zhàn)對(duì)陣維拉

曼城阿森納剩余賽程:皆無BIG6交鋒,曼城收官戰(zhàn)對(duì)陣維拉

懂球帝
2026-04-20 01:58:16
天文學(xué)家彭羅斯:人類的死亡只是宇宙的幻象,生命是不可能終結(jié)的

天文學(xué)家彭羅斯:人類的死亡只是宇宙的幻象,生命是不可能終結(jié)的

心中的麥田
2026-03-06 19:27:32
《八千里路云和月》大結(jié)局,田家泰犧牲,七哥的真正身份曝光

《八千里路云和月》大結(jié)局,田家泰犧牲,七哥的真正身份曝光

看盡落塵花q
2026-04-19 23:49:01
140年來最強(qiáng)厄爾尼諾要出現(xiàn)了?氣溫將沖擊高溫極限!真的嗎?

140年來最強(qiáng)厄爾尼諾要出現(xiàn)了?氣溫將沖擊高溫極限!真的嗎?

史行途
2026-04-19 14:25:26
至少15萬億!中國將對(duì)房子實(shí)施價(jià)值提升,現(xiàn)在賣房或等于白送人錢

至少15萬億!中國將對(duì)房子實(shí)施價(jià)值提升,現(xiàn)在賣房或等于白送人錢

愛看劇的阿峰
2026-04-19 17:59:28
李雨桐被拘!官方下場(chǎng),曾自曝背后靠山大,拘留10天,逾期還罰款

李雨桐被拘!官方下場(chǎng),曾自曝背后靠山大,拘留10天,逾期還罰款

白面書誏
2026-04-19 22:16:26
真香!神操作背后!老鷹為何愿意交易肯納德?

真香!神操作背后!老鷹為何愿意交易肯納德?

籃球?qū)嶄?/span>
2026-04-19 23:11:48
張敬軒被舉報(bào),內(nèi)地演出無望,霍汶希容祖兒力挺,患哮喘差點(diǎn)死掉

張敬軒被舉報(bào),內(nèi)地演出無望,霍汶希容祖兒力挺,患哮喘差點(diǎn)死掉

小冠說娛
2026-04-19 15:13:26
“余生好好走”,知名央視主持人王小丫,病床上的留言字字催淚

“余生好好走”,知名央視主持人王小丫,病床上的留言字字催淚

近史談
2026-03-31 18:57:49
別讓手機(jī)“出賣”你!國安部反復(fù)警示:這3個(gè)定位設(shè)置,立刻關(guān)掉

別讓手機(jī)“出賣”你!國安部反復(fù)警示:這3個(gè)定位設(shè)置,立刻關(guān)掉

Thurman在昆明
2026-04-17 10:22:21
日艦穿越臺(tái)海,解放軍劃五大警戒區(qū),黃海鎖喉+東海亮劍組合打出

日艦穿越臺(tái)海,解放軍劃五大警戒區(qū),黃海鎖喉+東海亮劍組合打出

小嵩
2026-04-20 05:34:57
塔帥跪了!曼城“提速”,名宿熱議:凈勝球定生死,阿森納擋不住

塔帥跪了!曼城“提速”,名宿熱議:凈勝球定生死,阿森納擋不住

奧拜爾
2026-04-20 02:01:45
間諜就在我們身邊!4月16日,央視報(bào)道了一個(gè)讓人后背發(fā)涼的新聞

間諜就在我們身邊!4月16日,央視報(bào)道了一個(gè)讓人后背發(fā)涼的新聞

丁丁鯉史紀(jì)
2026-04-19 19:43:57
美國若敢玩火,中方就敢動(dòng)手!外交部這次的一個(gè)表態(tài),極不尋常

美國若敢玩火,中方就敢動(dòng)手!外交部這次的一個(gè)表態(tài),極不尋常

時(shí)光在作祟
2026-04-19 16:46:57
又一家!全面停工停產(chǎn)!蘇州紡織老廠破產(chǎn),名下已無償債資產(chǎn)

又一家!全面停工停產(chǎn)!蘇州紡織老廠破產(chǎn),名下已無償債資產(chǎn)

微微熱評(píng)
2026-04-19 22:43:56
隨著比分定格2-1,42歲德羅西率隊(duì)逆轉(zhuǎn)比薩,迎來意甲2連勝

隨著比分定格2-1,42歲德羅西率隊(duì)逆轉(zhuǎn)比薩,迎來意甲2連勝

側(cè)身凌空斬
2026-04-20 01:55:28
何潤東“西楚霸王項(xiàng)羽”造型亮相沒騎馬引熱議,本人回應(yīng)

何潤東“西楚霸王項(xiàng)羽”造型亮相沒騎馬引熱議,本人回應(yīng)

韓小娛
2026-04-19 08:56:44
2026-04-20 06:23:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
15012文章數(shù) 66787關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類紀(jì)錄!300臺(tái)機(jī)器人狂飆半馬

頭條要聞

特朗普:美艦武力攔截伊朗貨船 在機(jī)艙炸出一個(gè)洞

頭條要聞

特朗普:美艦武力攔截伊朗貨船 在機(jī)艙炸出一個(gè)洞

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

何潤東漲粉百萬!內(nèi)娛隔空掀桌第一人

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

藝術(shù)
親子
旅游
本地
公開課

藝術(shù)要聞

超模施特洛耶克寫真曝光,簡直美到窒息,別錯(cuò)過!

親子要聞

孩子總打噴嚏、起疹子,時(shí)過敏嗎?

旅游要聞

北京投入2.2億元建成和田“三館一院”

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版