国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

清華2年前預(yù)言,正成為全球共識!Meta等三大AI機(jī)構(gòu)已得出同一結(jié)論

0
分享至


新智元報(bào)道

編輯:好困 桃子

【新智元導(dǎo)讀】太瘋狂了!Meta和METR剛測出的AI進(jìn)化數(shù)據(jù),與中國團(tuán)隊(duì)兩年前提出的「密度定律」完美重合。硅谷猛然回頭,發(fā)現(xiàn)中國研究者在這條路上已領(lǐng)先兩年!

全球三家最嚴(yán)肅的AI研究機(jī)構(gòu),過去一周集體撞車了!

4月3日,美國研究機(jī)構(gòu)METR悄悄更新了一份技術(shù)報(bào)告,核心結(jié)論壓成一句話。

AI能力每88.6天翻倍一次。


5天后,4月8日,Meta超級智能實(shí)驗(yàn)室發(fā)布全新模型Muse Spark,公開了一條內(nèi)部叫做scaling ladder的訓(xùn)練效率曲線,結(jié)論也是一句話。

要追上一年前Llama 4 Maverick的性能,新模型只需要不到十分之一的訓(xùn)練算力。


一份測任務(wù)時(shí)長,一份測訓(xùn)練算力。兩家機(jī)構(gòu)沒有任何往來,研究方法毫無重合。

但當(dāng)兩條曲線被換算到同一坐標(biāo)系里,斜率幾乎完全重合。

到這里,事情已經(jīng)夠離譜了。

更離譜的是,這條曲線,被一個(gè)中國團(tuán)隊(duì)兩年前就完整地畫出來過,還登上了Nature子刊。

它叫密度定律。



兩年前,有人提前畫過這條線

這個(gè)概念最早出現(xiàn)在一篇叫「Densing Law of LLMs」的論文里。

作者是面壁智能和清華大學(xué)的聯(lián)合團(tuán)隊(duì),孫茂松和劉知遠(yuǎn)兩位教授領(lǐng)銜,第一作者是博士生肖朝軍。

論文2024年12月掛上arXiv,2025年11月被Nature Machine Intelligence接收。


論文地址:https://arxiv.org/abs/2412.04315


論文地址:https://www.nature.com/articles/s42256-025-01137-0

論文的核心判斷只有一句話。

模型智能密度隨時(shí)間呈指數(shù)級增強(qiáng),達(dá)到特定智能水平所需的參數(shù)量,每3.5個(gè)月下降一半。

放在2024年底,這話聽上去有點(diǎn)過激。

那時(shí)全行業(yè)都在崇拜scaling law。OpenAI在堆模型,Anthropic在堆模型,Meta也在堆模型。

所有人都覺得參數(shù)越大智能越強(qiáng),把GPU燒到極致才是正道。


但研究團(tuán)隊(duì)不這么看。

他們把當(dāng)時(shí)所有有影響力的開源基礎(chǔ)模型,從Llama-1一路到Gemma-2、MiniCPM-3,總共51個(gè)模型都放進(jìn)了同一把尺子里去量。

五大基準(zhǔn)跑完,結(jié)果是幾乎完美的指數(shù)關(guān)系,R2達(dá)到0.934。

考慮到大模型評測很容易被數(shù)據(jù)污染干擾,他們又用一個(gè)新構(gòu)建的污染過濾數(shù)據(jù)集MMLU-CF重測了一次。R2=0.953。

兩次擬合都拿到了接近1的R2。統(tǒng)計(jì)學(xué)上,這幾乎不可能是巧合。

換句話說就是,這兩年發(fā)布的每一個(gè)主流開源模型,不管來自哪個(gè)團(tuán)隊(duì)、用什么架構(gòu),都落在了同一條「每3.5個(gè)月翻倍」的指數(shù)線上。


到這里,故事還只是「一個(gè)中國團(tuán)隊(duì)提出了一個(gè)看上去很激進(jìn)的經(jīng)驗(yàn)規(guī)律」。

真正讓這件事變成一個(gè)「時(shí)刻」的,是接下來這小半年發(fā)生的事。

三家機(jī)構(gòu),三種方法,同一個(gè)斜率

把面壁、Meta、METR三方的結(jié)論攤開看。

  • 面壁的密度定律衡量的是「同樣的智能水平需要多少參數(shù)」。結(jié)論是參數(shù)需求每3.5個(gè)月減半。

  • Meta的scaling ladder衡量的是「同樣的智能水平需要多少訓(xùn)練算力」。結(jié)論是Muse Spark比一年前的Llama 4 Maverick節(jié)省了一個(gè)數(shù)量級。

  • METR的時(shí)間跨度報(bào)告衡量的是「同樣的模型能搞定多長任務(wù)」。結(jié)論是任務(wù)時(shí)長每88.6天翻倍。

三把尺子。三個(gè)學(xué)術(shù)機(jī)構(gòu)。三種沒有任何重合的研究路徑。

但當(dāng)所有數(shù)字被換算到同一坐標(biāo)系里看時(shí),它們的曲線斜率幾乎完全重合。

這事最容易被忽略的一點(diǎn)是,密度定律是這三者里最早提出的。比Meta的scaling ladder早了近兩年,比METR的完整建模也早了一年多。

而當(dāng)Meta在四月初的發(fā)布博客里畫出那條scaling ladder時(shí),他們大概自己都沒意識到。這張圖的形狀,和2024年北京一個(gè)學(xué)術(shù)會議PPT上的曲線,幾乎是同一條線。

什么樣的觀察,才配得上「定律」兩個(gè)字

在科學(xué)界,有一套不成文的標(biāo)準(zhǔn),來判斷一條經(jīng)驗(yàn)觀察是否有資格被叫做「定律」。

不是看數(shù)據(jù)有多漂亮,是看它能不能在多個(gè)獨(dú)立的測量系統(tǒng)下同時(shí)成立。

摩爾定律之所以是定律,因?yàn)榘雽?dǎo)體行業(yè)從光刻精度、晶體管密度、單位算力成本三個(gè)完全不同的維度,幾十年來一遍遍驗(yàn)證過它。


密度定律走的是同一條路。

它最初只是來自單一團(tuán)隊(duì)的一條擬合曲線。到Nature子刊接收時(shí),它已經(jīng)能在污染過濾后的數(shù)據(jù)集上重現(xiàn)。到這個(gè)月,它在Meta的訓(xùn)練數(shù)據(jù)和METR的任務(wù)評測里又被兩次獨(dú)立驗(yàn)證。

放在更大的坐標(biāo)系里看,這一刻像極了1880年代電力剛進(jìn)入紐約的時(shí)候。

那時(shí)也是幾個(gè)不同的發(fā)明家、不同的工程師、不同的城市,各自在搞各自的電網(wǎng)。直到有人把所有項(xiàng)目的發(fā)展曲線畫在一張紙上,人們才反應(yīng)過來。這不是幾個(gè)零散的工程進(jìn)步,這是一個(gè)新時(shí)代正在悄悄鋪開。

只是這一次,從論文發(fā)表到被全球同行驗(yàn)證,只用了不到一年。

三個(gè)推論,每一個(gè)都在改寫行業(yè)假設(shè)

如果密度定律站得住腳,它會同時(shí)改寫很多東西。

第一,推理成本會比所有人預(yù)期的都崩得更快。

密度定律的一個(gè)推論是,達(dá)到同樣性能的LLM,推理成本大概每2.6個(gè)月減半。

如今,這個(gè)降幅已經(jīng)被現(xiàn)實(shí)超過了。

Epoch AI最新追蹤數(shù)據(jù)顯示,達(dá)到Claude 3.5 Sonnet性能水平的LLM,過去一年token價(jià)格降了400倍。同檔位性能的最快降幅觸到900倍/年。

2022年底GPT-3.5開價(jià)20美元/百萬token那種水平,今天Mistral Nemo只要0.02美元,便宜了1000倍,模型還更強(qiáng)。

回頭來看,論文里的預(yù)測還是保守了。

第二,端側(cè)智能的爆發(fā)點(diǎn),比所有人預(yù)想的都近。

把密度定律和摩爾定律相乘,會得到一個(gè)更刺激的數(shù)字。

按目前估算,在同價(jià)格芯片上能跑的最大有效模型規(guī)模,大約每88天翻一倍。

這個(gè)數(shù)字和METR算出的88.6天幾乎一致。兩家完全不同的推算路徑,在小數(shù)點(diǎn)后撞了車。

未來三五年,在一臺普通筆記本甚至一部手機(jī)上跑當(dāng)下頂級GPT級別模型這件事,可能不再是科幻。

第三,大模型行業(yè)的最優(yōu)策略,正在悄悄反轉(zhuǎn)。

過去三年,行業(yè)對scaling law的理解一直停留在「堆參數(shù)堆數(shù)據(jù)」

但密度定律給出了一個(gè)反直覺的判斷。在密度持續(xù)指數(shù)增長的前提下,任何狀態(tài)的最強(qiáng)模型都只有幾個(gè)月的最優(yōu)窗口期。

砸全部資源去訓(xùn)一個(gè)更大的模型,然后等三個(gè)月被一個(gè)體積一半的新模型超越,在經(jīng)濟(jì)賬上是不劃算的。

真正可持續(xù)的路,是把資源砸在密度本身的提升上。更好的架構(gòu),更高質(zhì)量的數(shù)據(jù),更聰明的訓(xùn)練算法。

面壁,一直在沿著自己畫的尺子走

值得說一句的是,密度定律不是一篇發(fā)完就結(jié)束的論文。

提出這套理論的面壁智能,過去兩年一直在用自家的「小鋼炮」MiniCPM系列模型驗(yàn)證它。

MiniCPM-1-2.4B在2024年2月發(fā)布的時(shí)候,跑分能打平或超過2023年9月的Mistral-7B。也就是說,四個(gè)月時(shí)間,35%的參數(shù),達(dá)到了同等性能。

這個(gè)數(shù)字被直接寫進(jìn)了Nature子刊那篇論文里,作為密度定律的第一個(gè)實(shí)證案例。

從那之后,小鋼炮系列一路開源,覆蓋10B以下參數(shù)的文本、多模態(tài)、語音、全模態(tài)四大方向。這個(gè)開源完整度,在國內(nèi)除了阿里之外,只有面壁一家做到。

到目前為止,小鋼炮系列在全球的開源下載量已經(jīng)突破2400萬次。

它不是行業(yè)里最大的模型。但它是行業(yè)里第一個(gè)把「密度優(yōu)先」當(dāng)作公司方法論來執(zhí)行的團(tuán)隊(duì)。

而當(dāng)Meta和METR在2026年4月這一周用各自的方式驗(yàn)證密度定律時(shí),這家2024年就開始按這套方法論訓(xùn)練模型的中國公司,其實(shí)已經(jīng)領(lǐng)先了兩年的工程經(jīng)驗(yàn)。

這一次,中國研究者站在了曲線的起點(diǎn)

一個(gè)中國研究團(tuán)隊(duì)兩年前提出的理論框架,正在被Meta、METR這些海外最嚴(yán)肅的機(jī)構(gòu),用他們各自的方式,一次次重新發(fā)現(xiàn)。

這件事的份量,可能需要一點(diǎn)時(shí)間才能完全理解。

它不是一個(gè)「我們也行」的故事。它是一個(gè)「我們更早一點(diǎn)看見」的故事。

科學(xué)史上這樣的瞬間不算多。一個(gè)在2024年被懷疑的判斷,在2026年變成了多個(gè)獨(dú)立證據(jù)指向的同一條曲線。

這種跨地域、跨方法、跨機(jī)構(gòu)的「不約而同」,在物理學(xué)里發(fā)生過幾次,每一次都標(biāo)志著一個(gè)舊范式的終結(jié)和一個(gè)新范式的開始。

中國AI研究者這一次站在了那個(gè)起點(diǎn)上。

而那條曲線,還在以每88天翻一倍的速度往上走。

參考資料:

面壁智能首創(chuàng)的「密度定律」,獲 Meta 等海外頂級機(jī)構(gòu)認(rèn)可

https://arxiv.org/abs/2412.04315

https://www.nature.com/articles/s42256-025-01137-0

https://metr.org/blog/2026-1-29-time-horizon-1-1/

https://ai.meta.com/blog/introducing-muse-spark-msl/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
越南高鐵終于開工,中國方案被放棄,河內(nèi)留心眼:不接入中方鐵路

越南高鐵終于開工,中國方案被放棄,河內(nèi)留心眼:不接入中方鐵路

小玡說故事
2026-04-14 10:50:38
尾盤拉升,有何消息?

尾盤拉升,有何消息?

揭幕者
2026-04-14 15:21:36
張碧晨現(xiàn)在肉眼可見的 “兇”啊好大好白

張碧晨現(xiàn)在肉眼可見的 “兇”啊好大好白

小椰的奶奶
2026-04-14 12:54:46
46歲黃金配角趙達(dá)官宣結(jié)婚!娶小十幾歲1米8美女總裁,殷桃成過去

46歲黃金配角趙達(dá)官宣結(jié)婚!娶小十幾歲1米8美女總裁,殷桃成過去

子芫伴你成長
2026-04-12 23:39:34
比亞迪工廠著火了,評論區(qū)更火

比亞迪工廠著火了,評論區(qū)更火

雨秋閑話
2026-04-14 11:24:07
新冠后遺癥的長期侵襲,無數(shù)人在不知不覺中深陷困境

新冠后遺癥的長期侵襲,無數(shù)人在不知不覺中深陷困境

律法刑道
2026-04-01 10:15:47
土以要開打?埃爾多安威脅攻打以色列后,不到1天,卡茨強(qiáng)勢出招

土以要開打?埃爾多安威脅攻打以色列后,不到1天,卡茨強(qiáng)勢出招

阿芒娛樂說
2026-04-14 13:13:21
斯諾克送出第3份百萬大獎?20歲小將聽牌,復(fù)刻火箭常冰玉成就?

斯諾克送出第3份百萬大獎?20歲小將聽牌,復(fù)刻火箭常冰玉成就?

劉姚堯的文字城堡
2026-04-14 14:45:16
模特李婉婉,身材顏值都是天花板級別的存在!

模特李婉婉,身材顏值都是天花板級別的存在!

動物奇奇怪怪
2026-04-14 15:39:47
林彪叛逃后,周恩來嚎啕大哭,紀(jì)登奎上前勸說,他卻擺手:你不懂

林彪叛逃后,周恩來嚎啕大哭,紀(jì)登奎上前勸說,他卻擺手:你不懂

歷史甄有趣
2026-04-06 09:15:20
常規(guī)賽六大獎項(xiàng)預(yù)測!SGA包攬兩項(xiàng),DPOY最無懸念!

常規(guī)賽六大獎項(xiàng)預(yù)測!SGA包攬兩項(xiàng),DPOY最無懸念!

籃球?qū)嶄?/span>
2026-04-14 01:02:27
我媽讓我婚前把4套房公證了,領(lǐng)證后,老公果然說:給我弟一套房

我媽讓我婚前把4套房公證了,領(lǐng)證后,老公果然說:給我弟一套房

小影的娛樂
2026-04-14 07:17:03
全紅嬋被282人群嘲,矛頭直指練俊杰父親!冠軍師兄評論區(qū)淪陷

全紅嬋被282人群嘲,矛頭直指練俊杰父親!冠軍師兄評論區(qū)淪陷

情感大頭說說
2026-04-14 12:21:28
現(xiàn)役球星進(jìn)入季后賽次數(shù)!詹姆斯19次,杜蘭特14次,哈登創(chuàng)紀(jì)錄

現(xiàn)役球星進(jìn)入季后賽次數(shù)!詹姆斯19次,杜蘭特14次,哈登創(chuàng)紀(jì)錄

兵哥籃球故事
2026-04-14 13:58:11
賭王何鴻燊借運(yùn)后輩們的瓜!

賭王何鴻燊借運(yùn)后輩們的瓜!

八卦瘋叔
2026-04-14 10:16:00
火腿腸三巨頭的衰落告訴我們什么:產(chǎn)品沒變,時(shí)代變了

火腿腸三巨頭的衰落告訴我們什么:產(chǎn)品沒變,時(shí)代變了

富貴說
2026-04-05 18:42:13
破解“車大位小”,市民呼吁修訂車位標(biāo)準(zhǔn),專家建議政企協(xié)同|“車大位小”停車難調(diào)查(下)

破解“車大位小”,市民呼吁修訂車位標(biāo)準(zhǔn),專家建議政企協(xié)同|“車大位小”停車難調(diào)查(下)

中國能源網(wǎng)
2026-04-14 12:08:10
美國“封鎖令”正式生效!一文讀懂:霍爾木茲最新形勢究竟如何?

美國“封鎖令”正式生效!一文讀懂:霍爾木茲最新形勢究竟如何?

財(cái)聯(lián)社
2026-04-14 10:11:07
巴薩消息:萊萬不大可能留隊(duì),簽巴斯托尼沒進(jìn)展,德容或缺席歐冠

巴薩消息:萊萬不大可能留隊(duì),簽巴斯托尼沒進(jìn)展,德容或缺席歐冠

足球觀察1
2026-04-14 13:42:05
王曉晨疑發(fā)文內(nèi)涵俞灝明,五年付出沒留體面,看不上為何還在一起

王曉晨疑發(fā)文內(nèi)涵俞灝明,五年付出沒留體面,看不上為何還在一起

悄悄史話
2026-04-14 13:46:39
2026-04-14 16:16:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時(shí)代
14964文章數(shù) 66769關(guān)注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

防范特朗普政府"對華軟化" 史上最嚴(yán)對華芯片法案來了

頭條要聞

防范特朗普政府"對華軟化" 史上最嚴(yán)對華芯片法案來了

體育要聞

他做對了所有事,卻被整個(gè)職業(yè)網(wǎng)壇放逐了八年

娛樂要聞

宋祖兒劉宇寧戀情大反轉(zhuǎn) 正主火速辟謠

財(cái)經(jīng)要聞

許家印受審當(dāng)庭表示認(rèn)罪悔罪

汽車要聞

長城歐拉5限定版純電版上市 限量99臺售價(jià)13.38萬元

態(tài)度原創(chuàng)

本地
數(shù)碼
親子
家居
軍事航空

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

數(shù)碼要聞

榮耀WIN游戲本首發(fā)東風(fēng)尾噴散熱引擎,WIN生態(tài)全面提速

親子要聞

后續(xù)!孕婦200買水果被老公罵:已去醫(yī)院終止妊娠,坦言及時(shí)止損

家居要聞

現(xiàn)代融合 自然靈動

軍事要聞

伊朗要求五個(gè)中東國家賠償戰(zhàn)爭損失

無障礙瀏覽 進(jìn)入關(guān)懷版