国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

給AI做微創(chuàng)手術(shù):哈工大博士發(fā)明新算法,5分鐘讓大模型減重近半

0
分享至

作為一名 AI 領(lǐng)域的博士生,徐玉莊的經(jīng)歷比較特殊。本科畢業(yè)于國(guó)防科技大學(xué),隨后在部隊(duì)工作了 5 年,接著在清華大學(xué)獲得碩士學(xué)位,目前在哈爾濱工業(yè)大學(xué)讀博。


圖 | 徐玉莊(來(lái)源:徐玉莊)

由其擔(dān)任第一作者的一篇論文于近日被 AAAI 2026 接收,在論文中他和所在團(tuán)隊(duì)打造出一種名為 CAMERA 的新技術(shù),該技術(shù)能在短短五分鐘,為一個(gè)擁有 570 億參數(shù)的巨型模型 Qwen2-57B-A14B 完成一次全面的冗余檢查,并在此基礎(chǔ)上進(jìn)行高效的修剪和壓縮,從而讓大模型在手機(jī)、平板等小型設(shè)備上的高效運(yùn)行距離普通人更進(jìn)一步。

徐玉莊告訴 DeepTech:“我們的方法能夠?qū)崿F(xiàn)精準(zhǔn)剪枝 20% 后模型效果幾乎無(wú)損。我甚至有一個(gè)或許還值得討論的提議就是,基礎(chǔ)模型訓(xùn)練團(tuán)隊(duì)可以用我們這個(gè)分析框架判斷自己的模型是不是充分訓(xùn)練了,如果沒(méi)有或許值得多訓(xùn)一些?!?/p>

思維大轉(zhuǎn)變:從修剪枝葉到修剪神經(jīng)元

此次成果要解決的問(wèn)題是:想象一下,你有一個(gè)由上百位不同領(lǐng)域的專(zhuān)家組成的超級(jí)智庫(kù),每當(dāng)你問(wèn)一個(gè)問(wèn)題,一個(gè)聰明的調(diào)度員就會(huì)根據(jù)問(wèn)題類(lèi)型,立刻叫出其中幾位最擅長(zhǎng)的專(zhuān)家來(lái)為你解答。這就是當(dāng)前的大模型內(nèi)部的一種名為混合專(zhuān)家模型的先進(jìn)工作方式,它讓 AI 擁有了處理海量知識(shí)和復(fù)雜任務(wù)的能力。

然而,這個(gè)超級(jí)智庫(kù)有一個(gè)幸福的煩惱:專(zhuān)家太多了。雖然每次只需要激活幾位,但是所有專(zhuān)家的知識(shí)儲(chǔ)備也就是模型參數(shù)都需要時(shí)刻準(zhǔn)備著,這會(huì)帶來(lái)驚人的計(jì)算消耗和存儲(chǔ)成本。

更關(guān)鍵的是,人們發(fā)現(xiàn)增加專(zhuān)家數(shù)量帶來(lái)的性能提升,遠(yuǎn)不如增加的成本那么明顯,這意味著智庫(kù)里存在大量的冗余或不那么關(guān)鍵的知識(shí)。

而徐玉莊等人就像是給這個(gè)巨型大腦做手術(shù)的神經(jīng)外科醫(yī)生,他們發(fā)現(xiàn)了一種更加精妙的手術(shù)方案,不僅能讓大模型大幅瘦身,還能保持甚至提高其智商。


(來(lái)源:資料圖)

在過(guò)去,人們?yōu)榱俗尰旌蠈?zhuān)家模型(MoE,Mixture of Experts)瘦身,主要采用兩種粗放式的方法:

第一種方法是專(zhuān)家級(jí)修剪,即直接砍掉整個(gè)專(zhuān)家,就好比由于某個(gè)專(zhuān)家的偶爾懶散,因此把他的整個(gè)團(tuán)隊(duì)解散了,但這難免會(huì)丟失重要知識(shí);

第二種方法是專(zhuān)家級(jí)合并,即把幾個(gè)看似相似的專(zhuān)家合并為一個(gè),這就像讓一位文學(xué)教授去教高等數(shù)學(xué),往往效果不佳。

這些方法之所以效果有限,是因?yàn)樗鼈円窗岩粋€(gè)專(zhuān)家當(dāng)做不可分割的整體來(lái)決定去留,要么僅局限于對(duì)單個(gè)參數(shù)矩陣進(jìn)行孤立地壓縮。但是,徐玉莊等人想到一個(gè)更加本質(zhì)的視角:為什么不看得更細(xì)一點(diǎn)呢?

基于此,他們提出了微專(zhuān)家這樣一個(gè)全新的概念。如果把每個(gè)專(zhuān)家看做一個(gè)功能部門(mén),那么微專(zhuān)家就是這個(gè)部門(mén)里最基礎(chǔ)的、一個(gè)個(gè)獨(dú)立負(fù)責(zé)具體任務(wù)的神經(jīng)元或工作小組。

關(guān)鍵在于,一個(gè)微專(zhuān)家是由跨三個(gè)矩陣的特定行列共同定義的,它們通過(guò)協(xié)同工作完成了一個(gè)最基礎(chǔ)的知識(shí)轉(zhuǎn)換動(dòng)作。

整個(gè) MoE 層的輸出,實(shí)際上是所有微專(zhuān)家工作成果的加權(quán)綜合。徐玉莊等人的核心發(fā)現(xiàn)是:在不同的任務(wù)場(chǎng)景下,這些微專(zhuān)家的貢獻(xiàn)天差地別。大部分輸出其實(shí)是由一小部分至關(guān)重要的微專(zhuān)家決定的,而很多微專(zhuān)家則貢獻(xiàn)甚微,存在大量的冗余和馬太效應(yīng)。

這就好比在解答如何做番茄炒蛋這一問(wèn)題時(shí),負(fù)責(zé)烹飪技巧和食材特性的微專(zhuān)家大放異彩,而負(fù)責(zé)量子物理的專(zhuān)家則幾乎在圍觀。

傳統(tǒng)的粗放修剪可能會(huì)誤傷重要的烹飪專(zhuān)家,或者把量子物理專(zhuān)家硬塞進(jìn)烹飪團(tuán)隊(duì)。而 CAMERA 的思路是:精準(zhǔn)定位每一個(gè)圍觀或者低效的微專(zhuān)家,然后以幾乎無(wú)傷害的方式剔除它。


(來(lái)源:資料圖)

CAMERA 算法:給每個(gè)微專(zhuān)家打分的智能秤

那么,如何從數(shù)以萬(wàn)計(jì)的微專(zhuān)家中,快速準(zhǔn)確地找出誰(shuí)重要、誰(shuí)冗余呢?這聽(tīng)起來(lái)像是一個(gè)超級(jí)復(fù)雜的組合優(yōu)化問(wèn)題,在數(shù)學(xué)上被證明是 NP 難題,即無(wú)法在短時(shí)間內(nèi)精確求解。

但是,徐玉莊等人的巧思在于:他們?cè)O(shè)計(jì)了一個(gè)極其巧妙的近似估計(jì)算法,為每個(gè)微專(zhuān)家定義了一個(gè)能量指標(biāo)。

這個(gè)能量由兩部分決定:

第一部分是激活系數(shù),它指的是當(dāng)模型處理不同問(wèn)題的時(shí)候,這個(gè)微專(zhuān)家被調(diào)用的頻繁程度和強(qiáng)度;第二部分是權(quán)重向量范數(shù),它指的是微專(zhuān)家自身知識(shí)儲(chǔ)備的規(guī)模大小。

一個(gè)微專(zhuān)家的能量越高,意味著它越經(jīng)常得到使用,而且自身承載的知識(shí)量越大,也就越重要。相反,能量極低的,就是可以?xún)?yōu)先考慮修剪的冗余部分。

CAMERA 算法利用一個(gè)很小的校準(zhǔn)數(shù)據(jù)集比如 128 段文本,就能在幾分鐘內(nèi)為模型所有層中的所有微專(zhuān)家計(jì)算出來(lái)能量并進(jìn)行排序。這就像使用一把智能秤,可以快速地稱(chēng)出來(lái)每個(gè)工作小組的貢獻(xiàn)度。

更令人贊嘆的是,他們從數(shù)學(xué)上證明了基于這種能量排序的修剪策略,其效果與理論上的最優(yōu)的壓縮方法之間的差距不僅很小而且是可控的,這為 CAMERA 的可靠性和有效性提供了堅(jiān)實(shí)的理論背書(shū)。


(來(lái)源:資料圖)

CAMERA-P:一把精準(zhǔn)的大模型手術(shù)刀

有了精準(zhǔn)的微專(zhuān)家能量排名,就可以開(kāi)始做手術(shù)了,這就是 Camera-P,P 指的是 Pruning,也就是修剪的意思。

Camera-P 的目標(biāo)是:按照設(shè)定的比例比如 20% 或者 40%,移除能量最低的那部分微專(zhuān)家。具體操作非常的結(jié)構(gòu)化,對(duì)于一個(gè)被選中的冗余微專(zhuān)家,Camera-P 會(huì)將其對(duì)應(yīng)的三個(gè)矩陣中的特定行或特定列同時(shí)置零或直接剪除。

這樣做的好處是顯而易見(jiàn)的:

首先,可以保持功能完整,避免了過(guò)去單獨(dú)修剪某個(gè)矩陣可能造成的功能失調(diào);其次,可以真正實(shí)現(xiàn)加速推理,被置零的權(quán)重在計(jì)算時(shí)會(huì)被跳過(guò),這直接可以減少計(jì)算量,提高模型的運(yùn)行速度;再次,無(wú)需進(jìn)行重新訓(xùn)練,整個(gè)過(guò)程是訓(xùn)練后的,無(wú)需使用大量數(shù)據(jù)來(lái)重新訓(xùn)練模型。

實(shí)驗(yàn)結(jié)果表明:Camera-P 在多個(gè)主流 MoE 模型上比如 DeepSeek-MoE-16B、Qwen2-57B 上,從 20% 到 60% 的不同修剪比例下,在語(yǔ)言理解、常識(shí)推理、數(shù)學(xué)問(wèn)題等 9 項(xiàng)任務(wù)上的表現(xiàn),都超越了之前最好的方法。尤其在高達(dá) 60% 的激進(jìn)修剪下,模型性能下降遠(yuǎn)遠(yuǎn)小于其他方法,展現(xiàn)了驚人的魯棒性。


(來(lái)源:資料圖)

CAMERA-Q:給重要知識(shí)進(jìn)行高保真,給次要知識(shí)省空間

除了直接修剪,另一種常見(jiàn)的模型壓縮技術(shù)是量化,即降低存儲(chǔ)每個(gè)權(quán)重?cái)?shù)值所需的比特位數(shù),比如從 16 比特降低到 4 比特,這就像把高清無(wú)損音樂(lè)轉(zhuǎn)換成 MP3,在盡量保持聽(tīng)感的同時(shí)大幅減少文件體積。

現(xiàn)有的 MoE 量化方法主要是在專(zhuān)家級(jí)別分配不同的精度也就是比特?cái)?shù),比如給活躍的專(zhuān)家高精度,給不活躍的專(zhuān)家低精度。但是,徐玉莊等人認(rèn)為這仍然不夠精細(xì),每個(gè)專(zhuān)家內(nèi)部也有重要的微專(zhuān)家和次要的微專(zhuān)家。

于是,他們提出了 CAMERA-Q,Q 指的是 Quantization,就是量化的意思。它利用 CAMERA 得到全局微專(zhuān)家的能量排名,然后在每個(gè)專(zhuān)家內(nèi)部進(jìn)行混合精度分配。

具體來(lái)說(shuō):能量排名最高的那一小部分微專(zhuān)家,分配較高的比特位,精心保留其知識(shí)細(xì)節(jié);能量中等的那一小部分微專(zhuān)家,分配標(biāo)準(zhǔn)的比特位比如 2 比特;能量最低的那一小部分微專(zhuān)家,分配較低的比特位比如 1 比特,從而可以大大節(jié)省空間。

這種方法的精妙之處在于,它確保了每個(gè)微專(zhuān)家內(nèi)部三個(gè)矩陣的精度是一致的,避免了好比“一條腿穿皮鞋,一條腿穿草鞋”的尷尬,維護(hù)了基本功能單元的完整性。

實(shí)驗(yàn)證明,這種微專(zhuān)家感知的量化策略,在激進(jìn)的 2 比特平均精度下,效果顯著優(yōu)于傳統(tǒng)的專(zhuān)家級(jí)量化方法。

CAMERA 技術(shù)的意義遠(yuǎn)不止于學(xué)術(shù)論文中的漂亮數(shù)據(jù)。它為解決大模型落地應(yīng)用的核心瓶頸——計(jì)算成本與存儲(chǔ)開(kāi)銷(xiāo)提供了一套高效、實(shí)用的解決方案。


(來(lái)源:資料圖)

徐玉莊表示:“在路線上,我們首次把大模型的壓縮單元從一個(gè)權(quán)重矩陣內(nèi)部擴(kuò)展到了跨越多個(gè)權(quán)重矩陣的情形,首次把微專(zhuān)家這個(gè)功能完備的微結(jié)構(gòu)作為剪枝或混合精度配置對(duì)象?!?/p>

在方法論上,這一研究也首次在數(shù)學(xué)上給出混合微專(zhuān)家的簡(jiǎn)潔表示形式,首次描述微專(zhuān)家壓縮這一最優(yōu)化問(wèn)題并給出一個(gè)還算簡(jiǎn)單有效的解決方案。

未來(lái),人們或許能在手機(jī)、平板電腦甚至智能手表上,運(yùn)行如今需要龐大算力支撐的尖端 AI 模型。CAMERA 技術(shù)能讓這些模型在保持高性能的同時(shí),體積更小、耗電更少、響應(yīng)更快。

對(duì)于提供 AI 服務(wù)的公司來(lái)說(shuō),模型壓縮意味著可以用更少的服務(wù)器資源來(lái)服務(wù)更多的用戶(hù),從而可以降低運(yùn)營(yíng)成本,最終可能讓 AI 服務(wù)的價(jià)格得到降低。

在生物、醫(yī)藥、材料等需要復(fù)雜 AI 模擬的科研領(lǐng)域,研究者們往往受限于計(jì)算資源,而更加輕量級(jí)的強(qiáng)大模型,能讓更多科研機(jī)構(gòu)參與前沿探索。

CAMERA 尤其是 CAMERA-P 還可以和其他模型壓縮技術(shù)進(jìn)行無(wú)縫結(jié)合,從而實(shí)現(xiàn)組合拳般的效果,進(jìn)而達(dá)到更高的壓縮率。

如前所述,徐玉莊目前在哈爾濱工業(yè)大學(xué)讀博。此外,他也在以端側(cè)大模型業(yè)務(wù)見(jiàn)長(zhǎng)的面壁智能擔(dān)任實(shí)習(xí)算法研究員。未來(lái),他將繼續(xù)深耕大模型領(lǐng)域。

參考資料:

相關(guān)論文 https://arxiv.org/pdf/2508.02322

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
慘敗東部魚(yú)腩,當(dāng)家球星受傷倒下!西部徹底亂套,MVP懸念來(lái)了

慘敗東部魚(yú)腩,當(dāng)家球星受傷倒下!西部徹底亂套,MVP懸念來(lái)了

毒舌NBA
2026-01-05 09:01:15
“幫領(lǐng)導(dǎo)買(mǎi)東西,領(lǐng)導(dǎo)問(wèn):“多少錢(qián)?我轉(zhuǎn)給你”,千萬(wàn)別說(shuō)“沒(méi)多少錢(qián),不用了”,聰明人這樣回復(fù)!

“幫領(lǐng)導(dǎo)買(mǎi)東西,領(lǐng)導(dǎo)問(wèn):“多少錢(qián)?我轉(zhuǎn)給你”,千萬(wàn)別說(shuō)“沒(méi)多少錢(qián),不用了”,聰明人這樣回復(fù)!

上海約飯局
2026-01-04 20:41:57
萬(wàn)科2000名跟投員工討要跟投資金

萬(wàn)科2000名跟投員工討要跟投資金

地產(chǎn)微資訊
2026-01-04 11:43:17
“老虎”哈桑被詐騙!流亡的阿薩德家族,揮金如土卻被嚴(yán)密控制

“老虎”哈桑被詐騙!流亡的阿薩德家族,揮金如土卻被嚴(yán)密控制

鷹眼Defence
2026-01-02 16:33:51
為何鄭智剛出任青島西海岸新帥,段劉愚就要離隊(duì),直接回魯能?

為何鄭智剛出任青島西海岸新帥,段劉愚就要離隊(duì),直接回魯能?

振剛說(shuō)足球
2026-01-05 09:39:32
女子對(duì)年薪四五十萬(wàn)老公不滿(mǎn),全網(wǎng)勸離,甚至更有網(wǎng)友想取而代之

女子對(duì)年薪四五十萬(wàn)老公不滿(mǎn),全網(wǎng)勸離,甚至更有網(wǎng)友想取而代之

周哥一影視
2026-01-04 11:47:16
“張雨綺”終于找對(duì)風(fēng)格,穿短羽絨服+襯衫+喇叭褲,顯瘦又時(shí)髦

“張雨綺”終于找對(duì)風(fēng)格,穿短羽絨服+襯衫+喇叭褲,顯瘦又時(shí)髦

蓓小西
2026-01-05 09:32:30
中共中央批準(zhǔn),開(kāi)除馮志斌黨籍

中共中央批準(zhǔn),開(kāi)除馮志斌黨籍

新京報(bào)
2026-01-04 16:32:01
辣眼睛!艾格努從隊(duì)友背后,做出不雅動(dòng)作,曾有同性戀史

辣眼睛!艾格努從隊(duì)友背后,做出不雅動(dòng)作,曾有同性戀史

跑者排球視角
2026-01-05 06:38:05
保利內(nèi)部文件流出?區(qū)域總大規(guī)模輪換,下一波調(diào)整輪到誰(shuí)?

保利內(nèi)部文件流出?區(qū)域總大規(guī)模輪換,下一波調(diào)整輪到誰(shuí)?

地產(chǎn)一品塘
2026-01-05 08:00:11
長(zhǎng)城汽車(chē):全年銷(xiāo)量124020輛,僅完成目標(biāo)銷(xiāo)量33.09%!

長(zhǎng)城汽車(chē):全年銷(xiāo)量124020輛,僅完成目標(biāo)銷(xiāo)量33.09%!

車(chē)秀小咖
2026-01-04 14:44:43
崔鳳祥捐國(guó)博佛像20年失蹤,全網(wǎng)都在追問(wèn)誰(shuí)掉包了?后續(xù)來(lái)了!

崔鳳祥捐國(guó)博佛像20年失蹤,全網(wǎng)都在追問(wèn)誰(shuí)掉包了?后續(xù)來(lái)了!

眼光很亮
2026-01-02 17:00:07
價(jià)值觀不一致!德約科維奇宣布:徹底退出職業(yè)網(wǎng)球運(yùn)動(dòng)員協(xié)會(huì)

價(jià)值觀不一致!德約科維奇宣布:徹底退出職業(yè)網(wǎng)球運(yùn)動(dòng)員協(xié)會(huì)

全景體育V
2026-01-05 06:45:39
淄博花季女孩丁心萍去世,僅18歲,尖子班的學(xué)生,因手腳發(fā)黃確診

淄博花季女孩丁心萍去世,僅18歲,尖子班的學(xué)生,因手腳發(fā)黃確診

鋭娛之樂(lè)
2026-01-04 15:14:12
國(guó)安隊(duì)鋒線提前完成一筆續(xù)約!上賽季斬獲中超聯(lián)賽金靴,值得期待

國(guó)安隊(duì)鋒線提前完成一筆續(xù)約!上賽季斬獲中超聯(lián)賽金靴,值得期待

振剛說(shuō)足球
2026-01-05 09:22:50
秘魯:隨著馬杜羅的垮臺(tái),逃亡在外的委內(nèi)瑞拉人將很快重返家園

秘魯:隨著馬杜羅的垮臺(tái),逃亡在外的委內(nèi)瑞拉人將很快重返家園

一種觀點(diǎn)
2026-01-04 08:26:36
7萬(wàn)人鼓掌!皇馬21歲小將封神戰(zhàn):完美戴帽 佛爺親自祝賀

7萬(wàn)人鼓掌!皇馬21歲小將封神戰(zhàn):完美戴帽 佛爺親自祝賀

葉青足球世界
2026-01-05 08:42:50
畫(huà)火了一個(gè)村子,卻畫(huà)不好村民貪婪的內(nèi)心,吳營(yíng)村惡心一幕出現(xiàn)了

畫(huà)火了一個(gè)村子,卻畫(huà)不好村民貪婪的內(nèi)心,吳營(yíng)村惡心一幕出現(xiàn)了

李博世財(cái)經(jīng)
2026-01-04 17:03:04
美國(guó)智庫(kù)警告:中美一旦臺(tái)海開(kāi)戰(zhàn),美國(guó)將有92%的幾率打敗解放軍

美國(guó)智庫(kù)警告:中美一旦臺(tái)海開(kāi)戰(zhàn),美國(guó)將有92%的幾率打敗解放軍

林子說(shuō)事
2026-01-03 09:14:01
方案好像不太行!美媒:湖人管理層正試圖以3換1的方式得到狄龍

方案好像不太行!美媒:湖人管理層正試圖以3換1的方式得到狄龍

移動(dòng)擋拆
2026-01-05 05:38:53
2026-01-05 10:20:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16081文章數(shù) 514448關(guān)注度
往期回顧 全部

科技要聞

雷軍新年首播:確認(rèn)汽車(chē)業(yè)務(wù)降速

頭條要聞

牛彈琴:美國(guó)露出獠牙 現(xiàn)在有三個(gè)國(guó)家感到最危險(xiǎn)

頭條要聞

牛彈琴:美國(guó)露出獠牙 現(xiàn)在有三個(gè)國(guó)家感到最危險(xiǎn)

體育要聞

女子世界第一,9年前在咖啡店洗碗

娛樂(lè)要聞

《小城大事》上星央八 熱血筑夢(mèng)正當(dāng)時(shí)

財(cái)經(jīng)要聞

李迅雷:擴(kuò)內(nèi)需要把重心從"投"轉(zhuǎn)向"消"

汽車(chē)要聞

最高續(xù)航310km 嵐圖泰山8或?qū)⑸习肽臧l(fā)布

態(tài)度原創(chuàng)

家居
時(shí)尚
親子
公開(kāi)課
軍事航空

家居要聞

黑白碰撞 個(gè)性多元冷冽風(fēng)

今年冬天最流行的4雙鞋,配闊腿褲時(shí)髦又高級(jí)!

親子要聞

向太慈母多敗兒?原生家庭會(huì)帶來(lái)多大傷害?

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

馬杜羅預(yù)計(jì)5日在紐約"首次出庭"

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版