国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

突破長(zhǎng)序列與低耗部署核心瓶頸!中國(guó)科學(xué)院發(fā)布類腦大模型瞬悉2.0

0
分享至


新智元報(bào)道

編輯:LRST

【新智元導(dǎo)讀】中國(guó)科學(xué)院團(tuán)隊(duì)推出類腦大模型「瞬悉2.0」,通過優(yōu)化架構(gòu)與編碼路徑,顯著提升了長(zhǎng)序列處理效率與低功耗部署能力。該模型在保持高性能的同時(shí),大幅降低訓(xùn)練與推理成本,為人工智能輕量化與多模態(tài)應(yīng)用開辟新方向。

隨著大模型上下文長(zhǎng)度的快速擴(kuò)展,代碼倉(cāng)庫(kù)理解、智能體以及多模態(tài)交互等場(chǎng)景對(duì)模型的長(zhǎng)序列處理能力提出了更高要求。

傳統(tǒng)Transformer在推理時(shí)的計(jì)算開銷和顯存占用隨序列長(zhǎng)度不斷增長(zhǎng),嚴(yán)重制約其實(shí)際部署。

近日,中國(guó)科學(xué)院自動(dòng)化研究所李國(guó)齊、徐波團(tuán)隊(duì)在類腦脈沖大模型「瞬悉1.0」研究基礎(chǔ)上,針對(duì)當(dāng)前大模型長(zhǎng)序列處理與低功耗部署等核心瓶頸,推出SpikingBrain2.0-5B(簡(jiǎn)稱SpB2.0-5B)模型系列。

該系列模型與瞬悉1.0均以類腦機(jī)制為核心,在模型架構(gòu)、訓(xùn)練算法和應(yīng)用廣度上實(shí)現(xiàn)全面升級(jí)。研究團(tuán)隊(duì)已經(jīng)開源了瞬悉2.0-5B語言模型與瞬悉2.0-VL-5B視覺語言模型。


論文鏈接:https://arxiv.org/abs/2604.22575

代碼鏈接:https://github.com/BICLab/SpikingBrain2.0

此次發(fā)布的瞬悉2.0以超過瞬悉1.0十倍的訓(xùn)練開銷節(jié)省,續(xù)訓(xùn)數(shù)據(jù)量從瞬悉1.0的150B降低至瞬悉1.0的14B

即僅需32張A100顯卡,9天內(nèi)即可完成對(duì)當(dāng)前主流Transformer架構(gòu)大模型(如Qwen3系列模型)的持續(xù)預(yù)訓(xùn)練,通用知識(shí)(如MMLU、ARC-C、BBH等任務(wù))以及SFT后推理能力(如數(shù)學(xué)推理GSM8K、MATH,代碼HumanEval、MBPP等任務(wù))的表現(xiàn)可與強(qiáng)基線Qwen3比肩且實(shí)現(xiàn)比瞬悉1.0更優(yōu)綜合性能;

并在4M序列長(zhǎng)度下達(dá)到主流Transformer模型Qwen3的10.13倍首Token生成加速,F(xiàn)P8量化路徑下4M長(zhǎng)度下相比Qwen3 BF16基線提速達(dá)15.13倍,整數(shù)-脈沖化編碼路徑下,精度損失僅為0.69%,且脈沖稀疏度高達(dá)64.3%

模擬結(jié)果顯示,該方案在測(cè)試場(chǎng)景下相比INT8矩陣乘法基線,有望使得面向類腦大模型的神經(jīng)形態(tài)芯片面積減小70.6%,在250/500MHz工作頻率下功耗降低48.1%/46.5%。

瞬悉2.0在長(zhǎng)序列處理效率、訓(xùn)練開銷、綜合Benchmark性能、跨硬件平臺(tái)適配性及應(yīng)用場(chǎng)景拓展等方面顯著提升,為輕量級(jí)、多模態(tài)高效脈沖基礎(chǔ)模型的研發(fā)提供了可行路徑,為新一代人工智能創(chuàng)新發(fā)展注入新動(dòng)力。

研究背景

當(dāng)前,大模型發(fā)展正從「參數(shù)和數(shù)據(jù)規(guī)模驅(qū)動(dòng)」逐步延展至「上下文能力驅(qū)動(dòng)」。

在智能體、代碼理解、長(zhǎng)文檔分析等應(yīng)用中,模型需要處理數(shù)十萬甚至百萬級(jí)token。

但傳統(tǒng)Transformer在長(zhǎng)序列處理及資源受限場(chǎng)景下的部署仍面臨諸多痛點(diǎn)。因此,如何以極低成本構(gòu)建基礎(chǔ)模型,打破Transformer在不同序列長(zhǎng)度、不同硬件平臺(tái)下的能耗瓶頸,成為大模型領(lǐng)域的關(guān)鍵探索方向。

針對(duì)該問題,團(tuán)隊(duì)此前發(fā)布的瞬悉1.0已率先嘗試將類腦機(jī)制與高效大模型相結(jié)合,為低耗大模型研發(fā)提供了初步探索。此次發(fā)布的瞬悉2.0通過引入更豐富的類腦機(jī)制——包括稀疏化記憶建模、更精細(xì)化的脈沖激活值編碼等,在瞬悉1.0的基礎(chǔ)上實(shí)現(xiàn)全方位升級(jí)。

架構(gòu)設(shè)計(jì)

短序列場(chǎng)景中,Transformer的計(jì)算瓶頸源于大量前饋矩陣乘法;長(zhǎng)序列場(chǎng)景中,計(jì)算瓶頸則向注意力模塊轉(zhuǎn)移,導(dǎo)致推理效率大幅下降。瞬悉2.0因此對(duì)注意力和前饋矩陣乘操作分別做出針對(duì)性設(shè)計(jì),期望緩解Transformer的能耗問題。

(1)雙空間混合稀疏注意力

瞬悉2.0提出雙空間稀疏注意力(Dual-Space Sparse Attention, DSSA),用于在層間混合稀疏Softmax注意力MoBA與稀疏線性注意力Sparse State Expansion (SSE)。其中,MoBA對(duì)完整的KV cache進(jìn)行塊級(jí)稀疏計(jì)算,SSE則對(duì)壓縮式狀態(tài)表征進(jìn)行稀疏計(jì)算。這一設(shè)計(jì)對(duì)應(yīng)類腦化的稀疏記憶機(jī)制,實(shí)現(xiàn)了優(yōu)良的長(zhǎng)序列性能-效率權(quán)衡。


瞬悉2.0架構(gòu)概覽

(2)雙路徑激活值編碼策略

瞬悉2.0采用了包括FP8和INT8-Spiking兩種對(duì)偶激活值編碼路徑:

  1. FP8編碼路徑:利用低比特Tensor Core加速矩陣乘運(yùn)算,該路徑面向工業(yè)GPU部署(如NVIDIA Hopper GPU);

  2. INT8-Spiking編碼路徑:把激活值轉(zhuǎn)為脈沖序列,可將密集矩陣乘法替換為事件驅(qū)動(dòng)的整數(shù)累加,大幅降低部署功耗,該路徑面向異步神經(jīng)形態(tài)芯片部署。


瞬悉2.0對(duì)偶編碼路徑

轉(zhuǎn)換訓(xùn)練流程

瞬悉2.0采用比瞬悉1.0更高效、模態(tài)更廣的架構(gòu)轉(zhuǎn)換流程(Transformer-to-Hybrid Conversion),依托極少量開源數(shù)據(jù)和計(jì)算資源,分別為語言模型與多模態(tài)模型構(gòu)建兩條獨(dú)立的續(xù)訓(xùn)轉(zhuǎn)換路徑,大幅降低開發(fā)成本。

(1)LLM轉(zhuǎn)換路徑:包括短上下文蒸餾、三階段長(zhǎng)上下文擴(kuò)展(最高至512k)以及兩階段的通用加推理SFT,同時(shí)開展了在策略蒸餾探索。

(2)VLM轉(zhuǎn)換路徑:包括知識(shí)蒸餾與指令微調(diào)。本文還同時(shí)分享了實(shí)踐過程中的關(guān)鍵Takeaways,為社區(qū)研究提供參考。


瞬悉2.0轉(zhuǎn)換訓(xùn)練Pipeline

模型性能

1. 長(zhǎng)序列處理效率顯著提升

(1)在Huggingface序列并行框架下,瞬悉2.0在4M長(zhǎng)度相比Qwen3實(shí)現(xiàn)10.13倍的首token生成時(shí)延(TTFT)加速(2)在vLLM張量并行框架下,512k長(zhǎng)度端到端生成延遲降低4.3倍,128k長(zhǎng)度下總吞吐提升1.57倍、請(qǐng)求并發(fā)數(shù)提升3.17倍;

(3)依托vLLM框架,8卡A100即可支持長(zhǎng)達(dá)10M序列的推理,而Qwen3基線在4M長(zhǎng)度時(shí)已超出顯存限制,展現(xiàn)出突出的長(zhǎng)序列處理優(yōu)勢(shì)。



2. 訓(xùn)練成本大幅降低

瞬悉2.0-5B語言與多模態(tài)模型的總轉(zhuǎn)換開銷低至7k A100卡時(shí)以下,僅需32張A100,9天內(nèi)即可完成對(duì)Qwen3-4B和Qwen3-VL-4B的全部轉(zhuǎn)換訓(xùn)練,相較于SpB1.0,訓(xùn)練成本減少10倍以上(LLM CPT數(shù)據(jù)量從150B降至14B),實(shí)現(xiàn)了高效低成本的模型開發(fā)。

3. 模型性能保持競(jìng)爭(zhēng)力

(1)瞬悉2.0語言模型在通用知識(shí)(如MMLU、ARC-C、BBH等任務(wù))以及SFT后推理能力(如數(shù)學(xué)推理GSM8K、MATH,代碼HumanEval、MBPP等任務(wù))的表現(xiàn)可與強(qiáng)基線Qwen3比肩且實(shí)現(xiàn)比瞬悉1.0更優(yōu)綜合性能。

(2)瞬悉2.0-VL模型性能實(shí)現(xiàn)對(duì)Qwen3-VL的有效恢復(fù),可與強(qiáng)基線Qwen2.5-VL比肩(如圖表推理AI2D、通用視覺推理MMStar等任務(wù)),在瞬悉1.0的基礎(chǔ)上實(shí)現(xiàn)了多模態(tài)能力的突破。



4. 跨硬件平臺(tái)適配性突出

瞬悉2.0可靈活適配不同硬件平臺(tái):

(1)采用FP8路徑時(shí),精度損失僅為0.24%;在H100上實(shí)測(cè)顯示,256k序列長(zhǎng)度下TTFT提速相比瞬悉2.0 BF16版本超2.5倍,同時(shí)在4M長(zhǎng)度下相比Qwen3 BF16基線提速達(dá)15.13倍;

(2)采用INT8-Spiking路徑時(shí),精度損失僅為0.69%,且脈沖稀疏度高達(dá)64.3%;后仿模擬結(jié)果顯示,該方案在測(cè)試場(chǎng)景下相比INT8矩陣乘法基線,面積減小70.6%,在250/500MHz工作頻率下,功耗降低48.1%/46.5%,有望破解端側(cè)部署的功耗瓶頸。



瞬悉2.0系列模型的發(fā)布,為輕量級(jí)、多模態(tài)高效脈沖基礎(chǔ)模型的研發(fā)提供了可行路徑,進(jìn)一步驗(yàn)證了類腦機(jī)制與高效模型架構(gòu)結(jié)合的廣闊前景。

同時(shí),該模型為端側(cè)、資源受限場(chǎng)景的大模型部署提供了高性價(jià)比解決方案,也為低功耗神經(jīng)形態(tài)計(jì)算的后續(xù)研發(fā)提供重要參考。研究團(tuán)隊(duì)將繼續(xù)秉承類腦大模型技術(shù)「概念一致、迭代升級(jí)」的理念,持續(xù)研發(fā)可比肩主流大模型的低功耗神經(jīng)形態(tài)計(jì)算。

參考資料:

https://arxiv.org/abs/2604.22575

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“不去后悔,去了更后悔!”五一最堵6大景區(qū)曝光,堵到一動(dòng)不動(dòng)

“不去后悔,去了更后悔!”五一最堵6大景區(qū)曝光,堵到一動(dòng)不動(dòng)

阿傖說事
2026-05-02 12:28:11
一把好牌打得稀爛,直到張軍被調(diào)查,才懂劉國(guó)梁當(dāng)初選擇有多明智

一把好牌打得稀爛,直到張軍被調(diào)查,才懂劉國(guó)梁當(dāng)初選擇有多明智

笑飲孤鴻非
2026-05-02 05:45:34
傅作義親手放走5個(gè)蔣介石嫡系將領(lǐng),幾十年后才知他保全的是什么

傅作義親手放走5個(gè)蔣介石嫡系將領(lǐng),幾十年后才知他保全的是什么

睡前講故事
2025-12-09 13:06:03
18億!凌晨!無國(guó)足!國(guó)際足聯(lián)憑什么對(duì)中國(guó)球迷獅子大開口?

18億!凌晨!無國(guó)足!國(guó)際足聯(lián)憑什么對(duì)中國(guó)球迷獅子大開口?

曹老師評(píng)球
2026-05-01 14:08:15
尷尬!朱之文被吐槽“賺錢沒尊嚴(yán)”,青島參加商演任由人擠來擠去

尷尬!朱之文被吐槽“賺錢沒尊嚴(yán)”,青島參加商演任由人擠來擠去

火山詩(shī)話
2026-05-02 15:49:40
伊朗的“胡椒面”戰(zhàn)略:一場(chǎng)自我陶醉的戰(zhàn)略災(zāi)難

伊朗的“胡椒面”戰(zhàn)略:一場(chǎng)自我陶醉的戰(zhàn)略災(zāi)難

民間胡扯老哥
2026-04-27 04:39:10
西班牙要求以色列立即釋放本國(guó)公民

西班牙要求以色列立即釋放本國(guó)公民

環(huán)球網(wǎng)資訊
2026-05-02 06:33:20
爆冷!史上最擁擠“五一檔”:多部影片提前撤檔,首日票房1.6億元?jiǎng)?chuàng)近四年新低,十余部新片難救市

爆冷!史上最擁擠“五一檔”:多部影片提前撤檔,首日票房1.6億元?jiǎng)?chuàng)近四年新低,十余部新片難救市

每日經(jīng)濟(jì)新聞
2026-05-02 12:30:05
上映多時(shí)票房只有零元,一個(gè)觀眾都沒有,五一檔最慘電影誕生了

上映多時(shí)票房只有零元,一個(gè)觀眾都沒有,五一檔最慘電影誕生了

影視高原說
2026-05-01 08:47:30
周總理的鋼筆楷書到底有多驚艷?成年人練字還有機(jī)會(huì)嗎?

周總理的鋼筆楷書到底有多驚艷?成年人練字還有機(jī)會(huì)嗎?

書畫相約
2026-05-02 10:45:07
749局退休高人自述:秦嶺巨蟒渡劫事件,當(dāng)時(shí)的情況令人心驚

749局退休高人自述:秦嶺巨蟒渡劫事件,當(dāng)時(shí)的情況令人心驚

千秋文化
2026-04-10 20:05:07
80后家長(zhǎng)發(fā)明“防早戀”發(fā)型,女兒面如死灰,網(wǎng)友都看不下去了

80后家長(zhǎng)發(fā)明“防早戀”發(fā)型,女兒面如死灰,網(wǎng)友都看不下去了

妍妍教育日記
2026-04-27 09:20:13
誰去誰后悔!五一最堵五大景點(diǎn),第1名擠到崩潰,第5名直接勸退

誰去誰后悔!五一最堵五大景點(diǎn),第1名擠到崩潰,第5名直接勸退

奇思妙想草葉君
2026-05-01 19:44:53
港獨(dú)、罵中國(guó)人,如今卻還想來內(nèi)地?fù)平穑@3位香港明星令人作嘔

港獨(dú)、罵中國(guó)人,如今卻還想來內(nèi)地?fù)平?,這3位香港明星令人作嘔

傲傲講歷史
2026-04-19 01:20:08
陳曉旭的這張照片,真的是護(hù)手霜宣傳圖嗎

陳曉旭的這張照片,真的是護(hù)手霜宣傳圖嗎

我來我看見
2026-05-02 00:38:35
田亮兒子脖子粗到和頭一樣,網(wǎng)友集體急勸:快帶娃去醫(yī)院

田亮兒子脖子粗到和頭一樣,網(wǎng)友集體急勸:快帶娃去醫(yī)院

一盅情懷
2026-05-01 15:56:23
視頻丨美防長(zhǎng)接受國(guó)會(huì)質(zhì)詢 遭抗議者連番質(zhì)問

視頻丨美防長(zhǎng)接受國(guó)會(huì)質(zhì)詢 遭抗議者連番質(zhì)問

國(guó)際在線
2026-05-02 06:40:44
英超提前保級(jí)?利茲聯(lián)3-1后領(lǐng)先熱刺9分,倫敦2強(qiáng)和森林降級(jí)3選1

英超提前保級(jí)?利茲聯(lián)3-1后領(lǐng)先熱刺9分,倫敦2強(qiáng)和森林降級(jí)3選1

體育知多少
2026-05-02 06:59:51
哈登G6又輸球,4大數(shù)據(jù)證明這次真不怪他!公開回應(yīng)“搶七魔咒”

哈登G6又輸球,4大數(shù)據(jù)證明這次真不怪他!公開回應(yīng)“搶七魔咒”

鍋?zhàn)踊@球
2026-05-02 15:19:50
拜仁再見!6000萬“頂薪先生”正式同意轉(zhuǎn)會(huì)!1.45億“妖星”來投

拜仁再見!6000萬“頂薪先生”正式同意轉(zhuǎn)會(huì)!1.45億“妖星”來投

頭狼追球
2026-05-02 11:39:23
2026-05-02 16:40:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
15115文章數(shù) 66829關(guān)注度
往期回顧 全部

科技要聞

AI熱潮耗盡庫(kù)存,Mac Mini起售調(diào)高200美元

頭條要聞

單親媽媽被無辜羈押821天申請(qǐng)國(guó)賠被叫停 最新消息來了

頭條要聞

單親媽媽被無辜羈押821天申請(qǐng)國(guó)賠被叫停 最新消息來了

體育要聞

休賽期總冠軍,輪到休斯頓火箭

娛樂要聞

白百何罕曬大兒子 18歲元寶越來越帥

財(cái)經(jīng)要聞

雷軍很努力 小米還是跌破了30港元大關(guān)

汽車要聞

新紀(jì)錄!零跑汽車4月交付達(dá)71387臺(tái)

態(tài)度原創(chuàng)

教育
手機(jī)
時(shí)尚
本地
軍事航空

教育要聞

全市首個(gè)!這個(gè)區(qū)率先取消幼升小“六年一學(xué)位”

手機(jī)要聞

俞浩再放狠話:追覓手機(jī)要與蘋果、三星三分天下

流汗不流“湯”!五一假期底妝指南請(qǐng)收好~

本地新聞

用青花瓷的方式,打開西溪濕地

軍事要聞

特朗普:對(duì)伊戰(zhàn)事結(jié)束 無限期延長(zhǎng)停火

無障礙瀏覽 進(jìn)入關(guān)懷版