国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

北大團隊改造DeepSeek注意力,速度快四倍還不丟精度

0
分享至

聽雨 發(fā)自 凹非寺量子位 | 公眾號 QbitAI

就在大家都急頭白臉地等待DeepSeek-V4的時候,冷不丁一篇新論文引起了網(wǎng)友們的注意——

提出新稀疏注意力機制HISA(分層索引稀疏注意力),突破64K上下文的索引瓶頸,相比DeepSeek正在用的DSA(DeepSeek Sparse Attention)提速2-4倍。



不僅做到了大幅提速,而且?guī)缀醪粊G精度、即插即用不用重新訓練



論文直接在DeepSeek-V3.2和GLM-5上替換索引器,無需微調(diào)。

并且在找關鍵信息、長文本理解等任務上,精度都和原方法幾乎持平。



兩步消除上下文索引瓶頸

這篇論文想解決的問題很明確:給大模型的稀疏注意力機制換個更高效的 “檢索器”。

現(xiàn)有主流的DSA等token級稀疏注意力,核心就是通過只計算關鍵token的注意力,降低了核心計算成本。

但這個設計有個致命隱藏問題:要挑出相關字符,得靠一個 “索引器”——它需要把每個待查字符,和前面所有字符挨個打分,再選分數(shù)最高的。

文本長度L越長,這個打分的工作量是L的平方級增長。比如長度翻倍,工作量就會翻4倍。

到超長文本時,這個索引器的平方級成本,反而成了拖慢速度的元兇,甚至反而比真正的注意力計算還耗時。

基于此,研究團隊開始思考一個問題:能否在不改變最終稀疏注意力結(jié)果的前提下,降低索引器的搜索成本?

于是,他們提出了HISA(分層索引稀疏注意力),核心思路也很簡單:

既然挨個打分太費時間,那就先按塊篩掉大部分無關內(nèi)容,再在剩下的小塊里精細選。



在功能邏輯上實現(xiàn)對原有模塊的等價替換,無需修改后續(xù)注意力計算邏輯,相當于 “換了個更高效的篩子,篩出來的東西幾乎沒變”。

具體就兩步,全程復用原模型的打分規(guī)則,零學習成本:

塊級粗過濾

  • 把長文本切成固定大小的 “字符塊”(比如128個字符一塊),給每個塊算一個 “整體特征向量”(相當于給每塊貼個總標簽)
  • 用原索引器的打分方式,只給這些塊標簽打分
  • 挑出分數(shù)最高的m個塊(比如64個),直接扔掉剩下的所有塊——塊的數(shù)量遠少于字符數(shù)。

這一步能省掉絕大部分工作量。

塊內(nèi)精挑字符

只在第一步選出來的m個塊里,用原索引器的規(guī)則給單個字符打分,再挑出最終需要的k個相關字符。

還加了個小優(yōu)化:文本的第一個塊和最后一個塊必選,保證開頭的背景信息、結(jié)尾的最新上下文不被誤篩,也能處理文本拼接的邊界問題。



HISA的關鍵優(yōu)勢在于:復雜度驟降,還能 “無縫替換”

HISA把原索引器每一層 O (L2) 的算力成本,降到了O(L2/B + L×m×B)(B 是塊大小、m 是選的塊數(shù))

文本越長、塊選得越精準,提速效果越明顯。

更重要的是它的工程友好性

輸出和原索引器完全一致,下游的注意力計算模塊不用改;

不用重新訓練模型、不用調(diào)整KV緩存結(jié)構(gòu),直接替換原索引器就行;

短文本時會自動 “退化” 成原方法,只有超長文本時才觸發(fā)分層篩選,全程自適應。

實測提速超猛,精度幾乎沒丟

論文在DeepSeek-V3.2、GLM-5兩大主流大模型上做了全面測試,結(jié)果很亮眼:

速度上,在64K長度的文本下,HISA 比原DSA索引器最高提速3.75倍,常規(guī)設置也能提速2倍多。



上下文長度越長,HISA的提速效果越顯著,完全契合超長上下文(128K/1M)的實際應用需求。

精度上,HISA也幾乎完全保留原DSA的精度,且顯著優(yōu)于純塊稀疏方法。

論文進行了“大海撈針”測試,該測試衡量在超長無關文本中,精準檢索指定位置關鍵信息的能力。

結(jié)果HISA和DSA幾乎一樣準,在所有長度和插入深度下,檢索精度均接近DSA的近乎滿分。



長文本理解(LongBench 基準)上,HISA的分數(shù)也和DSA基本持平。

甚至在部分場景,比如合成檢索、少樣本學習等對token篩選精度要求高的任務中,HISA做到了小幅反超。



而在超參數(shù)測試中,不同塊大小、選塊數(shù)量下,HISA表現(xiàn)都很穩(wěn)定,分數(shù)均與DSA高度接近,無顯著性能差異



這也說明HISA對超參數(shù)的選擇不敏感,魯棒性強,工程落地時無需精細調(diào)參。

不過目前HISA還有小瑕疵,作者也提出了后續(xù)改進思路:

第一,現(xiàn)在塊是固定大小的,若一個塊里混了無關和相關內(nèi)容,塊的 “整體標簽” 會不準。

未來可以搞自適應塊、重疊塊,或換更好的塊特征計算方式。

第二,目前只是推理時直接用,未來可以把塊篩選和模型一起訓練,讓篩選更精準。

第三,現(xiàn)在只測了索引器的速度,未來整合到完整的大模型服務框架里,測端到端的吞吐量和延遲。

團隊背景

這篇論文出自北京大學的張牧涵團隊。

張牧涵,北京大學人工智能研究院的Tanure-track助理教授和博士生導師。

回國前曾在Facebook AI(現(xiàn)為 Meta AI)擔任研究員,從事大規(guī)模圖學習系統(tǒng)和問題的研究。



其Google Scholar總引用量超過13000次,其中兩篇一作文章引用量分別達到3100+和2400+次,連續(xù)多年入選Elsevier全球前2%頂尖科學家(生涯影響力榜單)

Yufei Xu(徐宇飛)和Fanxu Meng(孟繁續(xù))為論文的共同一作。


[1]https://arxiv.org/abs/2603.28458

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
iPhone Ultra 售價曝光,國行起售價 17,999 !

iPhone Ultra 售價曝光,國行起售價 17,999 !

XCiOS俱樂部
2026-04-09 13:52:43
CCTV5直播廣廈VS廣東,杜鋒收獲好消息,胡明軒轉(zhuǎn)型,王博再補強

CCTV5直播廣廈VS廣東,杜鋒收獲好消息,胡明軒轉(zhuǎn)型,王博再補強

體育大學僧
2026-04-11 09:48:13
鄭麗文人民大會堂發(fā)言震懾賴清德,15架軍機繞臺局勢緊張

鄭麗文人民大會堂發(fā)言震懾賴清德,15架軍機繞臺局勢緊張

燦若銀爛
2026-04-10 23:38:51
從日本翻身看:這次誰能扛住高油價?

從日本翻身看:這次誰能扛住高油價?

虎嗅APP
2026-04-11 04:12:09
2660萬年薪!熱火正式裁掉涉嫌賭球的后衛(wèi)羅齊爾

2660萬年薪!熱火正式裁掉涉嫌賭球的后衛(wèi)羅齊爾

體壇周報
2026-04-11 07:35:13
李亞鵬不忍了!出手替陳光標出了口“惡氣”,原來張雪當初沒說謊

李亞鵬不忍了!出手替陳光標出了口“惡氣”,原來張雪當初沒說謊

社會日日鮮
2026-04-11 09:40:17
江西一司機開路虎加油后逃單,警方通報:系二手車公司雇請的代駕,為減少送車成本逃單

江西一司機開路虎加油后逃單,警方通報:系二手車公司雇請的代駕,為減少送車成本逃單

三湘都市報
2026-04-11 09:02:43
賴清德做夢都沒有想到,鄭麗文只用18分鐘,或扭轉(zhuǎn)國民黨20年頹勢

賴清德做夢都沒有想到,鄭麗文只用18分鐘,或扭轉(zhuǎn)國民黨20年頹勢

愛下廚的阿釃
2026-04-11 08:22:09
西班牙強烈批評以軍黎巴嫩行動,內(nèi)塔尼亞胡下令驅(qū)逐西班牙代表

西班牙強烈批評以軍黎巴嫩行動,內(nèi)塔尼亞胡下令驅(qū)逐西班牙代表

Nee看
2026-04-10 22:08:36
加納喬后悔離開曼聯(lián),稱仍熱愛紅魔!在切爾西才半年已瀕臨被清洗

加納喬后悔離開曼聯(lián),稱仍熱愛紅魔!在切爾西才半年已瀕臨被清洗

羅米的曼聯(lián)博客
2026-04-11 10:53:42
WTT太原站最新賽程出爐,林詩棟沖冠,溫瑞博出戰(zhàn),石洵瑤一天3賽

WTT太原站最新賽程出爐,林詩棟沖冠,溫瑞博出戰(zhàn),石洵瑤一天3賽

球盲百小易
2026-04-11 00:10:50
查了查養(yǎng)老個人賬戶才繳納了186個月,余額只有186144.78元

查了查養(yǎng)老個人賬戶才繳納了186個月,余額只有186144.78元

歲月有情1314
2026-04-10 20:38:14
清華最難進的三個專業(yè),錄取門檻到底有多高?

清華最難進的三個專業(yè),錄取門檻到底有多高?

戶外阿毽
2026-04-11 07:31:49
寶馬“炮轟”比亞迪:不是我們做不到閃充,是不愿犧牲電池耐用性

寶馬“炮轟”比亞迪:不是我們做不到閃充,是不愿犧牲電池耐用性

混沌錄
2026-04-10 22:53:05
同一陣營出現(xiàn)分歧,鄭麗文講話為何引發(fā)如此強烈反應

同一陣營出現(xiàn)分歧,鄭麗文講話為何引發(fā)如此強烈反應

娛樂小可愛蛙
2026-04-10 16:59:49
通話后,特朗普改口

通話后,特朗普改口

第一財經(jīng)資訊
2026-04-10 20:55:54
巴基斯坦被激怒!巴防長放話消滅以色列,內(nèi)塔尼亞胡12日將被審判

巴基斯坦被激怒!巴防長放話消滅以色列,內(nèi)塔尼亞胡12日將被審判

小蘭聊歷史
2026-04-10 19:33:50
實話實說,今年斯諾克世錦賽,中國只有三人有望奪冠,沒有丁俊暉

實話實說,今年斯諾克世錦賽,中國只有三人有望奪冠,沒有丁俊暉

老高說體育
2026-04-11 10:32:38
2026年交通執(zhí)法新規(guī)!無證據(jù)不攔車,隨意檢查正式成為歷史

2026年交通執(zhí)法新規(guī)!無證據(jù)不攔車,隨意檢查正式成為歷史

復轉(zhuǎn)這些年
2026-04-08 12:36:32
詐騙13.9億,千萬豪車,成堆金條被拍,才知王麗坤夫婦究竟多奢靡

詐騙13.9億,千萬豪車,成堆金條被拍,才知王麗坤夫婦究竟多奢靡

傲傲講歷史
2026-03-09 02:50:57
2026-04-11 12:28:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12457文章數(shù) 176449關注度
往期回顧 全部

科技要聞

阿爾忒彌斯2號成功濺落,隔熱罩驚險過關

頭條要聞

"遲重瑞與陳麗華年輕時合影"熱傳 當事女子:張冠李戴

頭條要聞

"遲重瑞與陳麗華年輕時合影"熱傳 當事女子:張冠李戴

體育要聞

換帥之后,他們從降級區(qū)沖到升級區(qū)

娛樂要聞

浪姐7淘汰 該走的沒走,不該走的走了

財經(jīng)要聞

從日本翻身看:這次誰能扛住高油價?

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

健康
時尚
房產(chǎn)
手機
藝術(shù)

干細胞抗衰4大誤區(qū),90%的人都中招

推廣中獎名單-更新至2026年3月31日推廣

房產(chǎn)要聞

28條新規(guī)落地!好房子,終于有了“廣州標準”!

手機要聞

橙色版OPPO Find X9 Ultra手機渲染圖曝光

藝術(shù)要聞

17位當代青年畫家油畫欣賞

無障礙瀏覽 進入關懷版