国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

一文看懂DeepSeek與清北最新論文:劇透V4底層架構,或改寫大模型推理格局

0
分享至



出品|搜狐科技

作者鄭松毅

編輯| 楊 錦

就在全世界都盯著V4發(fā)布時,DeepSeek先給了波劇透。

數(shù)小時前,DeepSeek攜手北京大學、清華大學,共同發(fā)布了一篇足以改寫大模型推理格局的技術論文,推出了面向大模型智能體的全新推理系統(tǒng)DualPath,瞬間引爆AI圈。


作為中國大模型產(chǎn)學研協(xié)同創(chuàng)新的標桿之作,這篇論文跳出“拼參數(shù)、堆算力”的老路子,直擊當下大模型核心痛點,敘述著中國大模型從“拼能力”到“拼效率”轉(zhuǎn)型的新方向。


雙路徑架構攻I/O瓶頸,解“巧婦難為無米之炊”

眼下,大模型已邁入智能體時代,它要像人一樣思考、規(guī)劃,但一個長期被忽視的難題,正在制約著它的發(fā)展——GPU算力始終沒能充分發(fā)揮出來,核心問題就是I/O瓶頸在“拖后腿”。

換言之,今天大模型的痛點,已不是模型不夠聰明,而是跑得不夠快、成本下不來。DualPath的出現(xiàn),就是為了解決這個癥結。

很多人會問,什么是“I/O瓶頸”,又怎么拖后腿了?

這里可以簡單比喻下:如果把大模型推理過程看作是廚子炒菜,GPU的角色就是手藝頂尖、手腳飛快的廚師;顯存/內(nèi)存/網(wǎng)絡可以看成廚房的通道、傳送帶;模型每生成一句話,要用到的歷史對話緩存(KV-Cache),就是大廚要用到的配菜、調(diào)料、半成品。而I/O,則是把食材從倉庫運到灶臺的全過程——搬運、傳遞、輸送。

大廚再厲害,配菜送不上來,大廚就只能在灶臺前干等。換言之,GPU再強,如果數(shù)據(jù)傳不過來,它就只能空轉(zhuǎn)、浪費等數(shù)據(jù),這就是行業(yè)內(nèi)最致命的“I/O瓶頸”。

過去幾年,大模型越做越大,用戶越來越多,對話數(shù)據(jù)越來越長,需要搬運的食材——歷史對話緩存(KV-Cache)也就越多。結果就是傳輸通道越來越擁擠,GPU利用率越來越低,成本越來越高。

而DeepSeek這次和清北合作提出的 DualPath雙路徑架構,本質(zhì)就是修了兩條各具功能的專用傳輸通道,解決堵塞問題。

具體來看,DualPath改變了傳統(tǒng)的存儲至預填充引擎(Storage-to-Prefill)單路徑加載模式,引入了存儲至解碼引擎(Storage-to-Decode)的第二條路徑。


傳統(tǒng)路徑下,緩存直接讀入預填充(PE)。而新路徑下,緩存先讀入解碼(DE)的緩沖池,再通過RDMA傳輸給預填充(PE)。通過兩條路徑間的動態(tài)選擇,DualPath重新分配了網(wǎng)絡負載,緩解了預填充引擎?zhèn)鹊膸拤毫Α?/p>

我們可以把預填充引擎看作是主路徑,把解碼引擎看作是輔助路徑。主路徑負責準備當下大廚立刻要用的食材,保證伸手抓的時候就有,不耽誤火候。而輔助路徑負責趁不忙時,提前把食材運來備好,不耽誤主通道工作,打好配合。


性能翻倍,與清北多次聯(lián)手破題

值得一提的是,這套理論并不只是實驗室故事,而是真的在GPU集群上驗證過了:DualPath將離線推理吞吐量最高提升1.87倍,在線服務吞吐量平均提升1.96倍,請求承載能力最高提升2.25倍。


業(yè)內(nèi)觀點認為,這些亮眼數(shù)據(jù)的背后,是大模型服務成本的大幅降低,更是規(guī);涞啬芰Φ娘@著提升。對企業(yè)來說,同樣的算力投入能獲得兩倍的服務產(chǎn)出,無疑會進一步降低AI應用門檻。對開發(fā)者來說,此前難以實現(xiàn)的長上下文、多輪交互等功能,如今能穩(wěn)定落地,給智能體的創(chuàng)新應用打開了新空間。

事實上,這已不是三方的首次合作。

近半年來,DeepSeek已與北大、清華聯(lián)手推出了多項重磅成果:比如ACL 2025最佳論文中提出的原生稀疏注意力(NSA)技術,把長文本處理速度提升了11倍;還有2026年1月發(fā)布的條件記憶(Engram)架構,通過把“記憶”與“計算”拆分開來,大幅降低了推理成本和內(nèi)存占用。


V4箭在弦上

巧合的是,就在這篇論文發(fā)布的同時,業(yè)內(nèi)對DeepSeek V4版本的發(fā)布猜測也達到了頂峰。

大家普遍認為,這篇DualPath論文絕不是簡單的技術發(fā)布,而是DeepSeek V4的底層架構官宣。

從目前行業(yè)流傳的消息來看,DeepSeek V4的發(fā)布窗口已經(jīng)鎖定在未來一周,代號為“Sealion-lite”的V4輕量版,已經(jīng)在部分推理服務商處開展閉門測試,華為等國內(nèi)芯片廠商也提前拿到了模型訪問權限,完成了國產(chǎn)算力平臺的適配優(yōu)化。

種種信號表明,V4版本已經(jīng)進入了發(fā)布前的最后倒計時。

關于DeepSeek V4的核心能力,業(yè)內(nèi)的猜測高度一致,并充滿期待。其中最受關注的是百萬級上下文窗口——預計將從V3.2版本的128K tokens躍升至100萬tokens,提升近8倍。相當于模型能一次性讀完多部專業(yè)書籍、大型代碼庫,徹底解決了長文本處理的痛點。

其次是原生多模態(tài)能力,V4預計將支持文本、圖像等多種格式,從流出的SVG生成示例來看,它在貼合提示詞、形狀準確性和細節(jié)豐富度上,都比前代V3.2版本強了不少。

除此之外,智能體能力也是V4的核心亮點,讓模型能更高效地完成復雜任務。更值得一提的是,V4還打破行業(yè)慣例,把訪問權限優(yōu)先給了國內(nèi)芯片廠商,助力國產(chǎn)化AI生態(tài)的構建。

前兩日,美國AI巨頭Anthropic還在指控包括DeepSeek在內(nèi)的中國AI企業(yè)蒸餾抄襲,呼吁嚴控高端芯片出口。如今DeepSeek就向外展示了“靠人不如靠自己”的態(tài)度,連外媒都開始擔憂,英偉達股價也應聲下跌。

接下來,就期待著新模型登場了。



運營編輯 |曹倩審核|孟莎莎




特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
為什么中國革命,一會兒左一會兒右?講講課本不會告訴你的真相

為什么中國革命,一會兒左一會兒右?講講課本不會告訴你的真相

老達子
2026-02-18 06:50:03
意媒:特奧狀態(tài)出現(xiàn)斷崖式下跌,若這樣下去恐難參加世界杯

意媒:特奧狀態(tài)出現(xiàn)斷崖式下跌,若這樣下去恐難參加世界杯

懂球帝
2026-03-01 14:11:10
五角大樓震怒!F-35教官前往中國打工,難怪多次被解放軍鎖定

五角大樓震怒!F-35教官前往中國打工,難怪多次被解放軍鎖定

書紀文譚
2026-03-01 14:41:16
賺大了!網(wǎng)友網(wǎng)購一條32GB DDR5內(nèi)存 打開包裹目瞪口呆:竟收到十條

賺大了!網(wǎng)友網(wǎng)購一條32GB DDR5內(nèi)存 打開包裹目瞪口呆:竟收到十條

快科技
2026-02-27 09:37:04
國務院明確規(guī)定!隨意攔車亂罰款,今后將嚴肅處理

國務院明確規(guī)定!隨意攔車亂罰款,今后將嚴肅處理

朗威談星座
2026-03-01 13:18:13
白鹿曾舜晞又被拍?這一次,我不想只嗑CP,更想嗑這種人間清醒

白鹿曾舜晞又被拍?這一次,我不想只嗑CP,更想嗑這種人間清醒

琨玉秋霜
2026-03-01 14:21:50
內(nèi)衣已掛,后面如何?3月定伊、6月定加,后半年印太···

內(nèi)衣已掛,后面如何?3月定伊、6月定加,后半年印太···

邵旭峰域
2026-03-01 12:48:04
伊朗交底不到24小時,中外交部亮明立場,美以卻先內(nèi)訌了

伊朗交底不到24小時,中外交部亮明立場,美以卻先內(nèi)訌了

Ck的蜜糖
2026-02-28 07:04:17
北京今夜將再迎雨雪天氣 明天氣溫略有下降需保暖

北京今夜將再迎雨雪天氣 明天氣溫略有下降需保暖

北青網(wǎng)-北京青年報
2026-03-01 08:29:02
美軍航母“炸”了,史詩級災難,把臉都丟光了

美軍航母“炸”了,史詩級災難,把臉都丟光了

毛豆論道
2026-02-26 19:32:00
王子文、劉宇寧《玫瑰叢生》首播,口碑出爐,網(wǎng)友評價一針見血!

王子文、劉宇寧《玫瑰叢生》首播,口碑出爐,網(wǎng)友評價一針見血!

車窗起霧q
2026-03-01 13:23:32
皇馬遭重創(chuàng):姆巴佩因膝傷休戰(zhàn)三周,缺席歐冠對曼城首戰(zhàn)

皇馬遭重創(chuàng):姆巴佩因膝傷休戰(zhàn)三周,缺席歐冠對曼城首戰(zhàn)

星耀國際足壇
2026-03-01 14:00:33
24小時內(nèi)美以二次打擊伊朗,俄媒警告特朗普逼中國介入

24小時內(nèi)美以二次打擊伊朗,俄媒警告特朗普逼中國介入

終于在眼淚中明白
2026-03-01 12:44:03
鄒市明一家國外度假!冉瑩穎膘肥體壯不好惹,軒軒一頭白毛好土氣

鄒市明一家國外度假!冉瑩穎膘肥體壯不好惹,軒軒一頭白毛好土氣

小徐講八卦
2026-03-01 05:51:11
紀實:楊佳襲警案,北京小伙對執(zhí)法不滿,手拿剔骨刀砍死6位民警

紀實:楊佳襲警案,北京小伙對執(zhí)法不滿,手拿剔骨刀砍死6位民警

談史論天地
2026-01-08 19:40:03
鐘楚曦馬爾代夫曬泳裝照!膚白貌美紅唇迷人,前凸后翹大長腿性感

鐘楚曦馬爾代夫曬泳裝照!膚白貌美紅唇迷人,前凸后翹大長腿性感

小娛樂悠悠
2026-03-01 12:14:57
誰最有可能接任哈梅內(nèi)伊成為伊朗最高領袖?其子,還是流亡王儲

誰最有可能接任哈梅內(nèi)伊成為伊朗最高領袖?其子,還是流亡王儲

譯言
2026-03-01 15:26:29
《驚蟄無聲》:我票房10.68億,《鏢人》:巧了,我票房也10.68億

《驚蟄無聲》:我票房10.68億,《鏢人》:巧了,我票房也10.68億

情感大頭說說
2026-03-01 12:21:55
中東最大航空公司,罕見全線停航

中東最大航空公司,罕見全線停航

21世紀經(jīng)濟報道
2026-03-01 07:23:26
村里最后餓死的那個人,只有九歲

村里最后餓死的那個人,只有九歲

霹靂炮
2026-02-22 20:24:41
2026-03-01 16:15:00
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方賬號
4702文章數(shù) 9180關注度
往期回顧 全部

科技要聞

小米超跑概念車全球首秀!殺入頂豪俱樂部

頭條要聞

專家:伊朗局勢可參考委內(nèi)瑞拉 反美力量將進一步削弱

頭條要聞

專家:伊朗局勢可參考委內(nèi)瑞拉 反美力量將進一步削弱

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

《江山為聘》:吳謹言陳哲遠燃炸朝堂

財經(jīng)要聞

中東局勢升級 如何影響A股、黃金和原油

汽車要聞

小米汽車2月交付超20000臺 雷軍:為新SU7量產(chǎn)作準備

態(tài)度原創(chuàng)

房產(chǎn)
家居
手機
公開課
軍事航空

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

家居要聞

素色肌理 品意式格調(diào)

手機要聞

小米盧偉冰官宣明日直播

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國以色列聯(lián)合襲擊伊朗 實時戰(zhàn)況

無障礙瀏覽 進入關懷版