国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

一文看懂DeepSeek與清北最新論文:劇透V4底層架構(gòu),或改寫(xiě)大模型推理格局

0
分享至



出品|搜狐科技

作者鄭松毅

編輯| 楊 錦

就在全世界都盯著V4發(fā)布時(shí),DeepSeek先給了波劇透。

數(shù)小時(shí)前,DeepSeek攜手北京大學(xué)、清華大學(xué),共同發(fā)布了一篇足以改寫(xiě)大模型推理格局的技術(shù)論文,推出了面向大模型智能體的全新推理系統(tǒng)DualPath,瞬間引爆AI圈。


作為中國(guó)大模型產(chǎn)學(xué)研協(xié)同創(chuàng)新的標(biāo)桿之作,這篇論文跳出“拼參數(shù)、堆算力”的老路子,直擊當(dāng)下大模型核心痛點(diǎn),敘述著中國(guó)大模型從“拼能力”到“拼效率”轉(zhuǎn)型的新方向。


雙路徑架構(gòu)攻I/O瓶頸,解“巧婦難為無(wú)米之炊”

眼下,大模型已邁入智能體時(shí)代,它要像人一樣思考、規(guī)劃,但一個(gè)長(zhǎng)期被忽視的難題,正在制約著它的發(fā)展——GPU算力始終沒(méi)能充分發(fā)揮出來(lái),核心問(wèn)題就是I/O瓶頸在“拖后腿”。

換言之,今天大模型的痛點(diǎn),已不是模型不夠聰明,而是跑得不夠快、成本下不來(lái)。DualPath的出現(xiàn),就是為了解決這個(gè)癥結(jié)。

很多人會(huì)問(wèn),什么是“I/O瓶頸”,又怎么拖后腿了?

這里可以簡(jiǎn)單比喻下:如果把大模型推理過(guò)程看作是廚子炒菜,GPU的角色就是手藝頂尖、手腳飛快的廚師;顯存/內(nèi)存/網(wǎng)絡(luò)可以看成廚房的通道、傳送帶;模型每生成一句話(huà),要用到的歷史對(duì)話(huà)緩存(KV-Cache),就是大廚要用到的配菜、調(diào)料、半成品。而I/O,則是把食材從倉(cāng)庫(kù)運(yùn)到灶臺(tái)的全過(guò)程——搬運(yùn)、傳遞、輸送。

大廚再厲害,配菜送不上來(lái),大廚就只能在灶臺(tái)前干等。換言之,GPU再?gòu)?qiáng),如果數(shù)據(jù)傳不過(guò)來(lái),它就只能空轉(zhuǎn)、浪費(fèi)等數(shù)據(jù),這就是行業(yè)內(nèi)最致命的“I/O瓶頸”。

過(guò)去幾年,大模型越做越大,用戶(hù)越來(lái)越多,對(duì)話(huà)數(shù)據(jù)越來(lái)越長(zhǎng),需要搬運(yùn)的食材——?dú)v史對(duì)話(huà)緩存(KV-Cache)也就越多。結(jié)果就是傳輸通道越來(lái)越擁擠,GPU利用率越來(lái)越低,成本越來(lái)越高。

而DeepSeek這次和清北合作提出的 DualPath雙路徑架構(gòu),本質(zhì)就是修了兩條各具功能的專(zhuān)用傳輸通道,解決堵塞問(wèn)題。

具體來(lái)看,DualPath改變了傳統(tǒng)的存儲(chǔ)至預(yù)填充引擎(Storage-to-Prefill)單路徑加載模式,引入了存儲(chǔ)至解碼引擎(Storage-to-Decode)的第二條路徑。


傳統(tǒng)路徑下,緩存直接讀入預(yù)填充(PE)。而新路徑下,緩存先讀入解碼(DE)的緩沖池,再通過(guò)RDMA傳輸給預(yù)填充(PE)。通過(guò)兩條路徑間的動(dòng)態(tài)選擇,DualPath重新分配了網(wǎng)絡(luò)負(fù)載,緩解了預(yù)填充引擎?zhèn)鹊膸拤毫Α?/p>

我們可以把預(yù)填充引擎看作是主路徑,把解碼引擎看作是輔助路徑。主路徑負(fù)責(zé)準(zhǔn)備當(dāng)下大廚立刻要用的食材,保證伸手抓的時(shí)候就有,不耽誤火候。而輔助路徑負(fù)責(zé)趁不忙時(shí),提前把食材運(yùn)來(lái)備好,不耽誤主通道工作,打好配合。


性能翻倍,與清北多次聯(lián)手破題

值得一提的是,這套理論并不只是實(shí)驗(yàn)室故事,而是真的在GPU集群上驗(yàn)證過(guò)了:DualPath將離線(xiàn)推理吞吐量最高提升1.87倍,在線(xiàn)服務(wù)吞吐量平均提升1.96倍,請(qǐng)求承載能力最高提升2.25倍。


業(yè)內(nèi)觀(guān)點(diǎn)認(rèn)為,這些亮眼數(shù)據(jù)的背后,是大模型服務(wù)成本的大幅降低,更是規(guī);涞啬芰Φ娘@著提升。對(duì)企業(yè)來(lái)說(shuō),同樣的算力投入能獲得兩倍的服務(wù)產(chǎn)出,無(wú)疑會(huì)進(jìn)一步降低AI應(yīng)用門(mén)檻。對(duì)開(kāi)發(fā)者來(lái)說(shuō),此前難以實(shí)現(xiàn)的長(zhǎng)上下文、多輪交互等功能,如今能穩(wěn)定落地,給智能體的創(chuàng)新應(yīng)用打開(kāi)了新空間。

事實(shí)上,這已不是三方的首次合作。

近半年來(lái),DeepSeek已與北大、清華聯(lián)手推出了多項(xiàng)重磅成果:比如ACL 2025最佳論文中提出的原生稀疏注意力(NSA)技術(shù),把長(zhǎng)文本處理速度提升了11倍;還有2026年1月發(fā)布的條件記憶(Engram)架構(gòu),通過(guò)把“記憶”與“計(jì)算”拆分開(kāi)來(lái),大幅降低了推理成本和內(nèi)存占用。


V4箭在弦上

巧合的是,就在這篇論文發(fā)布的同時(shí),業(yè)內(nèi)對(duì)DeepSeek V4版本的發(fā)布猜測(cè)也達(dá)到了頂峰。

大家普遍認(rèn)為,這篇DualPath論文絕不是簡(jiǎn)單的技術(shù)發(fā)布,而是DeepSeek V4的底層架構(gòu)官宣。

從目前行業(yè)流傳的消息來(lái)看,DeepSeek V4的發(fā)布窗口已經(jīng)鎖定在未來(lái)一周,代號(hào)為“Sealion-lite”的V4輕量版,已經(jīng)在部分推理服務(wù)商處開(kāi)展閉門(mén)測(cè)試,華為等國(guó)內(nèi)芯片廠(chǎng)商也提前拿到了模型訪(fǎng)問(wèn)權(quán)限,完成了國(guó)產(chǎn)算力平臺(tái)的適配優(yōu)化。

種種信號(hào)表明,V4版本已經(jīng)進(jìn)入了發(fā)布前的最后倒計(jì)時(shí)。

關(guān)于DeepSeek V4的核心能力,業(yè)內(nèi)的猜測(cè)高度一致,并充滿(mǎn)期待。其中最受關(guān)注的是百萬(wàn)級(jí)上下文窗口——預(yù)計(jì)將從V3.2版本的128K tokens躍升至100萬(wàn)tokens,提升近8倍。相當(dāng)于模型能一次性讀完多部專(zhuān)業(yè)書(shū)籍、大型代碼庫(kù),徹底解決了長(zhǎng)文本處理的痛點(diǎn)。

其次是原生多模態(tài)能力,V4預(yù)計(jì)將支持文本、圖像等多種格式,從流出的SVG生成示例來(lái)看,它在貼合提示詞、形狀準(zhǔn)確性和細(xì)節(jié)豐富度上,都比前代V3.2版本強(qiáng)了不少。

除此之外,智能體能力也是V4的核心亮點(diǎn),讓模型能更高效地完成復(fù)雜任務(wù)。更值得一提的是,V4還打破行業(yè)慣例,把訪(fǎng)問(wèn)權(quán)限優(yōu)先給了國(guó)內(nèi)芯片廠(chǎng)商,助力國(guó)產(chǎn)化AI生態(tài)的構(gòu)建。

前兩日,美國(guó)AI巨頭Anthropic還在指控包括DeepSeek在內(nèi)的中國(guó)AI企業(yè)蒸餾抄襲,呼吁嚴(yán)控高端芯片出口。如今DeepSeek就向外展示了“靠人不如靠自己”的態(tài)度,連外媒都開(kāi)始擔(dān)憂(yōu),英偉達(dá)股價(jià)也應(yīng)聲下跌。

接下來(lái),就期待著新模型登場(chǎng)了。



運(yùn)營(yíng)編輯 |曹倩審核|孟莎莎




特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
鄭少秋4個(gè)女兒:老大55歲自縊,老二38歲抑郁,老三老四享盡父愛(ài)

鄭少秋4個(gè)女兒:老大55歲自縊,老二38歲抑郁,老三老四享盡父愛(ài)

照見(jiàn)古今
2026-04-08 18:17:49
小S首談大S去世前細(xì)節(jié),承認(rèn)她執(zhí)意帶姐姐去日本 后悔沒(méi)聽(tīng)S媽的話(huà)

小S首談大S去世前細(xì)節(jié),承認(rèn)她執(zhí)意帶姐姐去日本 后悔沒(méi)聽(tīng)S媽的話(huà)

白面書(shū)誏
2026-04-20 19:15:05
太可怕了!繼注射藥物、熱巴事件后,王陽(yáng)再揭?jiàn)蕵?lè)圈最臟的一面

太可怕了!繼注射藥物、熱巴事件后,王陽(yáng)再揭?jiàn)蕵?lè)圈最臟的一面

橙星文娛
2026-04-17 13:19:56
一張封面讓以色列炸鍋,大使怒罵,雜志不道歉,最后視頻曝光

一張封面讓以色列炸鍋,大使怒罵,雜志不道歉,最后視頻曝光

海綿芝士局
2026-04-20 16:17:16
關(guān)注丨剛剛,全線(xiàn)跳水!伊朗,突然宣布

關(guān)注丨剛剛,全線(xiàn)跳水!伊朗,突然宣布

錢(qián)眼
2026-04-20 20:12:47
何猷君家保姆買(mǎi)彩票中了3000萬(wàn),保姆樂(lè)壞了,拒不辭職!轉(zhuǎn)頭第一句話(huà)是:你想要什么,我都買(mǎi)給你

何猷君家保姆買(mǎi)彩票中了3000萬(wàn),保姆樂(lè)壞了,拒不辭職!轉(zhuǎn)頭第一句話(huà)是:你想要什么,我都買(mǎi)給你

LULU生活家
2026-04-20 14:34:28
許家印認(rèn)罪!2.4萬(wàn)億窟窿,家族只拿走500億,其余真金白銀去哪了

許家印認(rèn)罪!2.4萬(wàn)億窟窿,家族只拿走500億,其余真金白銀去哪了

小嵩
2026-04-20 13:52:49
最后時(shí)刻簽了,高市將全面梭哈?中日航班已停飛,解放軍準(zhǔn)時(shí)出海

最后時(shí)刻簽了,高市將全面梭哈?中日航班已停飛,解放軍準(zhǔn)時(shí)出海

起喜電影
2026-04-21 01:20:08
女子利用天氣預(yù)報(bào)頻繁購(gòu)買(mǎi)飛機(jī)延誤險(xiǎn),5年買(mǎi)中900多次,獲賠近300萬(wàn),被抓時(shí):我符合保險(xiǎn)理賠要求

女子利用天氣預(yù)報(bào)頻繁購(gòu)買(mǎi)飛機(jī)延誤險(xiǎn),5年買(mǎi)中900多次,獲賠近300萬(wàn),被抓時(shí):我符合保險(xiǎn)理賠要求

譚老師地理大課堂
2026-04-15 20:11:42
37歲福原愛(ài)官宣生下三胎,現(xiàn)任丈夫居然是此前出軌門(mén)男主,母子平安

37歲福原愛(ài)官宣生下三胎,現(xiàn)任丈夫居然是此前出軌門(mén)男主,母子平安

好乒乓
2026-04-20 11:14:45
惡心!浙江新娘吐槽,18萬(wàn)禮金被拿走15萬(wàn),結(jié)婚像給婆婆賺養(yǎng)老錢(qián)

惡心!浙江新娘吐槽,18萬(wàn)禮金被拿走15萬(wàn),結(jié)婚像給婆婆賺養(yǎng)老錢(qián)

火山詩(shī)話(huà)
2026-04-20 08:59:19
張雪回應(yīng)比賽提前結(jié)束:如果繼續(xù)比賽可能引發(fā)安全事故;“賽車(chē)圈還是很干凈的,每個(gè)人都為了自己的信仰拼搏”

張雪回應(yīng)比賽提前結(jié)束:如果繼續(xù)比賽可能引發(fā)安全事故;“賽車(chē)圈還是很干凈的,每個(gè)人都為了自己的信仰拼搏”

大風(fēng)新聞
2026-04-20 10:28:40
6月1日起全國(guó)工地統(tǒng)一用工新規(guī),明確60歲以上農(nóng)民工上崗標(biāo)準(zhǔn)

6月1日起全國(guó)工地統(tǒng)一用工新規(guī),明確60歲以上農(nóng)民工上崗標(biāo)準(zhǔn)

阿嚼影視評(píng)論
2026-04-20 21:02:56
失蹤足足5天后,美軍終于承認(rèn):價(jià)值16億的最強(qiáng)無(wú)人機(jī)在中東沒(méi)了

失蹤足足5天后,美軍終于承認(rèn):價(jià)值16億的最強(qiáng)無(wú)人機(jī)在中東沒(méi)了

混沌錄
2026-04-20 20:32:11
女騎手兩年暴漲35%,女司機(jī)猛增75%,中年女人為何搶著跑車(chē)?

女騎手兩年暴漲35%,女司機(jī)猛增75%,中年女人為何搶著跑車(chē)?

老特有話(huà)說(shuō)
2026-04-17 17:19:57
中國(guó)男子在中東教漢語(yǔ),娶三位本地姑娘,生下混血,卻坦言養(yǎng)不起

中國(guó)男子在中東教漢語(yǔ),娶三位本地姑娘,生下混血,卻坦言養(yǎng)不起

三農(nóng)老歷
2026-04-15 19:17:15
“最難對(duì)付的敵人”:周末,真主黨消滅以軍超過(guò)一個(gè)排!

“最難對(duì)付的敵人”:周末,真主黨消滅以軍超過(guò)一個(gè)排!

勝研集
2026-04-20 18:04:11
當(dāng)年勸烏克蘭“為民生投降”,如今同一番話(huà),原封不動(dòng)送給伊朗

當(dāng)年勸烏克蘭“為民生投降”,如今同一番話(huà),原封不動(dòng)送給伊朗

老馬拉車(chē)莫少裝
2026-03-18 13:51:32
1999年,69歲禹作敏獄中難耐孤寂,死前曾向李瑞環(huán)提出:我想回家

1999年,69歲禹作敏獄中難耐孤寂,死前曾向李瑞環(huán)提出:我想回家

華人星光
2026-04-20 09:59:15
殲10直飛伊朗,美以都沒(méi)敢攔!誰(shuí)也沒(méi)想到,背后藏著一個(gè)天大的局

殲10直飛伊朗,美以都沒(méi)敢攔!誰(shuí)也沒(méi)想到,背后藏著一個(gè)天大的局

尋墨閣
2026-04-20 18:51:46
2026-04-21 09:15:00
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方賬號(hào)
4775文章數(shù) 7984關(guān)注度
往期回顧 全部

科技要聞

重磅官宣:庫(kù)克卸任,特努斯接任蘋(píng)果CEO

頭條要聞

牛彈琴:特朗普成美伊談判最大障礙 伊朗果然勃然大怒

頭條要聞

牛彈琴:特朗普成美伊談判最大障礙 伊朗果然勃然大怒

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂(lè)要聞

《八千里路云和月》田家泰暗殺

財(cái)經(jīng)要聞

減速機(jī)訂單已排到明年!

汽車(chē)要聞

把天門(mén)山搬進(jìn)廠(chǎng)?開(kāi)仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

時(shí)尚
教育
本地
數(shù)碼
健康

“爆冷”又如何?陳法拉的人生本就是一場(chǎng)逆襲大戲

教育要聞

26年強(qiáng)基計(jì)劃專(zhuān)業(yè)大調(diào)整,你是否準(zhǔn)備報(bào)考強(qiáng)基計(jì)劃

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

數(shù)碼要聞

16GB能當(dāng)20GB用!華為超空間內(nèi)存技術(shù)適配計(jì)劃公布:Mate X7系列6月推送

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版