国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

開發(fā)者故事 | 基于 DOCA GPUNetIO 的 MoE 模型推理加速實踐

0
分享至



在第三屆 NVIDIA DPU 中國黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現(xiàn)了在 AI 網(wǎng)絡(luò)、存儲和安全等領(lǐng)域的創(chuàng)新突破。

由劉瀚騁、劉崇鵬、劉陽組成的 SeekExpert 團(tuán)隊在本屆黑客松中展現(xiàn)了卓越的技術(shù)實力,憑借其創(chuàng)新項目“利用 NVIDIA DOCA GPUNetIO 技術(shù),加速 Expert-Kit 推理框架中的專家權(quán)重分發(fā)和通信傳輸部分,從而提升 MoE 模型推理的速度和效率”取得了第二名。該項目利用 NVIDIA DOCA GPUNetIO 技術(shù),針對 Expert-Centric 架構(gòu)的 Expert-Kit MoE 推理框架中的專家權(quán)重分發(fā)和通信傳輸關(guān)鍵環(huán)節(jié)進(jìn)行了優(yōu)化。

從網(wǎng)絡(luò)瓶頸到 DPU 異構(gòu)加速的實踐突破

隨著數(shù)據(jù)中心計算向異構(gòu)模式深度演進(jìn),網(wǎng)絡(luò)通信的控制和數(shù)據(jù)調(diào)度變得日益復(fù)雜,DPU 作為中間銜接的橋梁必將大有可為。在過去開發(fā)和使用 Expert-Kit 推理框架的過程中,SeekExpert 團(tuán)隊發(fā)現(xiàn)將傳統(tǒng)開發(fā)模式運用到該框架存在較大的性能瓶頸。具體來說,框架采用 Expert-Centric 架構(gòu),該架構(gòu)專注于快速專家調(diào)度和專家異構(gòu)計算,但實際運行時網(wǎng)絡(luò)性能成為了關(guān)鍵的制約因素——具體表現(xiàn)為專家權(quán)重分發(fā)及中間結(jié)果傳輸過程中的數(shù)據(jù)拷貝開銷會導(dǎo)致推理延遲增加,同時網(wǎng)絡(luò)數(shù)據(jù)路徑處理占用大量 CPU 資源,與專家計算形成資源競爭,直接影響系統(tǒng)整體吞吐量。

基于這個痛點,SeekExpert 團(tuán)隊意識到 NVIDIA BlueField DPU 恰好能破解這一難題,通過 DPU 專門處理網(wǎng)絡(luò)傳輸任務(wù)的技術(shù)特性,既能實現(xiàn)權(quán)重分發(fā)的加速,又能釋放 CPU 資源,從而使 CPU 專注專家計算的核心功能,這就是參賽項目的由來。

雙管齊下:攻克技術(shù)選型與協(xié)同開發(fā)難題

在開發(fā)過程中,團(tuán)隊面臨的兩大底層技術(shù)挑戰(zhàn),一個是來自于技術(shù)選型的難題,另一個是與 CUDA 協(xié)同開發(fā)的復(fù)雜性。首先,團(tuán)隊需要全面理解 GPUNetIO、DMA、RDMA 等不同網(wǎng)絡(luò)加速方案的適用場景,并判斷哪個最符合團(tuán)隊專家權(quán)重分發(fā)的需求,其次需要實現(xiàn) DOCA 與 CUDA 的深度集成,這涉及到 GPU 內(nèi)存管理、數(shù)據(jù)流同步等底層細(xì)節(jié),調(diào)試復(fù)雜度極高。

為攻克這些難題,團(tuán)隊采取了雙管齊下的策略:一方面充分利用 NVIDIA 的技術(shù)資源,通過DOCA 官方文檔中完善的 API 說明和示例代碼來獲取關(guān)鍵技術(shù)指引;另一方面,當(dāng)遇到技術(shù)瓶頸時,團(tuán)隊成員會從各自的技術(shù)視角開展討論,分析問題根源并提出針對性解決方案。

為 DPU 在大模型推理加速領(lǐng)域鋪路

該項目創(chuàng)新性地將 NVIDIA DOCA GPUNetIO 技術(shù)與 MoE 模型推理加速相結(jié)合,通過 Expert-Kit 推理框架實現(xiàn)異構(gòu)硬件資源的協(xié)同優(yōu)化,讓 DPU 專門處理網(wǎng)絡(luò)密集型的專家權(quán)重分發(fā)和通信任務(wù),使 CPU 得以專注于專家計算,從而在云計算、數(shù)據(jù)中心的 AI 推理平臺中有效緩解集群時間維度(動態(tài)負(fù)載)與空間維度(不同設(shè)備協(xié)同)的資源利用率難題,為 DPU 在大模型推理加速領(lǐng)域提供了優(yōu)化方向。

DOCA 開發(fā)者快問快答

Q

您是從哪里了解到 NVIDIA DPU 黑客松競賽的?參賽的目標(biāo)是什么?

A

我們是通過老師的介紹了解到這次 NVIDIA DPU 中國黑客松競賽的。由于我們之前在研究異構(gòu)設(shè)備共享內(nèi)存時就接觸過 DOCA 軟件框架,當(dāng)我們的 Expert-Kit 推理框架遇到網(wǎng)絡(luò)傳輸優(yōu)化瓶頸時,自然聯(lián)想到了 DPU 可能存在的機(jī)會。

Q

賽前舉辦的 DPU 線上技術(shù)訓(xùn)練營對您的備賽起到哪些幫助?

A

訓(xùn)練營對 DPU 在各個領(lǐng)域的解決方案進(jìn)行了引領(lǐng)性講解,涵蓋了安全、網(wǎng)絡(luò)卸載等多個方向,讓我們對 DOCA 開發(fā)有了更為全面的認(rèn)識。

Q

參與 NVIDIA DPU 黑客松競賽有哪些收獲?

A

除了技術(shù)能力的提升,我們還結(jié)識了很多其他參賽隊伍的隊員,了解了他們在相關(guān)研究方向上的探索,這拓寬了我們的技術(shù)視野。同時,通過比賽我們也深入了解了 NVIDIA 在各行各業(yè)的技術(shù)探索和應(yīng)用,對整個 AI 和硬件加速生態(tài)有了更全面的認(rèn)識。

Q

本次競賽有沒有難忘或有趣的經(jīng)歷?

A

最印象深刻的是最后前往 NVIDIA 北京辦公室參觀,整個參觀讓我們深刻感受到了 NVIDIA 的快速發(fā)展軌跡,以及 NVIDIA 在各行各業(yè)所做出的技術(shù)貢獻(xiàn)。

Q

您是從什么渠道了解到 NVIDIA DOCA 的?什么契機(jī)使你成為 DOCA 開發(fā)者?

A

我們最初是在研究異構(gòu)設(shè)備的共享內(nèi)存接觸到的 NVIDIA DOCA。DPU 作為 CPU、GPU 和網(wǎng)絡(luò)之間的數(shù)據(jù)通信所需的核心部件,能夠讓整個數(shù)據(jù)和控制拓?fù)渥兊煤啙嵟c清晰,也能夠很好地承擔(dān)起異構(gòu)計算中的協(xié)調(diào)和加速角色。

Q

最初從事 DOCA 開發(fā)時,有具體明確的目標(biāo)嗎?

A

目標(biāo)是通過讓 DPU 承擔(dān)網(wǎng)絡(luò)處理、數(shù)據(jù)移動等任務(wù),使得 CPU 能夠?qū)W⒂谟嬎忝芗凸ぷ?,同時 DPU 通過高速互聯(lián) GPU 協(xié)同工作。

Q

過往有其他成功的 DOCA 開發(fā)經(jīng)歷嗎?

A

在異構(gòu)設(shè)備分布式共享內(nèi)存項目開發(fā)中,我們利用 DPU 實現(xiàn)了跨地址空間的高效數(shù)據(jù)傳遞,這些相關(guān)經(jīng)驗幫助我們后續(xù)在 Expert-Kit 推理框架中應(yīng)用 DOCA 技術(shù)奠定了基礎(chǔ)。

Q

您對 DOCA 的評價如何呢?DOCA 中國開發(fā)者社區(qū)對你有哪些幫助?

A

DOCA 提供了一個編程框架,相關(guān)文檔也很齊全,對 AI 生態(tài),包括 CUDA 等也有很好的包容性。

開發(fā)者寄語

“大語言模型的推理需求推動數(shù)據(jù)中心向異構(gòu)計算演進(jìn),CPU、GPU、XPU 等不同類型設(shè)備需要協(xié)同工作才能發(fā)揮最大效能。DPU 和 DOCA 技術(shù)正是連接這些異構(gòu)設(shè)備的關(guān)鍵,通過智能卸載和資源調(diào)度,能提升數(shù)據(jù)中心的整體利用率。期待更多開發(fā)者加入 DOCA 社區(qū),共同探索 DPU 在異構(gòu)計算方面的可能性?!?/p>

——SeekExpert 團(tuán)隊

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
穆索:下半場草皮狀況更糟,根本沒法踢

穆索:下半場草皮狀況更糟,根本沒法踢

懂球帝
2026-03-15 02:14:05
撕破臉了!特朗普大罵以總統(tǒng)“可恥”,以色列強(qiáng)硬回?fù)簦航^不妥協(xié)

撕破臉了!特朗普大罵以總統(tǒng)“可恥”,以色列強(qiáng)硬回?fù)簦航^不妥協(xié)

諦聽骨語本尊
2026-03-14 20:05:41
難兄難弟!中超“遼寧雙雄”吃下兩連?。?個是瞎打,另1個在亂踢

難兄難弟!中超“遼寧雙雄”吃下兩連敗:1個是瞎打,另1個在亂踢

足球大腕
2026-03-15 00:04:49
唏噓 49歲前中超球員送外賣:一天收入三四百 李瑋鋒知情后伸援手

唏噓 49歲前中超球員送外賣:一天收入三四百 李瑋鋒知情后伸援手

風(fēng)過鄉(xiāng)
2026-03-14 09:18:59
血色24小時!卡車撞穿猶太幼兒園,校園恐襲同日爆發(fā),美國安全防線正崩塌?

血色24小時!卡車撞穿猶太幼兒園,校園恐襲同日爆發(fā),美國安全防線正崩塌?

最英國
2026-03-13 18:41:36
A股:人民日報權(quán)威發(fā)文,請做好準(zhǔn)備,下周一將迎來新的變化

A股:人民日報權(quán)威發(fā)文,請做好準(zhǔn)備,下周一將迎來新的變化

另子維愛讀史
2026-03-14 20:26:14
新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

呼吸科大夫胡洋
2026-02-22 11:39:12
陳熠落敗,或許是這三點原因,賽后大藤沙月滿臉不可思議

陳熠落敗,或許是這三點原因,賽后大藤沙月滿臉不可思議

小皷拍客在北漂
2026-03-15 00:40:18
國臺辦:不管臺灣地區(qū)以什么方式選舉、選了什么人,都改變不了臺灣是中國一部分的地位

國臺辦:不管臺灣地區(qū)以什么方式選舉、選了什么人,都改變不了臺灣是中國一部分的地位

環(huán)球網(wǎng)資訊
2026-03-14 17:24:48
1.45億歐標(biāo)王傷停三月!利物浦鋒線迎強(qiáng)心針,伊薩克復(fù)出時間敲定

1.45億歐標(biāo)王傷停三月!利物浦鋒線迎強(qiáng)心針,伊薩克復(fù)出時間敲定

田先生籃球
2026-03-14 12:59:49
一場1-1,讓意甲領(lǐng)頭羊痛失2分,第82分鐘絕平,米蘭爭冠看到希望

一場1-1,讓意甲領(lǐng)頭羊痛失2分,第82分鐘絕平,米蘭爭冠看到希望

足球狗說
2026-03-14 23:55:55
張雨綺大瓜爆出!

張雨綺大瓜爆出!

微微熱評
2026-01-27 00:09:43
悲哀!已經(jīng)生理性排斥,一山東女子痛斥老公失業(yè),三個娃靠她工資

悲哀!已經(jīng)生理性排斥,一山東女子痛斥老公失業(yè),三個娃靠她工資

火山詩話
2026-03-14 06:23:39
《妻子的浪漫旅行2026》正式開錄!秦昊一家最特殊,金莎結(jié)婚了?

《妻子的浪漫旅行2026》正式開錄!秦昊一家最特殊,金莎結(jié)婚了?

以茶帶書
2026-03-14 14:11:47
三名美人并排站著,你最偏愛哪一個

三名美人并排站著,你最偏愛哪一個

東方不敗然多多
2026-03-14 21:36:04
羅馬諾:巴薩已與拉什福德達(dá)成協(xié)議,下周和曼聯(lián)談判;ESPN:卡里克的表現(xiàn)已超曼聯(lián)管理層預(yù)期

羅馬諾:巴薩已與拉什福德達(dá)成協(xié)議,下周和曼聯(lián)談判;ESPN:卡里克的表現(xiàn)已超曼聯(lián)管理層預(yù)期

MUREDS
2026-03-14 23:54:54
平安狂買銀行股,舉牌四次成大股東,你的保單背后站著半壁銀行業(yè)

平安狂買銀行股,舉牌四次成大股東,你的保單背后站著半壁銀行業(yè)

風(fēng)風(fēng)順
2026-03-15 02:05:03
未來的3萬分先生,24歲愛德華茲已經(jīng)拿到10788分歷史第四人!

未來的3萬分先生,24歲愛德華茲已經(jīng)拿到10788分歷史第四人!

田先生籃球
2026-03-14 13:52:06
沈陽91歲老太太病逝,臨終遺言:我就是國民黨一直在找的軍火大盜

沈陽91歲老太太病逝,臨終遺言:我就是國民黨一直在找的軍火大盜

興趣知識
2026-03-12 17:18:51
霍爾木茲海峽,突傳大消息!加密貨幣全線跳水,超8萬人爆倉!

霍爾木茲海峽,突傳大消息!加密貨幣全線跳水,超8萬人爆倉!

證券時報e公司
2026-03-14 22:06:48
2026-03-15 02:44:49
NVIDIA英偉達(dá)中國 incentive-icons
NVIDIA英偉達(dá)中國
英偉達(dá)(中國)官方賬號
3427文章數(shù) 1442關(guān)注度
往期回顧 全部

科技要聞

xAI創(chuàng)始伙伴只剩兩人!馬斯克“痛改前非”

頭條要聞

伊朗船只迫近林肯號航母 美軍連開數(shù)炮全打空

頭條要聞

伊朗船只迫近林肯號航母 美軍連開數(shù)炮全打空

體育要聞

NBA唯一巴西球員,增重20KG頂內(nèi)線

娛樂要聞

九成美曝田栩?qū)幵衅诔鲕?AI反轉(zhuǎn)引熱議

財經(jīng)要聞

3·15影子暗訪|神秘的“特供酒”

汽車要聞

吉利銀河M7技術(shù)首秀 實力重構(gòu)主流電混SUV

態(tài)度原創(chuàng)

親子
家居
本地
數(shù)碼
公開課

親子要聞

從"疲憊帶娃"到"從容陪娃":每位家長都能掌握的魔法轉(zhuǎn)變

家居要聞

藝術(shù)之家 法式優(yōu)雅

本地新聞

坐標(biāo)北京,過敏季反向遷徒

數(shù)碼要聞

AWE洗衣機(jī)觀察:卷烘干、卷AI,「無感」洗衣才是未來?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版