国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

MoE大模型迎來“原生戰(zhàn)友”:昇騰超節(jié)點重構(gòu)AI基礎(chǔ)設(shè)施

0
分享至

對AI比較關(guān)注的話,大概率會聽到下面兩個“時髦”的概念:

一個是Scaling Law,通常被翻譯為“規(guī)模定律”,得出了一個通俗易懂的結(jié)論——“模型越大,性能越好?!?/p>

另一個是MoE架構(gòu),中文名稱是混合專家模型,相對應(yīng)的概念是稠密(Dense)模型。如果說稠密模型一個“通才”,由一個“專家”處理多種不同的任務(wù),MoE則是將任務(wù)分門別類,分給多個“專家”進行解決。

Scaling Law和MoE的出鏡率越來越高,意味著大模型的參數(shù)量將越來越大,同時開始提升“能力密度”。直接相關(guān)的就是大模型的訓(xùn)練和推理,正在從粗放燒錢到精細調(diào)優(yōu),從堆算力轉(zhuǎn)向算力利用率最大化。

站在大模型工程化創(chuàng)新的十字路口,恰逢鯤鵬昇騰開發(fā)者大會2025前夕,“昇騰超節(jié)點”迅速成為技術(shù)圈的熱門話題。

由此產(chǎn)生的一個問題是:MoE架構(gòu)大模型的訓(xùn)練都遇到了哪些挑戰(zhàn),昇騰給出了什么新解法?

01 MoE架構(gòu)成主流,大模型訓(xùn)練遇到“三座大山”

Mixtral、DeepSeek R1、Llama 4、Qwen3……近一年現(xiàn)象級刷屏的大模型,清一色地采用了MoE架構(gòu)。

原因離不開MoE的架構(gòu)創(chuàng)新。

每個專家負責任務(wù)的一部分,極大地提升了模型的可擴展性;每個專家都能針對整個問題的特定方面進行微調(diào),進一步提升了模型的專業(yè)化和準確性;每次請求只激活部分專家,顯著減少了每次推理的計算負荷……

當MoE架構(gòu)演變?yōu)榇竽P偷闹髁鞣妒?,由服?wù)器、存儲、網(wǎng)絡(luò)等設(shè)備堆疊而成的傳統(tǒng)集群,在大模型訓(xùn)練上遇到了“三座大山”。

一是資源利用率低。

MoE架構(gòu)對負載均衡非常敏感,路由機制如果分布不均,某些專家會頻繁被調(diào)用,而其他專家?guī)缀蹰e置。

傳統(tǒng)AI集群部署MoE模型時,每臺服務(wù)器只部署部分專家,缺乏全局調(diào)度能力。由于路由機制無法感知底層資源狀態(tài),可能導(dǎo)致部分服務(wù)器的使用率大于90%,部分服務(wù)器幾乎不參與計算。結(jié)果就是,GPU的利用率遠低于理論峰值,直接拉長了模型的訓(xùn)練周期,提升了能耗與成本。

二是系統(tǒng)穩(wěn)定性差。

MoE架構(gòu)依賴動態(tài)路由+專家選擇,對系統(tǒng)的持續(xù)穩(wěn)定性要求遠高于傳統(tǒng)Dense模型,讓工程的復(fù)雜度陡升。

在傳統(tǒng)AI集群上訓(xùn)練MoE模型,任何一個節(jié)點的故障,都可能導(dǎo)致整個訓(xùn)練任務(wù)失敗。比如某MoE大模型的訓(xùn)練過程,由于集群規(guī)模超過1000張加速卡,平均無故障運行時間不足6小時,每24小時需重新調(diào)度兩次以上,單次訓(xùn)練需要數(shù)天乃至數(shù)周,運維人員長期處于高強度監(jiān)控狀態(tài)。

三是通信帶寬瓶頸。

MoE架構(gòu)的“小專家”,理論上可以節(jié)省計算資源,前提是能靈活高效地選擇和調(diào)度,對通信帶寬提出了極高要求。

在傳統(tǒng)AI集群中,GPU之間通過PCle或InfiniBand通信,激活路由涉及大量跨卡、跨節(jié)點訪問,導(dǎo)致在All-to-All通信模式下,MoE架構(gòu)的通信壓力遠大于Dense架構(gòu),訓(xùn)練速度甚至比Dense更慢。當GPU資源被通信“拖死”,哪怕是業(yè)界主流的高帶寬GPU,訓(xùn)練效率也難以線性提升。

以上還只是大模型訓(xùn)練時的常見痛點。

倘若推理階段依然部署在傳統(tǒng)AI集群上,在不支持高頻動態(tài)路由和異構(gòu)推理請求的環(huán)境下,用戶請求要觸發(fā)不同專家組合,再加上請求跳轉(zhuǎn)至跨節(jié)點專家時時延大,有些請求的延遲高達200ms以上。

訓(xùn)練系統(tǒng)的可用性,決定著智能化的速度。無法解決資源利用率低、系統(tǒng)穩(wěn)定性差、通信帶寬瓶頸的傳統(tǒng)AI集群,已經(jīng)不符合大模型的創(chuàng)新趨勢。

02 更親和MoE架構(gòu),“昇騰超節(jié)點”有何不同?

傳統(tǒng)AI集群的本質(zhì)是做加法,即通過硬件堆疊的方式提升算力,在大模型早期確實奏效,短板也很明顯。

被技術(shù)圈追捧的昇騰超節(jié)點,可以看作是算力集群走向“乘法”式增長的標志,不僅僅是計算,進一步結(jié)合了存儲、通信等能力,計算性能倍增的同時,實現(xiàn)了時延、吞吐、負載均衡等能力的整體躍遷。

用一句話總結(jié)的話,昇騰超節(jié)點實現(xiàn)了讓384張卡像一臺計算機一樣工作,更親和MoE架構(gòu)。

根源是昇騰的四個針對性創(chuàng)新。

第一個是自研高速互聯(lián)協(xié)議,能夠?qū)⒊砂偕锨€NPU以TB級帶寬超高速互聯(lián),大幅提升了并行計算的通信效率。

相較于傳統(tǒng)集群,實現(xiàn)超低延遲、高帶寬通信的昇騰超節(jié)點,大模型訓(xùn)練的All-to-All通信性能可提升5倍,send/recv集合通信性能可提升7倍,進而大幅降低了整體通信占比,讓計算少等待、不等待。打破了通信上存在的瓶頸,整體訓(xùn)練效率提升了3倍、推理吞吐提升了6倍。

第二個是軟硬件協(xié)同調(diào)度,通過異構(gòu)計算平臺CANN的協(xié)同,支持專家調(diào)度感知訓(xùn)練負載與NPU負載實時狀態(tài)。

針對MoE模型訓(xùn)練中專家熱點分布造成部分計算節(jié)點過載的問題,昇騰“超節(jié)點架構(gòu)”能夠依據(jù)MoE結(jié)構(gòu)中專家分布以及每層的計算需求,精細地將個模型切分至不同節(jié)點,更合理分配資源,提高整體資源利用率,同時可運行多種并行策略并動態(tài)調(diào)整,針對實時的負載情況精準分配計算資源。

第三個是全局內(nèi)存統(tǒng)一編址,所有的節(jié)點共享一套全局內(nèi)存體系,數(shù)據(jù)無需頻繁搬移,以此來提高訓(xùn)練的效率。

DeepSeek R1已經(jīng)有288個專家,不排除大模型專家數(shù)量越來越多的可能。支持全局內(nèi)存統(tǒng)一編址的昇騰超節(jié)點,具備更高效的內(nèi)存語義通信能力,通過更低時延指令級內(nèi)存語義通信,可滿足大模型訓(xùn)練/推理中的小包通信需求,提升專家網(wǎng)絡(luò)小包數(shù)據(jù)傳輸及離散隨機訪存通信效率。

第四個是系統(tǒng)穩(wěn)定性的提升,保證訓(xùn)練不中斷、推理更可靠,大幅降低了MoE大模型的部署和運維門檻。

比如MoE訓(xùn)練過程一旦某專家節(jié)點異常,可能導(dǎo)致全局失敗的問題。昇騰超節(jié)點采用了多平面的鏈路設(shè)計、鏈路故障秒級切換、算子級重傳等可靠性能力,確保大模型訓(xùn)練不中斷,平均無故障運行時長從幾小時提升到幾天。同時支持更敏捷的斷點續(xù)訓(xùn),故障恢復(fù)時長從小時級降低至30分鐘。

可以佐證的是,基于超節(jié)點設(shè)計的AI集群Atlas 900 A3 SuperCluster,在測試中突破了Scale Up物理節(jié)點計算瓶頸,平均無故障運行時長達到數(shù)天,訓(xùn)練效率提升了2.7倍;由于所有專家集中部署在一個超節(jié)點,在推理過程中實現(xiàn)了15ms超低延遲和高吞吐能力,對推薦系統(tǒng)、搜索排序、智能客服等對延遲極敏感的應(yīng)用場景更加友好。

03 算力創(chuàng)新蝶變:從“硬件堆疊”到“系統(tǒng)級協(xié)同”

除了性能上的提升,MoE架構(gòu)創(chuàng)新的另一個深遠影響,在于降低了推理階段的綜合成本。

過去,大模型的強大性能往往伴隨著極高的算力消耗,導(dǎo)致部署門檻極高。MoE通過“按需激活”的專家機制,在保證精度的同時大幅節(jié)省了計算資源,為企業(yè)級、行業(yè)級AI應(yīng)用的落地打通了路徑。

昇騰在算力底層架構(gòu)上的實干式創(chuàng)新,向外界揭示了一個新的趨勢:當大模型走出實驗室,走向生產(chǎn)一線,走向規(guī)?;瘧?yīng)用,為AI提供源動力的基礎(chǔ)設(shè)施,不再是“硬件堆疊”,而是計算、存儲、網(wǎng)絡(luò)的“系統(tǒng)級協(xié)同”。

不單單是親和MoE模型,搬走了大模型訓(xùn)練的“三座大山”,還預(yù)示著AI基礎(chǔ)設(shè)施的“工程可控性”和“業(yè)務(wù)適配性”,更好地支持大模型在工業(yè)、能源、交通、金融等領(lǐng)域的規(guī)?;渴稹?/p>

如果你也對昇騰超節(jié)點感興趣,想要了解更多技術(shù)細節(jié)和創(chuàng)新方案,推薦關(guān)注5月19日的鯤鵬昇騰創(chuàng)享周直播活動,技術(shù)直播的第一場就將深度講解基于昇騰的超節(jié)點架構(gòu),如何助力MoE模型的訓(xùn)練和推理,帶來15ms超低時延和高吞吐量。

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
做藝人沒有藝德!在上海被抓捕的 4 位明星,你們知道都有誰嗎?

做藝人沒有藝德!在上海被抓捕的 4 位明星,你們知道都有誰嗎?

她時尚丫
2026-02-17 21:56:13
蔚來突然官宣:41.68萬起,新車正式上市

蔚來突然官宣:41.68萬起,新車正式上市

高科技愛好者
2026-03-12 23:04:54
“不當黨產(chǎn)”官司贏了!國民黨一日三喜事,港媒贊“后勢可期”

“不當黨產(chǎn)”官司贏了!國民黨一日三喜事,港媒贊“后勢可期”

海峽導(dǎo)報社
2026-03-12 12:26:18
全球首發(fā),追覓首款“火箭車” 正式亮相!

全球首發(fā),追覓首款“火箭車” 正式亮相!

電動知家
2026-03-12 15:12:28
漢密爾頓曬九寨溝風景:我想分享給你們,向世界展示中國之美

漢密爾頓曬九寨溝風景:我想分享給你們,向世界展示中國之美

懂球帝
2026-03-12 02:02:05
伊斯蘭革命衛(wèi)隊官員:已摧毀七成美在中東地區(qū)基地和指揮部

伊斯蘭革命衛(wèi)隊官員:已摧毀七成美在中東地區(qū)基地和指揮部

財聯(lián)社
2026-03-13 05:07:07
加斯佩里尼:不明白裁判為啥要看進球回放,那球真的很難吹掉

加斯佩里尼:不明白裁判為啥要看進球回放,那球真的很難吹掉

懂球帝
2026-03-13 05:49:07
五家資方撤得干干凈凈,陳佩斯押別墅,黃渤劃掉片酬,誰笑到最后

五家資方撤得干干凈凈,陳佩斯押別墅,黃渤劃掉片酬,誰笑到最后

小椰的奶奶
2026-03-12 06:55:01
你見過哪些悶聲發(fā)大財?shù)娜??網(wǎng)友:干這個買三套房子,兩個門面

你見過哪些悶聲發(fā)大財?shù)娜??網(wǎng)友:干這個買三套房子,兩個門面

夜深愛雜談
2026-02-01 18:57:04
北京土著窮起來能有多窮?網(wǎng)友:北京以前住地下室的超級多

北京土著窮起來能有多窮?網(wǎng)友:北京以前住地下室的超級多

帶你感受人間冷暖
2026-03-13 00:02:09
吉利發(fā)布最強磷酸鐵鋰電池,這是要做電池行業(yè)新標桿?

吉利發(fā)布最強磷酸鐵鋰電池,這是要做電池行業(yè)新標桿?

優(yōu)視汽車
2026-03-12 11:34:34
李梓萌這次,真的讓人看出不一樣的格局

李梓萌這次,真的讓人看出不一樣的格局

小光侃娛樂
2026-03-13 04:50:03
投資約41.59億!中山市人民醫(yī)院新院區(qū)建設(shè)項目新進展

投資約41.59億!中山市人民醫(yī)院新院區(qū)建設(shè)項目新進展

南方都市報
2026-03-12 18:58:08
多納魯馬出擊收手致巴爾韋德進球?喬-哈特:他只是不想送點

多納魯馬出擊收手致巴爾韋德進球?喬-哈特:他只是不想送點

懂球帝
2026-03-12 20:18:16
阿韋洛亞:我早就說過瓜迪奧拉會有出人意料的招數(shù),果然如此

阿韋洛亞:我早就說過瓜迪奧拉會有出人意料的招數(shù),果然如此

懂球帝
2026-03-12 08:13:05
官宣:全新一代寶馬X5將于今年夏天正式發(fā)布

官宣:全新一代寶馬X5將于今年夏天正式發(fā)布

IT之家
2026-03-12 15:58:12
召回超15萬輛車!吉A車主,趕緊自查

召回超15萬輛車!吉A車主,趕緊自查

吉刻新聞
2026-03-12 15:51:40
揚州一女司機加塞后:撒潑打滾、無理取鬧,挨了一巴掌獲賠數(shù)萬

揚州一女司機加塞后:撒潑打滾、無理取鬧,挨了一巴掌獲賠數(shù)萬

江山揮筆
2026-03-12 11:12:38
國內(nèi)油價又要漲了,這次漲幅不小,預(yù)計92號汽油每升要漲5毛3。

國內(nèi)油價又要漲了,這次漲幅不小,預(yù)計92號汽油每升要漲5毛3。

流蘇晚晴
2026-03-10 18:55:06
拉特克利夫動真格!曼聯(lián) 7000 萬強攻拜仁巨星,一來直接統(tǒng)治英超

拉特克利夫動真格!曼聯(lián) 7000 萬強攻拜仁巨星,一來直接統(tǒng)治英超

瀾歸序
2026-03-13 05:46:46
2026-03-13 07:04:49
Alter聊科技 incentive-icons
Alter聊科技
探究產(chǎn)業(yè)興衰,專注商業(yè)解讀。
1489文章數(shù) 168115關(guān)注度
往期回顧 全部

科技要聞

當養(yǎng)蝦人開始卸載,大廠的戰(zhàn)爭才真正開始

頭條要聞

美軍加油機在伊拉克墜毀

頭條要聞

美軍加油機在伊拉克墜毀

體育要聞

建議將“出球型門將”納入反詐app

娛樂要聞

貝克漢姆全家給27歲大布送生日祝福

財經(jīng)要聞

盧鋒:從特朗普團隊群演看時代變局

汽車要聞

大眾2025財報:轉(zhuǎn)型雖有陣痛 "大象"已然起跑

態(tài)度原創(chuàng)

家居
本地
游戲
公開課
軍事航空

家居要聞

觸感本真 家的跡象

本地新聞

坐標北京,過敏季反向遷徒

內(nèi)存荒逼瘋V社!開會現(xiàn)場公開"求貨":我們真心想買

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普自行宣布對伊朗戰(zhàn)爭勝利

無障礙瀏覽 進入關(guān)懷版