国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

何為超節(jié)點(diǎn)?內(nèi)存統(tǒng)一編址是支撐超節(jié)點(diǎn)實(shí)踐落地的必備能力

0
分享至

文/黃海峰的通信生活

當(dāng)千億參數(shù)大模型成為產(chǎn)業(yè)智能化標(biāo)配,我們的計(jì)算基礎(chǔ)設(shè)施,能接住這場AI浪潮嗎?

12月25日,筆者前往杭州參加“昇思MindSpore為超節(jié)點(diǎn)而生的AI框架”為主題的昇思人工智能框架峰會,看展、聽會、交流,頗有收獲,找到問題答案。

最讓筆者印象深刻的一句話是華為中央軟件院總裁謝桂磊在致辭中指出,AI邁入產(chǎn)業(yè)規(guī)模化應(yīng)用關(guān)鍵階段,而基于高速互聯(lián)的超節(jié)點(diǎn)成為AI算力基礎(chǔ)設(shè)施的新常態(tài)。

當(dāng)傳統(tǒng)計(jì)算集群捉襟見肘,超節(jié)點(diǎn)技術(shù)與生態(tài)實(shí)踐,是否預(yù)示著AI基礎(chǔ)設(shè)施的換代時(shí)刻已經(jīng)到來?如今市面上一下子涌現(xiàn)出多個(gè)“超節(jié)點(diǎn)”,哪一種是真正滿足未來需求的?



模型的算力焦慮,傳統(tǒng)集群為何難承重負(fù)?

AI技術(shù)的爆發(fā)式增長,正在對底層計(jì)算基礎(chǔ)設(shè)施提出前所未有的嚴(yán)苛要求。模型規(guī)模的指數(shù)級擴(kuò)張引發(fā)算力海嘯,而業(yè)界卻面臨著效率低下、穩(wěn)定性不足等諸多難題。



首先是算力協(xié)同效率低。傳統(tǒng)計(jì)算集群中,數(shù)百張AI芯片通過以太網(wǎng)連接,數(shù)據(jù)傳輸需經(jīng)過序列化-網(wǎng)絡(luò)傳輸-反序列化的復(fù)雜流程。就像多個(gè)倉庫各自為政,貨物調(diào)運(yùn)要走繁瑣的審批手續(xù),即便道路再寬(高帶寬),也會因流程梗阻導(dǎo)致效率低下。

其次是內(nèi)存資源孤島化。大模型訓(xùn)練的海量參數(shù)和中間數(shù)據(jù)需要在不同芯片間頻繁交互,但傳統(tǒng)架構(gòu)中每張芯片的內(nèi)存都是獨(dú)立空間,跨芯片訪問不僅耗時(shí),還會出現(xiàn)數(shù)據(jù)不一致。

最后是生態(tài)適配成本高。不同廠商的芯片、框架、工具鏈各自為戰(zhàn),企業(yè)在部署大模型時(shí),往往需要投入大量資源進(jìn)行適配開發(fā),阻礙AI技術(shù)的規(guī)?;涞?。

面對這些痛點(diǎn),超節(jié)點(diǎn)技術(shù)應(yīng)運(yùn)而生。超節(jié)點(diǎn)的基礎(chǔ)技術(shù)特征應(yīng)包含哪些核心要素?

一是超大帶寬,可支撐大規(guī)模AI處理器間高效協(xié)同與海量數(shù)據(jù)傳輸;二是超低時(shí)延,能大幅降低跨設(shè)備通信耗時(shí),避免計(jì)算等待通信的效率損耗;三是內(nèi)存統(tǒng)一編址,實(shí)現(xiàn)超節(jié)點(diǎn)內(nèi)所有互聯(lián)設(shè)備的內(nèi)存地址全局唯一,支持設(shè)備間基于內(nèi)存語義直接訪問,提升數(shù)據(jù)交互效率。

經(jīng)過筆者對目前國內(nèi)已落地的超節(jié)點(diǎn)實(shí)踐來看,除了大帶寬、低時(shí)延能力之外,內(nèi)存統(tǒng)一編址發(fā)揮了巨大作用,在互聯(lián)網(wǎng)、運(yùn)營商等行業(yè)應(yīng)用中,極大加速了大模型訓(xùn)練及推理的效率。

作為超節(jié)點(diǎn)的核心必備能力,內(nèi)存統(tǒng)一編址實(shí)現(xiàn)了超節(jié)點(diǎn)內(nèi)所有互聯(lián)設(shè)備的內(nèi)存地址全局唯一,讓不同芯片間可基于內(nèi)存語義直接訪問數(shù)據(jù),無需經(jīng)過傳統(tǒng)“序列化-網(wǎng)絡(luò)傳輸-反序列化”的繁瑣流程。這一特性不僅徹底打破了內(nèi)存資源孤島,大幅降低跨設(shè)備數(shù)據(jù)交互的時(shí)延,更成為支撐萬億參數(shù)模型、MoE架構(gòu)及長序列任務(wù)高效運(yùn)行的關(guān)鍵技術(shù)底座。

互聯(lián)網(wǎng)廠商超節(jié)點(diǎn)實(shí)踐,大模型創(chuàng)新的算力先鋒樣本

在大模型向萬億參數(shù)、多模態(tài)方向快速迭代的行業(yè)背景下,超節(jié)點(diǎn)已成為互聯(lián)網(wǎng)企業(yè)突破AI算力瓶頸的核心選擇,其商業(yè)價(jià)值通過多個(gè)實(shí)踐案例充分顯現(xiàn)。

第一,商用成本與效率雙優(yōu)。某頭部互聯(lián)網(wǎng)企業(yè)采用超節(jié)點(diǎn)部署MoE模型分布式推理方案,依托超大帶寬、超低時(shí)延特性,以及內(nèi)存統(tǒng)一編址帶來的直接數(shù)據(jù)訪問能力,無需CPU中轉(zhuǎn)即可完成跨芯片數(shù)據(jù)交互,將單token成本壓縮40%-50%,單卡吞吐較行業(yè)平均水平提升2.4-2.8倍,成功打通MoE模型規(guī)?;逃玫年P(guān)鍵路徑。

第二,大模型訓(xùn)練效能躍升。另一互聯(lián)網(wǎng)科技公司依托超節(jié)點(diǎn)的內(nèi)存統(tǒng)一編址能力,徹底打破傳統(tǒng)集群的資源孤島限制,配合高效互聯(lián)協(xié)議,讓訓(xùn)練過程中頻繁的參數(shù)同步與數(shù)據(jù)交互無需額外轉(zhuǎn)換流程,將未掩蓋的通信耗時(shí)占比優(yōu)化至 15%,大幅提升算力利用率,高效支撐了多專家、長序列基礎(chǔ)模型的訓(xùn)練工作。

第三,技術(shù)生態(tài)靈活適配。國內(nèi)某互聯(lián)網(wǎng)平臺基于超節(jié)點(diǎn)推進(jìn)強(qiáng)化學(xué)習(xí)訓(xùn)練,內(nèi)存統(tǒng)一編址技術(shù)保障了Qwen、DeepSeek等主流模型在跨芯片協(xié)同計(jì)算時(shí)的數(shù)據(jù)一致性與傳輸效率,配合超節(jié)點(diǎn)對verl+vLLM等工具鏈的兼容能力,讓企業(yè)無需在算力適配層額外投入,得以聚焦算法創(chuàng)新,加速技術(shù)落地。

可以看出,這些來自互聯(lián)網(wǎng)行業(yè)的實(shí)踐案例,充分驗(yàn)證了超節(jié)點(diǎn)在大模型訓(xùn)推效率、成本控制、技術(shù)創(chuàng)新等方面的核心價(jià)值。作為AI基礎(chǔ)設(shè)施的新一代形態(tài),超節(jié)點(diǎn)正通過與互聯(lián)網(wǎng)廠商的深度協(xié)同,加速大模型技術(shù)從實(shí)驗(yàn)室走向產(chǎn)業(yè)實(shí)踐。

運(yùn)營商部署超節(jié)點(diǎn),從技術(shù)驗(yàn)證到規(guī)模落地的實(shí)踐樣本

在超節(jié)點(diǎn)應(yīng)用前,電信運(yùn)營商在AI大模型時(shí)代面臨著傳統(tǒng)集群難以支撐千億級參數(shù)行業(yè)大模型的訓(xùn)練需求,跨節(jié)點(diǎn)數(shù)據(jù)傳輸時(shí)延導(dǎo)致推理響應(yīng)速度不達(dá)標(biāo),制約AI和通信融合。筆者了解到多家電信運(yùn)營商已完成昇騰超節(jié)點(diǎn)部署實(shí)踐,驗(yàn)證其技術(shù)成熟度與行業(yè)適配價(jià)值。



其一,國內(nèi)某電信運(yùn)營商的基礎(chǔ)大模型項(xiàng)目,依托昇騰384超節(jié)點(diǎn)架構(gòu)優(yōu)勢,以及內(nèi)存統(tǒng)一編址帶來的高效數(shù)據(jù)交互能力,跨芯片參數(shù)同步效率顯著提升,通過機(jī)間通信合并優(yōu)化進(jìn)一步降低隨機(jī)通信量,最終實(shí)現(xiàn)訓(xùn)練性能提升20%;在集群穩(wěn)定性層面,借助算子通信預(yù)建鏈等技術(shù),將大規(guī)模集群的故障恢復(fù)時(shí)間縮短至小于13分鐘,集群可用度達(dá)99%。

其二,某運(yùn)營商智算平臺搭載昇騰超節(jié)點(diǎn),內(nèi)存統(tǒng)一編址技術(shù)讓Llama3.1-405B 模型訓(xùn)練中的海量中間數(shù)據(jù)可直接跨芯片訪問,減少了數(shù)據(jù)遷移損耗,使其算力利用率(MFU)達(dá)到43%,處于業(yè)界領(lǐng)先水平;同時(shí)通過冷熱專家遷移創(chuàng)新,解決MoE模型訓(xùn)練中熱門/冷門專家分布不均的問題,在收益區(qū)間內(nèi)實(shí)現(xiàn)性能提升7.83%。

這些實(shí)踐充分證明,昇騰超節(jié)點(diǎn)憑借在性能優(yōu)化、穩(wěn)定性保障與場景適配方面的核心優(yōu)勢,精準(zhǔn)破解了運(yùn)營商在大模型發(fā)展中的核心痛點(diǎn),為運(yùn)營商在智算競爭中構(gòu)建差異化優(yōu)勢、實(shí)現(xiàn)算力+算法+數(shù)據(jù)全棧能力升級奠定了堅(jiān)實(shí)基礎(chǔ)。

筆者觀察:為何昇騰超節(jié)點(diǎn)成為引領(lǐng)者?

看完現(xiàn)場展示,筆者更加確定所有超節(jié)點(diǎn)的落地實(shí)踐,在實(shí)際應(yīng)用中,內(nèi)存統(tǒng)一編址都是必備能力,這與部分同類超節(jié)點(diǎn)形成了鮮明對比。

市面上部分超節(jié)點(diǎn)產(chǎn)品仍采用傳統(tǒng)以太網(wǎng)方案,受限于架構(gòu)特性無法實(shí)現(xiàn)內(nèi)存統(tǒng)一編址,本質(zhì)僅是高速互聯(lián)的硬件堆疊。這類方案的數(shù)據(jù)傳輸依賴傳統(tǒng)消息通信模式,跨節(jié)點(diǎn)訪問需經(jīng)CPU中轉(zhuǎn)完成數(shù)據(jù)序列化與反序列化,不僅時(shí)延難以突破毫秒級下限,更無法支持內(nèi)存語義通信,導(dǎo)致大模型訓(xùn)練中高頻小包數(shù)據(jù)傳輸效率低下,形成難以突破的通信瓶頸。

這就像沒有統(tǒng)一門牌號的大型社區(qū),不同樓棟(對應(yīng)芯片/節(jié)點(diǎn))的住戶(數(shù)據(jù))要互通消息,得先找社區(qū)管理員(CPU)登記核實(shí)位置,再通過專門 的送信人(傳統(tǒng)通信協(xié)議)傳遞,不僅要走繁瑣流程,還容易因信息傳遞偏差耽誤時(shí)間。

而具備內(nèi)存統(tǒng)一編址能力的超節(jié)點(diǎn),就像給社區(qū)里每一戶都分配了唯一且通用的門牌號,所有住戶憑借門牌號就能上門溝通,數(shù)據(jù)在不同芯片間的訪問無需額外轉(zhuǎn)換流程,就像鄰里間即時(shí)對話般順暢,這正是大模型訓(xùn)練中打破內(nèi)存孤島、實(shí)現(xiàn)高效協(xié)同計(jì)算的關(guān)鍵所在。

因此我們認(rèn)為,超節(jié)點(diǎn)的定義除了超大帶寬和超低時(shí)延之外,“內(nèi)存統(tǒng)一編址”是必備能力。業(yè)界有聲音認(rèn)為,不能支持超節(jié)點(diǎn)域內(nèi)“內(nèi)存統(tǒng)一編址”能力的都不是超節(jié)點(diǎn)。

當(dāng)前,眾多企業(yè)紛紛布局超節(jié)點(diǎn)產(chǎn)品。筆者發(fā)現(xiàn),不同廠商的技術(shù)路線各有側(cè)重:有的主打單機(jī)柜高密度部署,有的聚焦封閉生態(tài)下的極致性能,有的側(cè)重開放架構(gòu)的兼容性。

在這些玩家中,昇騰超節(jié)點(diǎn)為何能成為全球超節(jié)點(diǎn)領(lǐng)域的引領(lǐng)者?

首先,技術(shù)架構(gòu)與工程創(chuàng)新雙領(lǐng)先。昇騰超節(jié)點(diǎn)以超大帶寬、超低時(shí)延及內(nèi)存統(tǒng)一編址三大核心能力為架構(gòu)基石,通過自研靈衢總線實(shí)現(xiàn)384卡超節(jié)點(diǎn)的緊密耦合,徹底攻克節(jié)點(diǎn)內(nèi)通信瓶頸。依托這一先進(jìn)架構(gòu),結(jié)合工程技術(shù)創(chuàng)新,打造了規(guī)模領(lǐng)先的超節(jié)點(diǎn)產(chǎn)品。

其次,生態(tài)開放性與兼容性,相比國外企業(yè)的封閉生態(tài),昇騰超節(jié)點(diǎn)的開放互聯(lián)協(xié)議更能適應(yīng)多廠商協(xié)同的產(chǎn)業(yè)需求。

最后,場景適配深度,從運(yùn)營商的算力服務(wù)到金融行業(yè)的核心業(yè)務(wù),從大模型訓(xùn)練到端側(cè)部署,昇騰超節(jié)點(diǎn)已在多領(lǐng)域形成成熟方案,展現(xiàn)出強(qiáng)大的場景適配能力。

未來隨著AI技術(shù)向更深入、更廣泛的領(lǐng)域滲透,超節(jié)點(diǎn)的應(yīng)用場景將不斷拓展。而內(nèi)存統(tǒng)一編址作為超節(jié)點(diǎn)的核心必備能力,將成為行業(yè)準(zhǔn)入的硬標(biāo)準(zhǔn)。

算力潮涌開新境,生態(tài)協(xié)同啟遠(yuǎn)航。超節(jié)點(diǎn)為AI時(shí)代的競爭提供了新賽道,而昇騰生態(tài)不僅將推動超節(jié)點(diǎn)技術(shù)不斷成熟,更會讓智能時(shí)代的紅利惠及更多行業(yè)與用戶。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中年女人主動“獻(xiàn)身”,根本不是愛,往往只有這兩個(gè)目的,太現(xiàn)實(shí)

中年女人主動“獻(xiàn)身”,根本不是愛,往往只有這兩個(gè)目的,太現(xiàn)實(shí)

熱心市民小黃
2026-03-02 09:35:25
中國電網(wǎng)砸5萬億鎖死優(yōu)勢!越南被迫限電減產(chǎn),歐洲電價(jià)暴漲10倍

中國電網(wǎng)砸5萬億鎖死優(yōu)勢!越南被迫限電減產(chǎn),歐洲電價(jià)暴漲10倍

財(cái)經(jīng)保探長
2026-02-23 19:10:05
他接受監(jiān)察調(diào)查

他接受監(jiān)察調(diào)查

錫望
2026-03-01 18:21:26
巴拿馬終于動手,李嘉誠資產(chǎn)被強(qiáng)搶,毀掉港口也不應(yīng)留給巴拿馬

巴拿馬終于動手,李嘉誠資產(chǎn)被強(qiáng)搶,毀掉港口也不應(yīng)留給巴拿馬

王新喜
2026-03-02 10:24:59
哈梅內(nèi)伊剛遇難,美媒急著下場挑唆:伊朗對中國而言根本不重要!

哈梅內(nèi)伊剛遇難,美媒急著下場挑唆:伊朗對中國而言根本不重要!

懸崖那枝花
2026-03-02 13:00:07
比亞迪:將于2026年3月5日召開顛覆性技術(shù)發(fā)布會

比亞迪:將于2026年3月5日召開顛覆性技術(shù)發(fā)布會

界面新聞
2026-03-02 13:01:10
不被任何人拿捏的頂級思維:不要回答別人的問題,要回答別人的目的

不被任何人拿捏的頂級思維:不要回答別人的問題,要回答別人的目的

古代經(jīng)典
2026-02-25 15:40:12
中國男籃翻盤僅一夜 傳來一好消息!7月集齊最強(qiáng)陣容 郭士強(qiáng)如何

中國男籃翻盤僅一夜 傳來一好消息!7月集齊最強(qiáng)陣容 郭士強(qiáng)如何

郝小小看體育
2026-03-02 00:17:15
宗馥莉又動手了!宗慶后的遺產(chǎn),一個(gè)不留

宗馥莉又動手了!宗慶后的遺產(chǎn),一個(gè)不留

大佬灼見
2026-03-02 11:56:19
“天坑被豬糞填滿”“洞口上方臭氣沖天”,重慶奉節(jié)通報(bào)

“天坑被豬糞填滿”“洞口上方臭氣沖天”,重慶奉節(jié)通報(bào)

觀察者網(wǎng)
2026-03-02 09:04:08
領(lǐng)克關(guān)掉的大燈,照亮了新能源車圈的吐槽大會

領(lǐng)克關(guān)掉的大燈,照亮了新能源車圈的吐槽大會

鈦媒體APP
2026-02-28 09:12:54
難以置信!東莞、惠州多地出臺為學(xué)生減負(fù)政策,有家長有點(diǎn)發(fā)慌了

難以置信!東莞、惠州多地出臺為學(xué)生減負(fù)政策,有家長有點(diǎn)發(fā)慌了

火山詩話
2026-03-02 06:52:54
村里最后餓死的那個(gè)人,只有九歲

村里最后餓死的那個(gè)人,只有九歲

霹靂炮
2026-02-22 20:24:41
鉆石女星困在迪拜!黃磊兩個(gè)女兒討好老好人!

鉆石女星困在迪拜!黃磊兩個(gè)女兒討好老好人!

八卦瘋叔
2026-03-02 11:47:36
成龍代言又添“受害者”:老牌空調(diào)巨頭宣布破產(chǎn)

成龍代言又添“受害者”:老牌空調(diào)巨頭宣布破產(chǎn)

帥真商業(yè)
2026-02-28 19:08:58
2026年陜西廳級第二虎:西安市委常委、統(tǒng)戰(zhàn)部部長贠笑冬被查

2026年陜西廳級第二虎:西安市委常委、統(tǒng)戰(zhàn)部部長贠笑冬被查

汲古知新
2026-03-02 12:05:05
勇士錯了?3場64分打臉灣區(qū)!科爾真不后悔嗎?

勇士錯了?3場64分打臉灣區(qū)!科爾真不后悔嗎?

籃球盛世
2026-03-02 14:07:40
美軍瞞不住了!炸航母基地,炸11億美元雷達(dá),幾十萬噸燃油被點(diǎn)燃

美軍瞞不住了!炸航母基地,炸11億美元雷達(dá),幾十萬噸燃油被點(diǎn)燃

書紀(jì)文譚
2026-03-01 23:26:27
1972年尼克松訪華,問為何“打倒美帝”,毛主席三個(gè)字輕松化解

1972年尼克松訪華,問為何“打倒美帝”,毛主席三個(gè)字輕松化解

嘆為觀止易
2026-02-03 14:09:49
曼聯(lián)殺到聯(lián)賽前三,卡里克正在瘋狂打臉曼聯(lián)的高層啊

曼聯(lián)殺到聯(lián)賽前三,卡里克正在瘋狂打臉曼聯(lián)的高層啊

越嶺尋蹤
2026-03-02 08:48:28
2026-03-02 14:31:00
黃海峰 incentive-icons
黃海峰
關(guān)注通信、終端、IT
2271文章數(shù) 991關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個(gè)深刻教訓(xùn)

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個(gè)深刻教訓(xùn)

體育要聞

卡里克主場5連勝!隊(duì)史第2人通過最大考驗(yàn)

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財(cái)經(jīng)要聞

中東局勢影響如何?十大券商策略來了

汽車要聞

預(yù)售11.28萬起 狐全新阿爾法S5標(biāo)配寧德時(shí)代

態(tài)度原創(chuàng)

數(shù)碼
本地
健康
藝術(shù)
公開課

數(shù)碼要聞

掌閱iReader Tango 2 Pro墨水屏閱讀器發(fā)布,可插SIM卡

本地新聞

津南好·四時(shí)總相宜

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

藝術(shù)要聞

2025北京青年美術(shù)作品展 | 油畫作品選刊

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版