国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

超節(jié)點(diǎn)解構(gòu):三大核心能力齊聚,才能“像一臺(tái)計(jì)算機(jī)一樣工作”

0
分享至

在AI大模型爆發(fā)式發(fā)展的今天,“算力”成為數(shù)字經(jīng)濟(jì)時(shí)代的核心生產(chǎn)力。為了滿足日益增長的算力需求,各類計(jì)算節(jié)點(diǎn)解決方案層出不窮,“超節(jié)點(diǎn)”概念也隨之走紅。真正的超節(jié)點(diǎn)需要同時(shí)具備大帶寬、低時(shí)延和內(nèi)存統(tǒng)一編址三大核心能力,缺少任何一項(xiàng),都非革命性的架構(gòu)創(chuàng)新。

AI技術(shù)的飛速演進(jìn)和行業(yè)應(yīng)用的深度滲透,讓傳統(tǒng)計(jì)算架構(gòu)難以為繼。從技術(shù)發(fā)展來看,大模型正從單模態(tài)向全模態(tài)融合跨越,上下文長度從K級邁向兆級,訓(xùn)練數(shù)據(jù)規(guī)模從10TB升級至100TB,模型迭代速度也從半年縮短至兩個(gè)月。而在應(yīng)用端,金融風(fēng)控場景要求時(shí)延小于20毫秒,反欺詐場景更是低至10毫秒以下,Agentic AI的多任務(wù)協(xié)同則需要更低時(shí)延的計(jì)算支撐。這些需求都對算力的有效性和響應(yīng)速度提出了前所未有的挑戰(zhàn)。

與此同時(shí),摩爾定律的失效讓單一芯片的算力提升陷入瓶頸,大模型的算力需求增長速度遠(yuǎn)超芯片技術(shù)迭代速度。傳統(tǒng)解決方案是通過服務(wù)器堆疊和以太網(wǎng)聯(lián)接組建集群,但這種方式存在致命缺陷:服務(wù)器間帶寬不足、時(shí)延較大,集群規(guī)模越大,算力利用率反而越低。Meta公布的Llama 3.1訓(xùn)練數(shù)據(jù)顯示,1.6萬卡H100集群的算力利用率偏低,且在54天的訓(xùn)練中累計(jì)中斷419次,平均每3小時(shí)就出現(xiàn)一次故障。顯然,簡單的服務(wù)器堆疊已經(jīng)無法滿足AI時(shí)代的規(guī)模算力供給需求。

真正的超節(jié)點(diǎn),首先要突破傳統(tǒng)架構(gòu)的通信瓶頸,具備大帶寬和低時(shí)延的核心特性。傳統(tǒng)計(jì)算架構(gòu)中,卡間互聯(lián)依賴PCIe或以太網(wǎng),跨服務(wù)器互聯(lián)帶寬多為200~400Gb/s,時(shí)延達(dá)數(shù)十微秒,在千億參數(shù)模型訓(xùn)練中,頻繁的GB級數(shù)據(jù)通信會(huì)造成嚴(yán)重阻塞,讓計(jì)算等待通信成為性能瓶頸。而超節(jié)點(diǎn)通過高效互聯(lián)協(xié)議打破了這一限制,以昇騰384超節(jié)點(diǎn)為例,其通信帶寬較傳統(tǒng)服務(wù)器架構(gòu)提升15倍,RTT通信時(shí)延從7微秒降至3微秒,降低50%以上。



在互聯(lián)網(wǎng)行業(yè)的實(shí)際應(yīng)用中,這種優(yōu)勢尤為明顯。面對萬億參數(shù)、百萬級序列長度的基礎(chǔ)模型探索,超節(jié)點(diǎn)的大帶寬、低時(shí)延能力支持TP、CP、EP等多維并行,可將EP從8擴(kuò)展至64,把不可掩蓋的all2all通信占比從40%降至3.5%,最終實(shí)現(xiàn)3倍以上的性能提升。在強(qiáng)化學(xué)習(xí)場景中,更是能將訓(xùn)推權(quán)重傳輸時(shí)間從小時(shí)級壓縮至60秒,徹底改變了傳統(tǒng)集群的效率困境。

更關(guān)鍵的是,真正的超節(jié)點(diǎn)必須具備“內(nèi)存統(tǒng)一編址”能力,這是實(shí)現(xiàn)“One NPU/GPU”的核心前提。傳統(tǒng)集群的通信如同“寄快遞”,需要經(jīng)過打包數(shù)據(jù)、填寫地址、發(fā)送、簽收拆包等復(fù)雜流程,屬于消息語義通信;而內(nèi)存統(tǒng)一編址則像“從書架上拿書”,超節(jié)點(diǎn)內(nèi)所有設(shè)備的內(nèi)存地址全局唯一,CPU、NPU等計(jì)算單元可通過load/store指令直接訪問遠(yuǎn)端內(nèi)存資源,無需復(fù)雜的序列化和反序列化流程。

這種內(nèi)存語義通信帶來了效率的革命性提升。昇騰384超節(jié)點(diǎn)通過靈衢協(xié)議統(tǒng)一CPU、NPU內(nèi)存語義,實(shí)現(xiàn)DDR和片上內(nèi)存池化,打造出128TB的全局內(nèi)存統(tǒng)一編址空間。在推理多輪對話場景中,基于內(nèi)存語義的KV Cache池化方案支持Prefix Cache復(fù)用,在命中率100%時(shí)吞吐性能可提升3倍;在推薦系統(tǒng)中,依托內(nèi)存語義的低時(shí)延特性,能有效優(yōu)化Embedding表的小包傳輸效率。更重要的是,內(nèi)存統(tǒng)一編址支持“已存代算”,可將暫時(shí)不用的數(shù)據(jù)offload到CPU內(nèi)存,需要時(shí)通過大帶寬、低時(shí)延能力快速拉回,使NPU利用率提升10%以上。

反觀市場上一些所謂的“超節(jié)點(diǎn)”方案,大多采用PCIe+RoCE協(xié)議互聯(lián),本質(zhì)上仍是傳統(tǒng)服務(wù)器堆疊架構(gòu)。RoCE協(xié)議不支持統(tǒng)一內(nèi)存語義,跨服務(wù)器訪存需要RMDA編解碼,算子通信時(shí)延大、效率低;PCIe協(xié)議則需要經(jīng)過CPU調(diào)度,互聯(lián)帶寬遠(yuǎn)不能滿足需求,即使是PCIe6.0單lane僅64GB/s,且無法支持大規(guī)模直聯(lián)的高效訪問。這類方案不僅跨服務(wù)器帶寬、時(shí)延受限,更關(guān)鍵的是不支持內(nèi)存統(tǒng)一編址,無法實(shí)現(xiàn)全局內(nèi)存池化和設(shè)備間直接訪問,所有訪存都依賴消息語義通信,優(yōu)化空間存在天然瓶頸。

事實(shí)上,真正可商用的超節(jié)點(diǎn)是一項(xiàng)系統(tǒng)工程,需要“互聯(lián)協(xié)議+工程能力+系統(tǒng)能力”的三重支撐。除了大帶寬、低時(shí)延、內(nèi)存統(tǒng)一編址的互聯(lián)協(xié)議核心,還需要成熟的散熱技術(shù)、模塊化架構(gòu)、冗余能力、連接技術(shù)和供電能力作為工程保障,同時(shí)具備大規(guī)模部署、高可靠性和靈活切分的系統(tǒng)能力。

昇騰384超節(jié)點(diǎn)就是典型代表,其已經(jīng)實(shí)現(xiàn)了從技術(shù)概念到規(guī)模商用的完整落地,自 2025 年正式上市以來,已規(guī)模部署超550 套,廣泛應(yīng)用于互聯(lián)網(wǎng)、金融、能源、港口、制造等多個(gè)領(lǐng)域。



更重要的是,靈衢2.0協(xié)議的全面開放,為超節(jié)點(diǎn)技術(shù)的普及與生態(tài)共建注入了關(guān)鍵動(dòng)能。作為支撐真超節(jié)點(diǎn)內(nèi)存統(tǒng)一編址與高效互聯(lián)的核心協(xié)議,靈衢2.0不僅在技術(shù)上實(shí)現(xiàn)了突破,更通過全維度開放,推動(dòng)全行業(yè)形成統(tǒng)一的技術(shù)標(biāo)準(zhǔn),有望讓超節(jié)點(diǎn)加速走向規(guī);、普惠化。

值得關(guān)注的是,華為還將智能計(jì)算的超節(jié)點(diǎn)技術(shù)引入通用計(jì)算,成為全球首家發(fā)布通算超節(jié)點(diǎn)的廠商。在搜推廣場景中,超節(jié)點(diǎn)的低時(shí)延能力可幫助客戶提升廣告收入;在數(shù)據(jù)庫場景中,內(nèi)存池化能力能有效解決分庫分表等問題,為通用計(jì)算領(lǐng)域帶來新的突破。

總而言之,在AI算力需求持續(xù)爆發(fā)的當(dāng)下,超節(jié)點(diǎn)已經(jīng)成為突破算力瓶頸的核心解決方案,一個(gè)方案是否為真正的超節(jié)點(diǎn),關(guān)鍵看是否同時(shí)具備大帶寬、低時(shí)延和內(nèi)存統(tǒng)一編址三大核心能力,具備了這三點(diǎn),多個(gè)物理結(jié)算節(jié)點(diǎn)高速互聯(lián),才能“像一臺(tái)計(jì)算機(jī)一樣工作”。

可以相信,超節(jié)點(diǎn)這樣的核心技術(shù),將能為大模型發(fā)展和行業(yè)智能化轉(zhuǎn)型提供堅(jiān)實(shí)支撐,為AI大模型發(fā)展與千行百業(yè)的智能化轉(zhuǎn)型提供堅(jiān)實(shí)算力底座。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
全國人大代表張全收:只要身體硬朗、自己愿意,建議允許60歲以上農(nóng)民工繼續(xù)務(wù)工

全國人大代表張全收:只要身體硬朗、自己愿意,建議允許60歲以上農(nóng)民工繼續(xù)務(wù)工

封面新聞
2026-03-12 11:45:03
顛覆達(dá)爾文!谷歌科學(xué)家實(shí)驗(yàn)證明:智能根本不是進(jìn)化出來的,它一開始就在

顛覆達(dá)爾文!谷歌科學(xué)家實(shí)驗(yàn)證明:智能根本不是進(jìn)化出來的,它一開始就在

報(bào)人劉亞東
2026-03-11 12:25:28
凌晨在北京去世?75歲“風(fēng)流妖精”劉曉慶,給內(nèi)娛明星們上了一課

凌晨在北京去世?75歲“風(fēng)流妖精”劉曉慶,給內(nèi)娛明星們上了一課

鄉(xiāng)野小珥
2026-03-11 19:44:41
富可敵國!新世界首富身價(jià)高達(dá)5.8萬億元,相當(dāng)于12個(gè)中國首富

富可敵國!新世界首富身價(jià)高達(dá)5.8萬億元,相當(dāng)于12個(gè)中國首富

數(shù)字財(cái)經(jīng)智庫
2026-03-11 16:53:20
美國攻打伊朗是侵略嗎?先說答案:不是

美國攻打伊朗是侵略嗎?先說答案:不是

黔有虎
2026-03-12 19:14:48
法院600萬元拍掛一輛布加迪威航跑車,強(qiáng)調(diào)不得上路行駛引熱議,該車曾上京牌,全球限量僅8臺(tái)

法院600萬元拍掛一輛布加迪威航跑車,強(qiáng)調(diào)不得上路行駛引熱議,該車曾上京牌,全球限量僅8臺(tái)

極目新聞
2026-03-12 17:32:24
日本部署遠(yuǎn)程導(dǎo)彈,目標(biāo)鎖定上海?不到24小時(shí),中方發(fā)出終極警告

日本部署遠(yuǎn)程導(dǎo)彈,目標(biāo)鎖定上海?不到24小時(shí),中方發(fā)出終極警告

荷蘭豆愛健康
2026-03-12 15:34:55
39歲山西網(wǎng)紅“王炸姐”直播時(shí)突然大喊“難受”,腦干出血送醫(yī)搶救仍不幸離世,義工協(xié)會(huì)會(huì)長:她參加公益活動(dòng)已有七八年

39歲山西網(wǎng)紅“王炸姐”直播時(shí)突然大喊“難受”,腦干出血送醫(yī)搶救仍不幸離世,義工協(xié)會(huì)會(huì)長:她參加公益活動(dòng)已有七八年

極目新聞
2026-03-12 10:33:46
誰把“腐敗”帶到了香港金融圈?

誰把“腐敗”帶到了香港金融圈?

融通天下
2026-03-12 20:38:36
揚(yáng)州一女子車禍被打后續(xù):長相曝光,人無賴嘴惡毒,全家受到輿論

揚(yáng)州一女子車禍被打后續(xù):長相曝光,人無賴嘴惡毒,全家受到輿論

奇思妙想草葉君
2026-03-11 22:56:10
伊朗挨揍后的品行表現(xiàn),暴露了它為什么會(huì)挨揍

伊朗挨揍后的品行表現(xiàn),暴露了它為什么會(huì)挨揍

常識群
2026-03-12 13:43:27
巴拿馬媒體發(fā)出警告,中資撤離或重創(chuàng)經(jīng)濟(jì),金融界批巴政府魯莽

巴拿馬媒體發(fā)出警告,中資撤離或重創(chuàng)經(jīng)濟(jì),金融界批巴政府魯莽

諦聽骨語本尊
2026-03-12 18:10:38
震驚!一網(wǎng)友稱到40多歲玩膩了,出去花錢也沒爽點(diǎn),內(nèi)心一潭死水

震驚!一網(wǎng)友稱到40多歲玩膩了,出去花錢也沒爽點(diǎn),內(nèi)心一潭死水

火山詩話
2026-03-12 07:06:51
中國至朝鮮國際旅客列車抵達(dá)平壤

中國至朝鮮國際旅客列車抵達(dá)平壤

新華社
2026-03-12 17:09:04
一個(gè)被我們忽視了20年的碳水,正在悄悄救人的脂肪肝

一個(gè)被我們忽視了20年的碳水,正在悄悄救人的脂肪肝

富貴說
2026-03-10 23:38:35
河村勇輝:楊瀚森幾乎無所不能,他天賦滿滿擁有光明的未來

河村勇輝:楊瀚森幾乎無所不能,他天賦滿滿擁有光明的未來

懂球帝
2026-03-12 14:58:06
世界第7輸給了世界第21!亞洲霸主制造大冷門:沖擊世界杯懸了?

世界第7輸給了世界第21!亞洲霸主制造大冷門:沖擊世界杯懸了?

萌蘭聊個(gè)球
2026-03-12 08:32:59
50萬負(fù)債逼瘋上海土著女生,該如何翻身?評論區(qū)上海網(wǎng)友炸鍋了

50萬負(fù)債逼瘋上海土著女生,該如何翻身?評論區(qū)上海網(wǎng)友炸鍋了

火山詩話
2026-03-12 15:25:36
鄭薇淘汰的人,被宮魯鳴重用當(dāng)隊(duì)長,半場0分,球迷:又菜又裝!

鄭薇淘汰的人,被宮魯鳴重用當(dāng)隊(duì)長,半場0分,球迷:又菜又裝!

我就是一個(gè)說球的
2026-03-12 22:18:36
高市早苗宣布:不管國際油價(jià)怎么變,日本油價(jià)將鎖定在170日元左右

高市早苗宣布:不管國際油價(jià)怎么變,日本油價(jià)將鎖定在170日元左右

風(fēng)向觀察
2026-03-12 16:00:02
2026-03-13 02:40:49
閆躍龍 incentive-icons
閆躍龍
剖析互聯(lián)網(wǎng)+帶來的行業(yè)變局
1562文章數(shù) 1192關(guān)注度
往期回顧 全部

科技要聞

當(dāng)養(yǎng)蝦人開始卸載,大廠的戰(zhàn)爭才真正開始

頭條要聞

伊朗:特朗普幾條推文結(jié)束不了戰(zhàn)爭

頭條要聞

伊朗:特朗普幾條推文結(jié)束不了戰(zhàn)爭

體育要聞

建議將“出球型門將”納入反詐app

娛樂要聞

貝克漢姆全家給27歲大布送生日祝福

財(cái)經(jīng)要聞

盧鋒:從特朗普團(tuán)隊(duì)群演看時(shí)代變局

汽車要聞

大眾2025財(cái)報(bào):轉(zhuǎn)型雖有陣痛 "大象"已然起跑

態(tài)度原創(chuàng)

旅游
數(shù)碼
游戲
教育
本地

旅游要聞

春假去哪玩?南京文旅向長三角家庭發(fā)出“串門”邀約

數(shù)碼要聞

時(shí)隔四年!小米筆記本Pro 14終于來了:小米首款高端輕薄本 暢玩3A大作

《Apex英雄》“高達(dá)”聯(lián)動(dòng)訪談:尊敬原著,貼合游戲"/> 主站 商城 論壇 自運(yùn)營 登錄 注冊 《Apex英雄》“高達(dá)”聯(lián)動(dòng)訪談:尊敬原著,貼合游戲 ...

教育要聞

“哈佛老師能穿成這樣?”老人吹噓一家高學(xué)歷,被網(wǎng)友一眼識破

本地新聞

坐標(biāo)北京,過敏季反向遷徒

無障礙瀏覽 進(jìn)入關(guān)懷版