国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

揭秘超節(jié)點(diǎn),AI算力需要“統(tǒng)一的語言” |?對(duì)話華為靈衢

0
分享至



文|白 鴿

編|王一粟

AI大模型帶動(dòng)的熱潮,也在持續(xù)地席卷算力行業(yè)。

從CPU到GPU,再到NPU,各種AI芯片逐漸成為了市場中的香餑餑。

中國AI芯片也趁此機(jī)會(huì)開始崛起。從華為、阿里、百度等大廠,到寒武紀(jì)、云天勵(lì)飛、?壁仞科技?、摩爾線程等新興企業(yè),中國AI芯片的單顆能力在不斷提升。

但是,哪怕單顆芯片能力再強(qiáng),算力也不能夠滿足大模型的需求。

尤其是隨著大模型參數(shù)的不斷翻倍,很多企業(yè)可能都會(huì)遇見的問題,就是8張卡的服務(wù)器根本跑不動(dòng),勉強(qiáng)用多臺(tái)機(jī)器拆分任務(wù),結(jié)果CPU、AI芯片、存儲(chǔ)之間“各說各話”,數(shù)據(jù)傳著傳著就“堵車”,算力損耗快到一半。



更要命的在于,不同廠商的設(shè)備像說不同方言的人:

A廠的CPU用一套協(xié)議,B廠的GPU用另一套,數(shù)據(jù)從CPU傳到GPU,得先“翻譯”,一來一回就浪費(fèi)時(shí)間;甚至同一廠商的不同設(shè)備,規(guī)模擴(kuò)大后性能也會(huì)“打折”,比如10個(gè)節(jié)點(diǎn)本應(yīng)發(fā)揮10倍算力,實(shí)際可能只到1倍,這就是行業(yè)常說的“線性度”問題。

單個(gè)芯片算力不夠用、不同設(shè)備溝通有障礙,成了整個(gè)行業(yè)的“卡脖子”難題。那么,要怎么解決這些問題,才能夠支撐大模型的需求?

眾所周知,當(dāng)單獨(dú)作戰(zhàn)打不過之時(shí),團(tuán)隊(duì)配合戰(zhàn)斗則成為了贏取戰(zhàn)爭勝利的關(guān)鍵,而中國AI算力突破算力瓶頸的一個(gè)關(guān)鍵,就是開始走團(tuán)隊(duì)?wèi)?zhàn)斗路線。

此前,華為發(fā)布了“超節(jié)點(diǎn)”架構(gòu),配套的技術(shù)則是“靈衢”(UnifiedBus)。

簡單理解兩者的關(guān)系,當(dāng)單顆芯片算力不夠用,就需要將多種算力如CPU、GPU、NPU、存力等統(tǒng)一起來干活,超節(jié)點(diǎn)架構(gòu)就是將多種算力部件整合為一個(gè)大節(jié)點(diǎn),而互聯(lián)協(xié)議則是讓這些部件能順暢溝通的規(guī)則,只有雙方相互配合,才能夠把整個(gè)算力系統(tǒng)的能力提升上去。

其中最核心的就是靈衢技術(shù),其搞出了“算力普通話”,即一套能覆蓋所有場景的統(tǒng)一協(xié)議,不管是超節(jié)點(diǎn)內(nèi)部的CPU和GPU的溝通,還是超節(jié)點(diǎn)之間的集群互聯(lián),都不用換“語言”,這就像全國都講普通話,不用到一個(gè)地方學(xué)一種方言,溝通效率自然高。

這套“普通話”還打破了兩個(gè)關(guān)鍵界限:計(jì)算機(jī)網(wǎng)絡(luò),如平時(shí)上網(wǎng)的物理層、鏈路層,以及計(jì)算機(jī)內(nèi)部架構(gòu),如內(nèi)存管理、節(jié)點(diǎn)控制等。

過去,這倆像兩個(gè)獨(dú)立的房間,數(shù)據(jù)得“開門、進(jìn)門、再開門”,而靈衢直接拆了兩者之間的“墻”,底層用網(wǎng)絡(luò)邏輯連設(shè)備,上層用架構(gòu)邏輯管資源,數(shù)據(jù)傳輸?shù)摹奥贰币幌伦幼兺〞沉恕?/p>

同時(shí),靈衢的超節(jié)點(diǎn)也不是“把部件堆一起就行”。華為專家強(qiáng)調(diào),靈衢超節(jié)點(diǎn)是“超級(jí)單一節(jié)點(diǎn)”,不是“松散的部件集合”,就像把多間小房子改成一套大平層,所有家具(CPU、GPU、NPU、內(nèi)存)都連在一條“統(tǒng)一的高速總線”上,不用再繞路,如交換機(jī),過去只是“數(shù)據(jù)中轉(zhuǎn)站”,現(xiàn)在在靈衢里成了“處理單元”,能直接參與算力協(xié)作。

基于這些突破,靈衢要實(shí)現(xiàn)四個(gè)目標(biāo),即讓不同算力“組隊(duì)干活”(提升計(jì)算性能)、系統(tǒng)出問題能快速恢復(fù)(高可用)、內(nèi)存帶寬等資源“集中共用不浪費(fèi)”(資源池化)、不同廠商部件“插進(jìn)去就能用”(組件貨架化)。

這些目標(biāo)的最終目的,都是為了讓整個(gè)算力系統(tǒng)“更高效、更靈活、更省錢”。

而華為靈衢之所以能夠?qū)崿F(xiàn)“一套通吃”,原因在于,華為從一開始就盯著“整個(gè)算力系統(tǒng)”,不是只做單個(gè)產(chǎn)品,沒有受制于老產(chǎn)品的束縛。

同時(shí),華為靈衢于2019年正式立項(xiàng),并把華為過去自研IT設(shè)備的經(jīng)驗(yàn)、技術(shù)成果,還有搞集群的工程經(jīng)驗(yàn)全部融入其中,同時(shí)還和鯤鵬、昇騰這些華為芯片一起反復(fù)測試。

基于這些實(shí)踐經(jīng)驗(yàn),“現(xiàn)在靈衢1.0已經(jīng)完成產(chǎn)品化,經(jīng)過了芯片驗(yàn)證、集群交付驗(yàn)證,是工業(yè)化級(jí)別的可靠系統(tǒng)。”華為集群計(jì)算總經(jīng)理朱照生說。


華為集群計(jì)算總經(jīng)理朱照生

同時(shí),在具體落地客戶實(shí)踐場景中,也會(huì)考慮客戶原有設(shè)備,比如客戶已有以太網(wǎng),靈衢也能直接在上面跑,不用大改基礎(chǔ)設(shè)施,還能和現(xiàn)有的應(yīng)用互通。

而為了讓更多的廠商參與進(jìn)來,華為還開放了靈衢的“全套說明書”,即從物理層到事務(wù)層的協(xié)議規(guī)范全公開,甚至找了第三方做“協(xié)議驗(yàn)證儀”。

“不管是做CPU的、做GPU的,只要按規(guī)范做,就能用靈衢,未來還能通過第三方驗(yàn)證是不是符合標(biāo)準(zhǔn)?!敝煺丈f到,“說實(shí)話,靈衢發(fā)布后,已經(jīng)有很多廠商找過來跟我們交流,這已經(jīng)超出了我們最初的預(yù)期?!碑吘?,在其預(yù)期中,可能只有2-3家頭部廠商會(huì)找過來。

業(yè)內(nèi)皆知,過去,不同廠商的協(xié)議不互通,客戶只能“綁定一家”,選擇少還貴。但現(xiàn)在靈衢開放了協(xié)議,不管是華為的競爭對(duì)手,還是中小廠商,都能基于靈衢做產(chǎn)品。

朱照生說:“我們希望先做企標(biāo),再慢慢形成團(tuán)標(biāo)、甚至國標(biāo),讓大家一起把算力基礎(chǔ)設(shè)施做好。”比如某廠商想做GPU,不用自己再搞一套協(xié)議,直接用靈衢,就能和華為的CPU、其他廠商的存儲(chǔ)兼容,大大降低了研發(fā)成本。

據(jù)靈衢系統(tǒng)架構(gòu)師介紹,在AI大模型訓(xùn)練場景,通過超節(jié)點(diǎn)互聯(lián)降低通信占比,端到端性能收益達(dá)到20%+;通算數(shù)據(jù)庫場景,通過三層池化支撐多寫多讀,TPCC提升20%。結(jié)論表明,靈衢技術(shù)特別適合高并行、高同步的負(fù)載特征場景,能為業(yè)務(wù)帶來顯著提升。

另外,當(dāng)前行業(yè)關(guān)于超節(jié)點(diǎn)是否越大越好也存在著諸多爭議。對(duì)此,朱照生的回答很坦誠:“現(xiàn)在沒人能說清‘甜點(diǎn)區(qū)’在哪,因?yàn)锳I的發(fā)展總是超出預(yù)期。我們能做的,就是把超節(jié)點(diǎn)的規(guī)模做大,給行業(yè)留足空間?!?/p>

因此,靈衢2.0作為核心技術(shù)底座,支撐華為發(fā)布兩款超大規(guī)模算力產(chǎn)品,覆蓋不同階段需求:

Atlas 950 SuperCluster(2026年Q4上市):由64個(gè)Atlas 950超節(jié)點(diǎn)組成,F(xiàn)P8算力達(dá)524 EFLOPS,規(guī)模與算力超過當(dāng)前全球最大集群xAI Colossus;

Atlas 960 SuperCluster(2027年Q4上市):百萬卡級(jí)集群,F(xiàn)P8算力2 ZFLOPS、FP4算力4 ZFLOPS,支持UBoE(靈衢推薦模式)與RoCE協(xié)議,適配未來更大規(guī)模AI訓(xùn)練、推理需求;

越大的超節(jié)點(diǎn)集群,整體算力性能越突出,以Atlas 950 SuperPoD為例,其支持8192張昇騰卡,訓(xùn)練吞吐達(dá)4.91M TPS,推理吞吐達(dá)19.6MTPS,遠(yuǎn)超前代產(chǎn)品。

“如果我們不能夠準(zhǔn)確預(yù)判未來負(fù)載模型一旦收斂于某一類模型某一個(gè)大小,我們就沒法在算力基礎(chǔ)設(shè)施層面給它設(shè)個(gè)框,如果設(shè)定那個(gè)框,那個(gè)框一定會(huì)反過來制約模型發(fā)展。”朱照生說。

當(dāng)前,我們不難發(fā)現(xiàn):算力的競爭,早已不是“單芯片誰更強(qiáng)”,而是“系統(tǒng)誰更高效”。

靈衢的價(jià)值,就在于用一套“通用語言”,把分散的算力聚合成一股力量,它或許不會(huì)馬上改變所有,但至少給行業(yè)指了一個(gè)方向:未來的計(jì)算,不該有“語言壁壘”,不該有“設(shè)備孤島”。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
杭州一小米車主新車撞人后續(xù):原因曝光,被撞者離世,車主事大了

杭州一小米車主新車撞人后續(xù):原因曝光,被撞者離世,車主事大了

白淺娛樂聊
2025-12-21 10:03:33
5月齡女嬰手術(shù)后去世,媽媽公布尸檢報(bào)告,韓紅為其發(fā)聲,寧波市衛(wèi)健委工作人員回應(yīng)

5月齡女嬰手術(shù)后去世,媽媽公布尸檢報(bào)告,韓紅為其發(fā)聲,寧波市衛(wèi)健委工作人員回應(yīng)

第一財(cái)經(jīng)資訊
2025-12-20 21:02:52
1652萬票!孫穎莎票數(shù)大爆發(fā),反超樊振東,王楚欽意外被拉開差距

1652萬票!孫穎莎票數(shù)大爆發(fā),反超樊振東,王楚欽意外被拉開差距

大秦壁虎白話體育
2025-12-21 10:21:57
越南再論中越戰(zhàn)爭:若中國五日內(nèi)不撤軍,諒山主力或遭全殲,最終結(jié)局怎樣?

越南再論中越戰(zhàn)爭:若中國五日內(nèi)不撤軍,諒山主力或遭全殲,最終結(jié)局怎樣?

孔孔說體育
2025-12-19 07:08:27
小洛熙尸檢報(bào)告:不必要的手術(shù)和未縫合手術(shù)切口,主刀醫(yī)生在謀殺

小洛熙尸檢報(bào)告:不必要的手術(shù)和未縫合手術(shù)切口,主刀醫(yī)生在謀殺

不與世俗同
2025-12-20 16:42:11
庫里28+9,次輪秀立功!勇士復(fù)仇太陽揭露5個(gè)現(xiàn)實(shí):格林該被交易

庫里28+9,次輪秀立功!勇士復(fù)仇太陽揭露5個(gè)現(xiàn)實(shí):格林該被交易

毒舌NBA
2025-12-21 12:16:18
狂砸3.9億!騎士老板怒了!NBA最貴球隊(duì)即將解體

狂砸3.9億!騎士老板怒了!NBA最貴球隊(duì)即將解體

籃球教學(xué)論壇
2025-12-21 12:08:11
倒反天罡!日本明治天皇玄孫發(fā)文稱世界上最野蠻的國家是中國

倒反天罡!日本明治天皇玄孫發(fā)文稱世界上最野蠻的國家是中國

我心縱橫天地間
2025-12-17 14:35:24
博主:申花俱樂部投資方的態(tài)度成為路易斯續(xù)約的“攔路虎”

博主:申花俱樂部投資方的態(tài)度成為路易斯續(xù)約的“攔路虎”

懂球帝
2025-12-21 09:25:09
華語樂壇,困在懷舊里

華語樂壇,困在懷舊里

虎嗅APP
2025-12-19 00:18:10
中方升級(jí)反制,日重要人物收到制裁通知,不到24小時(shí),日4字回應(yīng)

中方升級(jí)反制,日重要人物收到制裁通知,不到24小時(shí),日4字回應(yīng)

非凡觀點(diǎn)
2025-12-20 10:39:08
智商受到侮辱,美國司法部公布愛潑斯坦文件,套路太深了

智商受到侮辱,美國司法部公布愛潑斯坦文件,套路太深了

山河路口
2025-12-21 12:04:26
誰說屁股大就不能穿瑜伽褲?黃色T恤搭薄荷綠瑜伽褲,成熟有活力

誰說屁股大就不能穿瑜伽褲?黃色T恤搭薄荷綠瑜伽褲,成熟有活力

小喬古裝漢服
2025-11-12 11:46:01
長達(dá)10年,女子被丈夫下藥供陌生人性侵,人數(shù)創(chuàng)紀(jì)錄讓女子崩潰

長達(dá)10年,女子被丈夫下藥供陌生人性侵,人數(shù)創(chuàng)紀(jì)錄讓女子崩潰

干史人
2024-09-16 20:00:03
王炸開局!新機(jī)官宣:1月1日,正式發(fā)售上市!

王炸開局!新機(jī)官宣:1月1日,正式發(fā)售上市!

科技堡壘
2025-12-21 11:33:39
抖音每年三千萬中標(biāo),咪咕5年16億報(bào)價(jià)被拒絕,CBA這波操作太魔幻

抖音每年三千萬中標(biāo),咪咕5年16億報(bào)價(jià)被拒絕,CBA這波操作太魔幻

姜大叔侃球
2025-12-20 12:18:17
名記:勇士有意運(yùn)動(dòng)能力出色的中鋒,包括羅威、加福德和克拉克斯頓

名記:勇士有意運(yùn)動(dòng)能力出色的中鋒,包括羅威、加福德和克拉克斯頓

懂球帝
2025-12-21 12:35:52
全國首塊自動(dòng)駕駛牌照正式發(fā)放!

全國首塊自動(dòng)駕駛牌照正式發(fā)放!

電動(dòng)知家
2025-12-21 10:12:23
上海突發(fā)預(yù)警,全天被“壓制”!今天做這件事時(shí)務(wù)必小心,切記這一點(diǎn)

上海突發(fā)預(yù)警,全天被“壓制”!今天做這件事時(shí)務(wù)必小心,切記這一點(diǎn)

新民晚報(bào)
2025-12-21 09:22:22
2.67億美元,史上最賺錢拳擊賽落幕!網(wǎng)紅拳手杰克·保羅6回合被KO

2.67億美元,史上最賺錢拳擊賽落幕!網(wǎng)紅拳手杰克·保羅6回合被KO

體育妞世界
2025-12-20 21:45:24
2025-12-21 13:08:49
光錐智能 incentive-icons
光錐智能
來這里,看千行百業(yè)的數(shù)字化、智能化。
881文章數(shù) 138關(guān)注度
往期回顧 全部

科技要聞

生態(tài)適配已超95% 鴻蒙下一關(guān):十萬個(gè)應(yīng)用

頭條要聞

醫(yī)生被控強(qiáng)奸2名幼女案再審 其檢察官父親作無罪辯護(hù)

頭條要聞

醫(yī)生被控強(qiáng)奸2名幼女案再審 其檢察官父親作無罪辯護(hù)

體育要聞

送快船西部墊底!鵜鶘大勝步行者獲4連勝

娛樂要聞

鹿晗關(guān)曉彤戀愛期間毫不避諱?

財(cái)經(jīng)要聞

百年老店陷貼牌爭議 同仁堂必須作出取舍

汽車要聞

-30℃,標(biāo)致508L&凡爾賽C5 X冰雪"大考"

態(tài)度原創(chuàng)

健康
時(shí)尚
親子
公開課
軍事航空

這些新療法,讓化療不再那么痛苦

中年女人,冬天這么穿羽絨服、大衣,優(yōu)雅都藏在這3個(gè)細(xì)節(jié)里

親子要聞

為什么說小男孩是地球上最難養(yǎng)的生物

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

澤連斯基:前線局勢愈發(fā)艱難

無障礙瀏覽 進(jìn)入關(guān)懷版