国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

徐直軍最新重磅演講:首次公布華為三代自研芯片進(jìn)展

0
分享至



編輯重點(diǎn)君

9月18日,在華為全聯(lián)接大會(huì)2025上,華為輪值董事長(zhǎng)徐直軍發(fā)表了題為《以開創(chuàng)的超節(jié)點(diǎn)互聯(lián)技術(shù),引領(lǐng)AI基礎(chǔ)設(shè)施新范式》的主題演講。

演講回顧了過(guò)去一年AI產(chǎn)業(yè)的深刻變化,坦誠(chéng)了DeepSeek等開源模型帶來(lái)的沖擊與機(jī)遇,并重申了華為在算力領(lǐng)域的戰(zhàn)略決心。

徐直軍詳細(xì)闡述了華為如何通過(guò)開創(chuàng)性的“超節(jié)點(diǎn)+集群”計(jì)算架構(gòu),以及全新的“靈衢(UnifiedBus)”互聯(lián)協(xié)議,來(lái)構(gòu)建可持續(xù)、高性能的AI算力底座。

不僅公布了未來(lái)三年昇騰AI芯片與鯤鵬通用計(jì)算芯片的詳細(xì)路標(biāo),更發(fā)布了多款全球領(lǐng)先的超節(jié)點(diǎn)和集群產(chǎn)品,旨在引領(lǐng)AI基礎(chǔ)設(shè)施進(jìn)入一個(gè)全新的范式,為中國(guó)乃至全球的人工智能發(fā)展提供堅(jiān)實(shí)的算力支撐。

演講內(nèi)容劃重點(diǎn):

1、算力是中國(guó)AI的關(guān)鍵,堅(jiān)持硬件變現(xiàn)與開源開放。

面對(duì)產(chǎn)業(yè)變化,華為重申算力是人工智能的核心,并堅(jiān)持昇騰硬件變現(xiàn)的商業(yè)模式。承諾全面開源開放:CANN編譯器、Mind系列套件及openPangu基礎(chǔ)大模型將于2025年底前完成開源。

2、昇騰AI芯片路標(biāo):性能“一年一代,算力翻倍”。

Ascend 950系列 (2026年):分為面向推理Prefill的950PR(Q1)和面向訓(xùn)練/Decode的950DT(Q4),首次引入多種低精度數(shù)據(jù)格式,互聯(lián)帶寬達(dá)2TB/s。

Ascend 960 (2027年Q4):算力、內(nèi)存、互聯(lián)等規(guī)格相比950翻倍。

Ascend 970 (2028年Q4):算力、互聯(lián)帶寬等核心指標(biāo)再次翻倍。

3、超節(jié)點(diǎn)產(chǎn)品:AI基礎(chǔ)設(shè)施新范式。

Atlas 950超節(jié)點(diǎn) (2026年Q4):支持8192卡,F(xiàn)P8算力達(dá)8E FLOPS,性能遠(yuǎn)超同期業(yè)界產(chǎn)品。

Atlas 960超節(jié)點(diǎn) (2027年Q4):支持15488卡,F(xiàn)P8算力達(dá)30E FLOPS。

TaiShan 950通用計(jì)算超節(jié)點(diǎn) (2026年Q1):基于鯤鵬950處理器,旨在成為大型機(jī)、小型機(jī)的“終結(jié)者”。

4、開創(chuàng)“靈衢(UnifiedBus)”互聯(lián)協(xié)議:萬(wàn)卡如一機(jī)。

為解決萬(wàn)卡互聯(lián)的可靠性、帶寬和時(shí)延挑戰(zhàn),華為開創(chuàng)了全新的“靈衢(UB)”互聯(lián)協(xié)議。

核心價(jià)值是實(shí)現(xiàn)“萬(wàn)卡超節(jié)點(diǎn),一臺(tái)計(jì)算機(jī)”,并宣布開放靈衢2.0技術(shù)規(guī)范,共建生態(tài)。

5、集群產(chǎn)品:邁向百萬(wàn)卡時(shí)代。

Atlas 950 SuperCluster (2026年Q4):支持50萬(wàn)卡規(guī)模,F(xiàn)P8總算力達(dá)524 EFLOPS。

Atlas 960 SuperCluster (2027年Q4):支持百萬(wàn)卡規(guī)模,F(xiàn)P8總算力將達(dá)到2 ZFLOPS。



以下為徐直軍演講全文:

女士們、先生們,各位老朋友、新朋友,大家上午好!歡迎來(lái)參加2025年華為全聯(lián)接大會(huì),時(shí)隔一年,很高興再次與大家相聚在上海。我想大家都能感受到,過(guò)去的一年對(duì)所有AI從業(yè)者、關(guān)注者來(lái)講是記憶深刻的一年,DeepSeek橫空出世,讓全國(guó)人民過(guò)了一個(gè)快樂的AI年,也讓所有大模型訓(xùn)練者開啟了不知多少個(gè)不眠之夜,調(diào)整訓(xùn)練方式,復(fù)現(xiàn)DeepSeek結(jié)果,當(dāng)然也給我們帶來(lái)了巨大沖擊。從春節(jié)開始,到今年4月30日,經(jīng)過(guò)多團(tuán)隊(duì)的協(xié)同作戰(zhàn),終于使Ascend910B/910C的推理能力達(dá)成了客戶的基本需求。

在進(jìn)入今天的具體分享之前,請(qǐng)?jiān)试S我回顧一下去年的HC,我講到了如下幾點(diǎn):

第一、智能化的可持續(xù),首先是算力的可持續(xù);

第二、中國(guó)半導(dǎo)體制造工藝將在相當(dāng)長(zhǎng)時(shí)間處于落后狀態(tài);

第三、可持續(xù)的算力只能基于實(shí)際可獲得的芯片制造工藝;

第四、人工智能成為主導(dǎo)性算力需求,促使計(jì)算系統(tǒng)正在發(fā)生結(jié)構(gòu)性變化;

第五、開創(chuàng)計(jì)算架構(gòu),打造“超節(jié)點(diǎn)+集群”算力解決方案持續(xù)滿足算力需求。

但第五點(diǎn)沒有展開講,本來(lái)想講,但我的團(tuán)隊(duì)不同意。今天,我想利用此機(jī)會(huì),來(lái)把我去年HC沒有完成的任務(wù)完成,也算是答卷。我今天分享的主題是:“以開創(chuàng)的超節(jié)點(diǎn)互聯(lián)技術(shù),引領(lǐng)AI基礎(chǔ)設(shè)施新范式”,也是回答去年HC提到的第五點(diǎn):如何開創(chuàng)計(jì)算架構(gòu),打造 “超節(jié)點(diǎn)+集群”算力解決方案來(lái)持續(xù)滿足算力需求。

在展開今天主題前,回到DeepSeek對(duì)產(chǎn)業(yè)界、對(duì)華為的沖擊,DeepSeek開源后,我們的客戶對(duì)華為的昇騰發(fā)展指出了很多問題,也充滿了期待,并一直在給我們不斷地提建議。為此,經(jīng)過(guò)內(nèi)部的充分討論并達(dá)成共識(shí),我們于2025年8月5日在北京專門舉辦了昇騰產(chǎn)業(yè)峰會(huì),我代表華為給出了回應(yīng),在座的有的參加了,有的可能沒有參加。今天,我也利用此機(jī)會(huì)就主要的決定給大家匯報(bào)一下。主要有四點(diǎn):

一、華為堅(jiān)持昇騰硬件變現(xiàn);

二、CANN 編譯器和虛擬指令集接口開放,其它軟件全開源,CANN基于Ascend910B/C的開源開放將于2025年12月31日前完成,未來(lái)開源開放與產(chǎn)品上市同步;

三、Mind系列應(yīng)用使能套件及工具鏈全面開源,并于2025年12月31日前完成;

四、openPangu基礎(chǔ)大模型全面開源。

接下來(lái)回到今天的主題。盡管DeepSeek開創(chuàng)的模式可以大幅減少算力需求,但要走向AGI、要走向物理AI,我們認(rèn)為,算力,過(guò)去是,未來(lái)也將繼續(xù)是人工智能的關(guān)鍵,更是中國(guó)人工智能的關(guān)鍵。

算力的基礎(chǔ)是芯片,昇騰芯片是華為AI算力戰(zhàn)略的基礎(chǔ)。自2018年發(fā)布Ascend310芯片,2019年發(fā)布Ascend910芯片,到2025年,Ascend910C芯片隨著Atlas900超節(jié)點(diǎn)規(guī)模部署,為大家所熟悉。在過(guò)去幾年,客戶和伙伴們對(duì)昇騰芯片有很多訴求,對(duì)昇騰芯片也有很多期待。面向未來(lái),華為的芯片路標(biāo)是如何規(guī)劃的?想必是大家普遍關(guān)心的話題,可能也是最關(guān)心的內(nèi)容。

因此,今天,我就直入主題來(lái)介紹昇騰芯片及其路標(biāo)。我很確定地告訴大家,昇騰芯片將持續(xù)演進(jìn),為中國(guó)乃至世界的AI算力構(gòu)筑堅(jiān)固根基。

未來(lái)3年,至2028年,我們?cè)陂_發(fā)和規(guī)劃了三個(gè)系列,分別是Ascend 950系列,包括兩顆芯片:Ascend950PR和Ascend950DT,以及Ascend960、Ascend970系列,更多具體芯片還在規(guī)劃中。下面我分別介紹快要推出的和已規(guī)劃的4顆昇騰芯片。

我們正在開發(fā)、且即將推出的芯片叫Ascend950系列。我首先介紹一下Ascend 950系列的芯片架構(gòu),Ascend 950PR和Ascend 950DT共用了Ascend950 Die。與前一代昇騰芯片相比,Ascend950 在以下幾個(gè)方面實(shí)現(xiàn)了根本性提升。

第一,新增支持業(yè)界標(biāo)準(zhǔn)FP8/MXFP8/MXFP4等低數(shù)值精度數(shù)據(jù)格式,算力分別達(dá)到1P和2P,提升訓(xùn)練效率和推理吞吐。并特別支持華為自研的HiF8,在保持FP8的高效的同時(shí),精度非常接近FP16。

第二,大幅度提升了向量算力。這主要通過(guò)三個(gè)方面實(shí)現(xiàn):其一,提升向量算力占比;其二,采用創(chuàng)新的新同構(gòu)設(shè)計(jì),即支持SIMD/SIMT 雙編程模型,SIMD能夠像流水線一樣處理“大塊”向量,而SIMT便于靈活處理“碎片化”數(shù)據(jù);其三,把內(nèi)存訪問顆粒度從512字節(jié)減少到128字節(jié),內(nèi)存訪問更精細(xì),從而更好地支持了離散且不連續(xù)的內(nèi)存訪問。

第三,互聯(lián)帶寬相比Ascend910C提升了2.5倍,達(dá)到2TB/s。

第四,結(jié)合推理不同階段對(duì)于算力、內(nèi)存、訪存帶寬及推薦、訓(xùn)練的需求不同,我們自研了兩種HBM,分別是:HiBL 1.0和HiZQ 2.0。不同的自研HBM與Ascend950Die合封,分別構(gòu)成芯片Ascend950PR:面向Prefill和推薦場(chǎng)景,以及Ascend950DT:面向Decode和訓(xùn)練場(chǎng)景。下面分別介紹。

首先是我們的第一顆芯片,Ascend 950PR,主要面向推理Prefill階段和推薦業(yè)務(wù)場(chǎng)景。首先,我們發(fā)現(xiàn),隨著Agent的快速發(fā)展,輸入上下文越來(lái)越長(zhǎng),首Token輸出階段占用計(jì)算資源越來(lái)越多。其次是在電子商務(wù)、內(nèi)容平臺(tái)、社交媒體等業(yè)務(wù)應(yīng)用中,要求推薦算法具有更高的準(zhǔn)確度和更低的時(shí)延,對(duì)計(jì)算能力的需求也越來(lái)越大。推理Prefill階段和推薦算法都是計(jì)算密集型,對(duì)計(jì)算并行的能力要求高,但對(duì)內(nèi)存訪問帶寬的需求相對(duì)低。通過(guò)分級(jí)內(nèi)存解決方案,推理Prefill階段和推薦算法對(duì)本地內(nèi)存容量的需求相對(duì)也不高。Ascend950PR采用了華為自研的低成本HBM,HiBL 1.0,相比高性能、高價(jià)格的HBM3e/4e,能夠大大降低推理Prefill階段和推薦業(yè)務(wù)的投資。

這顆芯片將在2026年一季度推出,首先支持的產(chǎn)品形態(tài)是標(biāo)卡和超節(jié)點(diǎn)服務(wù)器。

接下來(lái)這一顆是Ascend 950DT,相比Ascend950PR,它更注重推理Decode階段和訓(xùn)練場(chǎng)景。由于推理Decode階段和訓(xùn)練對(duì)互聯(lián)帶寬和訪存帶寬要求高,我們開發(fā)了HiZQ 2.0,使內(nèi)存容量達(dá)到144GB,內(nèi)存訪問帶寬達(dá)到4TB/s。同時(shí)把互聯(lián)帶寬提升到了2TB/s。其次,支持了FP8/MXFP8/MXFP4/HiF8數(shù)據(jù)格式。

Ascend 950DT 將在2026年Q4推出。

第三顆是在規(guī)劃中的芯片Ascend 960。它在算力、內(nèi)存訪問帶寬、內(nèi)存容量、互聯(lián)端口數(shù)等各種規(guī)格上相比Ascend 950翻倍,大幅度提升訓(xùn)練、推理等場(chǎng)景的性能;同時(shí)還支持華為自研的HiF4數(shù)據(jù)格式。它是目前業(yè)界最優(yōu)的4bit精度實(shí)現(xiàn),能進(jìn)一步提升推理吞吐,并且比業(yè)界FP4方案的推理精度更優(yōu)。

Ascend 960將在2027年四季度推出。

最后一顆是在規(guī)劃中的Ascend 970,這顆芯片的一些規(guī)格還在討論中??傮w方向是,在各項(xiàng)指標(biāo)上大幅度升級(jí),全面升級(jí)訓(xùn)練和推理性能。目前的初步考慮是,相比Ascend 960,Ascend 970的FP4算力、FP8算力、互聯(lián)帶寬要全面翻倍,內(nèi)存訪問帶寬至少增加1.5倍。Ascend 970計(jì)劃在2028年四季度推出。大家屆時(shí)可以期待它的驚人表現(xiàn)。

這是剛才介紹的昇騰芯片的主要具體規(guī)格和路標(biāo),總體上,我們將以幾乎一年一代算力翻倍的速度,同時(shí)圍繞更易用,更多數(shù)據(jù)格式、更高帶寬等方向持續(xù)演進(jìn),持續(xù)滿足AI算力不斷增長(zhǎng)的需求??梢钥吹?,相比Ascend 910B/910C,從Ascend 950開始的主要變化包括:

引入SIMD/SIMT新同構(gòu),提升編程易用性;

支持更加豐富的數(shù)據(jù)格式,包括FP32 /HF32 /FP16/BF16/FP8/MXFP8/HiF8/MXFP4/HiF4等;

支持更大的互聯(lián)帶寬,其中950系列為2TB/s,970系列提升到4TB/s;

支持更大的算力,F(xiàn)P8算力從950系列的1PFLOPS提升到960的2PFLOPS、970的4PFLOPS;FP4算力從950的2PFLOPS提升到960的4PFLOPS、970的8PFLOPS;

內(nèi)存容量逐漸加倍,而內(nèi)存訪問帶寬將翻兩番。

有了昇騰芯片為基礎(chǔ),我們就能夠打造滿足客戶需求的算力解決方案。從大型AI算力基礎(chǔ)設(shè)施建設(shè)的技術(shù)方向看,超節(jié)點(diǎn)已經(jīng)成為主導(dǎo)性產(chǎn)品形態(tài),并正在成為AI基礎(chǔ)設(shè)施建設(shè)的新常態(tài)。超節(jié)點(diǎn)事實(shí)上就是一臺(tái)能學(xué)習(xí)、思考、推理的計(jì)算機(jī),物理上由多臺(tái)機(jī)器組成,但邏輯上以一臺(tái)機(jī)器學(xué)習(xí)、思考、推理。隨著算力需求的持續(xù)增長(zhǎng),超節(jié)點(diǎn)的規(guī)模也在持續(xù)、快速增大。

今年3月份,華為正式推出了Atlas 900超節(jié)點(diǎn),滿配支持384卡。因?yàn)槭浅?jié)點(diǎn),這384顆Ascend910C芯片,能夠像一臺(tái)計(jì)算機(jī)一樣工作,最大算力可達(dá)300PFLOPS。到目前為止,Atlas 900依然是全球算力最大的超節(jié)點(diǎn)。大家經(jīng)常聽到的CloudMatrix384超節(jié)點(diǎn),是華為云基于Atlas 900超節(jié)點(diǎn)構(gòu)建的云服務(wù)實(shí)例。Atlas 900超節(jié)點(diǎn)自上市以來(lái),已經(jīng)累計(jì)部署超過(guò)300套,服務(wù)20多個(gè)客戶,涵蓋互聯(lián)網(wǎng)、電信、制造等多個(gè)行業(yè)??梢哉f(shuō),Atlas900于2025年,開啟了華為AI超節(jié)點(diǎn)的征程。

今天,結(jié)合我們已經(jīng)推出或正在研發(fā)中的昇騰芯片,我將為大家?guī)?lái)更多超節(jié)點(diǎn)和集群產(chǎn)品。現(xiàn)在進(jìn)入今天最激動(dòng)人心的時(shí)刻,就是新產(chǎn)品發(fā)布環(huán)節(jié)。

今天我要發(fā)布的第一款產(chǎn)品,Atlas 950超節(jié)點(diǎn),基于Ascend950DT打造。

Atlas 950超節(jié)點(diǎn)支持8192張基于Ascend950DT的昇騰卡,是Atlas 900超節(jié)點(diǎn)的20多倍,我們習(xí)慣稱呼的昇騰卡,每張卡對(duì)應(yīng)一顆Ascend950DT芯片,8192張昇騰卡等同于8192顆Ascend950DT芯片。

Atlas950超節(jié)點(diǎn)滿配包括由128個(gè)計(jì)算柜、32個(gè)互聯(lián)柜,共計(jì)160個(gè)機(jī)柜組成,占地面積1000平方米左右,柜間采用全光互聯(lián)??偹懔Υ蠓忍嵘渲?,F(xiàn)P8算力達(dá)到8E FLOPS,F(xiàn)P4算力達(dá)到16E FLOPS?;ヂ?lián)帶寬達(dá)到16PB/s,這個(gè)數(shù)字意味著,Atlas 950一個(gè)產(chǎn)品的總互聯(lián)帶寬,已經(jīng)超過(guò)今天全球互聯(lián)網(wǎng)峰值帶寬的10倍有余。

Atlas 950超節(jié)點(diǎn)的上市時(shí)間是:2026年四季度。

我們很自豪的看到,Atlas 950超節(jié)點(diǎn),至少在未來(lái)多年都將保持是全球最強(qiáng)算力的超節(jié)點(diǎn),并且在各項(xiàng)主要能力上都遠(yuǎn)超業(yè)界主要產(chǎn)品。其中,相比英偉達(dá)同樣將在明年下半年上市的NVL144,Atlas 950超節(jié)點(diǎn)卡的規(guī)模是其56.8倍,總算力是其6.7倍,內(nèi)存容量是其15倍,達(dá)到1152TB;互聯(lián)帶寬是其62倍,達(dá)到16.3PB/s。即使是與英偉達(dá)計(jì)劃2027年上市的 NVL576相比,Atlas 950超節(jié)點(diǎn)在各方面依然是領(lǐng)先的。

算力、內(nèi)存容量、內(nèi)存訪問速度、互聯(lián)帶寬等能力的大幅度增強(qiáng),為大模型訓(xùn)練性能和推理吞吐帶來(lái)顯著提升。相比華為已經(jīng)推出的Atlas900超節(jié)點(diǎn),Atlas 950超節(jié)點(diǎn)的訓(xùn)練性能提升17倍,達(dá)到4.91M TPS。通過(guò)支持FP4數(shù)據(jù)格式,Atlas 950超節(jié)點(diǎn)的推理性能提升達(dá)26.5倍,達(dá)到19.6M TPS。

8192卡超節(jié)點(diǎn)并不是我們的終點(diǎn),我們還在繼續(xù)努力。我今天發(fā)布的第二款超節(jié)點(diǎn)產(chǎn)品,Atlas960超節(jié)點(diǎn)?;贏scend960,Atlas 960超節(jié)點(diǎn)最大可支持15488卡。Atlas960超節(jié)點(diǎn) 由176個(gè)計(jì)算柜,44個(gè)互聯(lián)柜,共220個(gè)機(jī)柜,占地面積約2200平方米。

Atlas960超節(jié)點(diǎn)的上市時(shí)間是:2027年四季度。

伴隨卡的規(guī)模的再次升級(jí),Atlas 960超節(jié)點(diǎn)讓我們?cè)贏I超節(jié)點(diǎn)的優(yōu)勢(shì)再度增強(qiáng)。基于Ascend960,其總算力、內(nèi)存容量、互聯(lián)帶寬在Atlas950基礎(chǔ)上再翻倍。其中,F(xiàn)P8總算力將達(dá)到30E FLOPS,而FP4總算力將達(dá)到60 EFLOPS;內(nèi)存容量達(dá)到4460TB,互聯(lián)帶寬達(dá)到34PB/s。大模型訓(xùn)練和推理的性能相比Atlas950超節(jié)點(diǎn),將分別提升3倍和4倍以上,達(dá)到15.9M TPS 和80.5M TPS。通過(guò)Atlas 950和Atlas 960,我們對(duì)于為人工智能的長(zhǎng)期快速發(fā)展提供可持續(xù)且充裕算力,充滿信心。

超節(jié)點(diǎn)已經(jīng)重新定義AI基礎(chǔ)設(shè)施的范式,但不僅僅局限于AI。在通用計(jì)算領(lǐng)域,我們同樣認(rèn)為,超節(jié)點(diǎn)技術(shù)能夠帶來(lái)很大的價(jià)值。從需求角度考慮,金融核心業(yè)務(wù)等目前仍然有部分承載在大型機(jī)和小型機(jī)之上,相比普通服務(wù)器集群,它們對(duì)服務(wù)器的性能和可靠性有更高的訴求,通用計(jì)算超節(jié)點(diǎn)在這兩點(diǎn)上正好切合需求。從技術(shù)角度考慮,超節(jié)點(diǎn)同樣可以為通算領(lǐng)域注入全新活力。

因此,鯤鵬處理器主要圍繞支持超節(jié)點(diǎn),更多核、更高性能等方向持續(xù)演進(jìn)。同時(shí),通過(guò)自研的雙線程靈犀核,使鯤鵬處理器能方便支持更多線程。

2026年Q1,我們將推出Kunpeng950處理器,包括兩個(gè)版本,分別是:96核/192線程和192核/384線程;支持通用計(jì)算超節(jié)點(diǎn);安全方面新增四層隔離,成為鯤鵬首顆實(shí)現(xiàn)機(jī)密計(jì)算的數(shù)據(jù)中心處理器。

2028年Q1,鯤鵬處理器將在芯片微架構(gòu)、先進(jìn)封裝技術(shù)等領(lǐng)域持續(xù)突破關(guān)鍵技術(shù),將再次推出兩個(gè)版本,分別是高性能版本,96核/192線程,單核性能提升50%+,主要面向AI host、數(shù)據(jù)庫(kù)等場(chǎng)景。以及高密版本,不少于256核/512線程,主要面向虛擬化、容器、大數(shù)據(jù)、數(shù)倉(cāng)等場(chǎng)景。

接下來(lái)是今天我發(fā)布的第三款產(chǎn)品:TaiShan 950超節(jié)點(diǎn),基于Kunpeng950打造,全球首個(gè)通用計(jì)算超節(jié)點(diǎn),其最大支持16節(jié)點(diǎn),32個(gè)處理器,最大內(nèi)存48TB,同時(shí)支持內(nèi)存、SSD、DPU池化。

這款產(chǎn)品不只是通用計(jì)算領(lǐng)域的一次技術(shù)升級(jí),除了大幅提升通用計(jì)算場(chǎng)景下的業(yè)務(wù)性能,還能幫助金融系統(tǒng)破解核心難題。當(dāng)前大型機(jī)、小型機(jī)替換的核心挑戰(zhàn)是數(shù)據(jù)庫(kù)分布式改造,而基于TaiShan 950超節(jié)點(diǎn)打造的 GaussDB多寫架構(gòu),無(wú)需改造,但性能提升2.9 倍,最終可平滑替代大型機(jī)、小型機(jī)上的傳統(tǒng)數(shù)據(jù)庫(kù)。TaiShan950加上分布式GaussDB將成為各類大型機(jī)、小型機(jī)的終結(jié)者,徹底取代各種應(yīng)用場(chǎng)景的大型機(jī)和小型機(jī)以及Oracle的Exadata數(shù)據(jù)庫(kù)服務(wù)器。

除了核心數(shù)據(jù)庫(kù)場(chǎng)景,TaiShan 950超節(jié)點(diǎn)在更廣泛的場(chǎng)景里,表現(xiàn)也很亮眼:比如虛擬化環(huán)境的內(nèi)存利用率提升20%,在Spark大數(shù)據(jù)場(chǎng)景,實(shí)時(shí)數(shù)據(jù)處理時(shí)間縮短30%。

TaiShan 950超節(jié)點(diǎn)上市時(shí)間是:2026年一季度,敬請(qǐng)期待。

超節(jié)點(diǎn)的價(jià)值,不僅僅體現(xiàn)在智算和通算傳統(tǒng)業(yè)務(wù)領(lǐng)域。互聯(lián)網(wǎng)產(chǎn)業(yè)廣泛應(yīng)用的推薦系統(tǒng),正在從傳統(tǒng)推薦算法向生成式推薦系統(tǒng)演進(jìn)。我們可以基于TaiShan 950和Atlas950打造成混合超節(jié)點(diǎn),為下一代生成式推薦系統(tǒng)打開全新架構(gòu)方向。

一方面,通過(guò)超大帶寬、超低時(shí)延互聯(lián)以及超大內(nèi)存,混合超節(jié)點(diǎn)構(gòu)成超大共享內(nèi)存池,支持PB級(jí)推薦系統(tǒng)嵌入表,從而支撐超高維度用戶特征;另一方面,混合超節(jié)點(diǎn)的超大AI算力,能夠支持超低時(shí)延推理和特征檢索。因此,混合超節(jié)點(diǎn)是面向下一代生成式推薦系統(tǒng)的解決方案的全新選擇。

大規(guī)模超節(jié)點(diǎn)把智算和通算的能力都推向新的高度,同時(shí)也對(duì)互聯(lián)技術(shù)提出了重大挑戰(zhàn)。華為作為聯(lián)接領(lǐng)域的領(lǐng)導(dǎo)者,當(dāng)然不懼挑戰(zhàn)。在定義和設(shè)計(jì)Atlas950、Atlas960兩個(gè)超節(jié)點(diǎn)的技術(shù)規(guī)格時(shí),我們?cè)庥龅搅嘶ヂ?lián)技術(shù)的巨大挑戰(zhàn),主要在兩個(gè)方面:

第一是如何做到長(zhǎng)距離而且高可靠。大規(guī)模超節(jié)點(diǎn)機(jī)柜多,柜間聯(lián)接距離長(zhǎng),當(dāng)前電互聯(lián)和光互聯(lián)技術(shù)都不能滿足需求。其中,當(dāng)前的電互聯(lián)技術(shù)在高速時(shí)聯(lián)接距離短,最多只能支持兩柜互聯(lián),而當(dāng)前的光互聯(lián)技術(shù)雖然可以把長(zhǎng)距離的多機(jī)柜聯(lián)接在一起,但無(wú)法滿足可靠性需求。

第二是如何做到大帶寬而且低時(shí)延。當(dāng)前跨柜卡間互聯(lián)帶寬低,和超節(jié)點(diǎn)的需求差距達(dá)5倍;跨柜的卡間時(shí)延大,當(dāng)前互聯(lián)技術(shù)最好只能做到3微秒左右,和Atlas950/960設(shè)計(jì)需求仍然有24%的差距,當(dāng)時(shí)延已經(jīng)低至2~3個(gè)微秒時(shí),已經(jīng)逼近物理極限,哪怕0.1微秒的提升,挑戰(zhàn)都很大。

華為基于三十多年構(gòu)筑的技術(shù)能力,通過(guò)系統(tǒng)性創(chuàng)新,徹底解決了當(dāng)前技術(shù)存在的問題,超標(biāo)達(dá)成Atlas950/960超節(jié)點(diǎn)的設(shè)計(jì)需求,使萬(wàn)卡超節(jié)點(diǎn)成為可能。

首先,為了解決長(zhǎng)距離且高可靠問題,我們?cè)诨ヂ?lián)協(xié)議的物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層、傳輸層等每一層都引入了高可靠機(jī)制;同時(shí)在光路引入了百納秒級(jí)故障檢測(cè)和保護(hù)切換,當(dāng)出現(xiàn)光模塊閃斷或故障時(shí),讓應(yīng)用無(wú)感;并且,我們重新定義和設(shè)計(jì)了光器件、光模塊和互聯(lián)芯片。這些創(chuàng)新和設(shè)計(jì)讓光互聯(lián)的可靠性提升100倍,且互聯(lián)距離超過(guò)200米,實(shí)現(xiàn)了電的可靠和光的距離。

其次,為了解決大帶寬且低時(shí)延問題,我們突破了多端口聚合與高密封裝技術(shù),以及平等架構(gòu)和統(tǒng)一協(xié)議,實(shí)現(xiàn)了TB級(jí)的超大帶寬,2.1微秒的超低時(shí)延。正是因?yàn)橐幌盗邢到y(tǒng)性、原創(chuàng)性的技術(shù)創(chuàng)新,我們才攻克了超節(jié)點(diǎn)互聯(lián)技術(shù),滿足了高可靠、全光互聯(lián)、高帶寬、低時(shí)延的互聯(lián)要求,讓大規(guī)模超節(jié)點(diǎn)成為了可能。

為了達(dá)成Atlas950/960超節(jié)點(diǎn)對(duì)互聯(lián)的技術(shù)要求,為了實(shí)現(xiàn)萬(wàn)卡超節(jié)點(diǎn)還能是一臺(tái)計(jì)算機(jī),華為開創(chuàng)了超節(jié)點(diǎn)架構(gòu)并開創(chuàng)了新型的互聯(lián)協(xié)議,能夠支撐萬(wàn)卡級(jí)超節(jié)點(diǎn)架構(gòu)?;谶@個(gè)互聯(lián)協(xié)議的超節(jié)點(diǎn)架構(gòu)的核心價(jià)值主張是:萬(wàn)卡超節(jié)點(diǎn),一臺(tái)計(jì)算機(jī),也就是說(shuō),通過(guò)該互聯(lián)協(xié)議,把數(shù)萬(wàn)規(guī)模的計(jì)算卡,聯(lián)接成一個(gè)超節(jié)點(diǎn),能夠像一臺(tái)計(jì)算機(jī)一樣工作、學(xué)習(xí)、思考、推理。

在技術(shù)上,我們總結(jié)認(rèn)為,萬(wàn)卡級(jí)超節(jié)點(diǎn)架構(gòu)應(yīng)該具備6大特征,分別是總線級(jí)互聯(lián)、平等協(xié)同、全量池化、協(xié)議歸一、大規(guī)模組網(wǎng)、高可用性。我們?yōu)檫@個(gè)面向超節(jié)點(diǎn)的新型互聯(lián)協(xié)議取名“靈衢”,英文名稱:UB,UnifiedBus

今天,我們正式發(fā)布靈衢、UnifiedBus,一個(gè)面向超節(jié)點(diǎn)的互聯(lián)協(xié)議。

同時(shí),我宣布,華為將開放靈衢2.0技術(shù)規(guī)范。為什么從靈衢2.0開始開放?事實(shí)上,靈衢的研究是從2019年開始的,因?yàn)楸娝苤脑颍冗M(jìn)工藝不可獲得,我們需要從多芯片上突破,希望把更多的計(jì)算資源聯(lián)接在一起。我們?nèi)×艘粋€(gè)名字叫UnifiedBus,簡(jiǎn)稱UB,中文名字“靈衢”,意味著類似九省通衢,實(shí)現(xiàn)大規(guī)模算力的聯(lián)通?;陟`衢1.0的Atlas 900超節(jié)點(diǎn)自2025年3月開始交付,至今已商用部署300多套,靈衢1.0技術(shù)得到充分驗(yàn)證。在靈衢1.0的基礎(chǔ)上,我們繼續(xù)豐富功能,優(yōu)化性能,提升規(guī)模,進(jìn)一步完善了協(xié)議,形成了靈衢2.0,前面發(fā)布的Atlas 950超節(jié)點(diǎn)就是基于靈衢2.0。

我們認(rèn)為靈衢2.0具備了開放的條件,為了更廣泛地促進(jìn)互聯(lián)技術(shù)發(fā)展和產(chǎn)業(yè)進(jìn)步,今天華為決定開放靈衢2.0技術(shù)規(guī)范,歡迎產(chǎn)業(yè)界伙伴基于靈衢研發(fā)相關(guān)產(chǎn)品和部件,共建靈衢開放生態(tài)。

我在去年HC會(huì)上強(qiáng)調(diào)過(guò),基于中國(guó)可獲得的芯片制造工藝,我們努力打造“超節(jié)點(diǎn)+集群”算力解決方案,來(lái)持續(xù)滿足算力需求。今天已經(jīng)介紹了三個(gè)超節(jié)點(diǎn)產(chǎn)品。靈衢既為超節(jié)點(diǎn)而生,是面向超節(jié)點(diǎn)的互聯(lián)協(xié)議,也是構(gòu)建算力集群產(chǎn)品最優(yōu)的互聯(lián)技術(shù)。

接下來(lái)為大家?guī)?lái)兩個(gè)集群產(chǎn)品:首先是,Atlas 950 SuperCluster 50萬(wàn)卡集群!

Atlas 950 SuperCluster集群由64個(gè)Atlas 950超節(jié)點(diǎn)互聯(lián)組成,把1萬(wàn)多機(jī)柜中的52萬(wàn)多片昇騰950DT組成為一個(gè)整體,F(xiàn)P8總算力可達(dá)524 EFLOPS。上市時(shí)間與Atlas 950超節(jié)點(diǎn)同步,即2026年Q4。

在集群組網(wǎng)上,我們同時(shí)支持UBoE與RoCE兩種協(xié)議,UBoE是把UB協(xié)議承載在以太網(wǎng)上,讓客戶能夠利用現(xiàn)有以太交換機(jī)。相比傳統(tǒng)RoCE,UBoE組網(wǎng)的靜態(tài)時(shí)延更低、可靠性更高,交換機(jī)和光模塊數(shù)量都更節(jié)省,所以,我們推薦UBoE。

這就是我們的Atlas 950 SuperCluster集群。相比當(dāng)前世界上最大的集群 xAI Colossus,規(guī)模是其2.5倍,算力是其1.3倍,是當(dāng)之無(wú)愧的全世界最強(qiáng)算力集群!無(wú)論是當(dāng)下主流的千億稠密、稀疏大模型訓(xùn)練任務(wù),還是未來(lái)的萬(wàn)億、十萬(wàn)億大模型訓(xùn)練,超節(jié)點(diǎn)集群都可以成為性能強(qiáng)悍的算力底座,高效穩(wěn)定地支持人工智能持續(xù)創(chuàng)新。

相應(yīng)的,在2027年Q4,我們還將基于Atlas 960超節(jié)點(diǎn),同步推出Atlas 960 SuperCluster,集群規(guī)模進(jìn)一步提升到百萬(wàn)卡級(jí),F(xiàn)P8總算力達(dá)到2 ZFLOPS!FP4總算力達(dá)到4 ZFLOPS。并且,它同樣也支持UBoE與RoCE兩種協(xié)議,在UBoE協(xié)議加持下,性能與可靠性同樣更優(yōu),并且,靜態(tài)時(shí)延和網(wǎng)絡(luò)無(wú)故障時(shí)間優(yōu)勢(shì)進(jìn)一步擴(kuò)大,因此繼續(xù)推薦UBoE組網(wǎng)。通過(guò)Atlas 960 SuperCluster,我們將持續(xù)加速客戶應(yīng)用創(chuàng)新,探索智能水平新高。

很高興今天給大家?guī)?lái)一系列新產(chǎn)品,我們希望和產(chǎn)業(yè)界一起,以開創(chuàng)的靈衢超節(jié)點(diǎn)互聯(lián)技術(shù),引領(lǐng)AI基礎(chǔ)設(shè)施新范式;以基于靈衢的超節(jié)點(diǎn)和集群持續(xù)滿足算力快速增長(zhǎng)的需求,推動(dòng)人工智能持續(xù)發(fā)展,創(chuàng)造更大的價(jià)值,謝謝!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
攜程吸血有多猛?全國(guó)酒店加起來(lái)都沒它賺得多

攜程吸血有多猛?全國(guó)酒店加起來(lái)都沒它賺得多

上峰視點(diǎn)
2026-01-15 11:28:05
昆明市原市長(zhǎng)劉佳晨隱瞞境外存款被公訴,曾因“全馬破4”沖上熱搜

昆明市原市長(zhǎng)劉佳晨隱瞞境外存款被公訴,曾因“全馬破4”沖上熱搜

極目新聞
2026-01-15 17:14:43
又揪出來(lái)一個(gè)巨貪,金額高達(dá)9.7億,首富夫人郝斌跨境逃亡失敗了

又揪出來(lái)一個(gè)巨貪,金額高達(dá)9.7億,首富夫人郝斌跨境逃亡失敗了

議紀(jì)史
2026-01-14 10:40:09
山姆中國(guó)一年賣 1400 億、增長(zhǎng) 40%:不是超市不行,是“靠收地租”的零售走不通了!

山姆中國(guó)一年賣 1400 億、增長(zhǎng) 40%:不是超市不行,是“靠收地租”的零售走不通了!

新浪財(cái)經(jīng)
2026-01-15 00:06:03
9歲女童倒地猝死后續(xù):舅舅曝光真相,聊天內(nèi)容流出,男方被打臉

9歲女童倒地猝死后續(xù):舅舅曝光真相,聊天內(nèi)容流出,男方被打臉

有范又有料
2026-01-15 15:26:30
剛剛,集體殺跌!300萬(wàn)手賣單,封死跌停

剛剛,集體殺跌!300萬(wàn)手賣單,封死跌停

中國(guó)基金報(bào)
2026-01-15 10:51:14
等孩子考完才敢說(shuō)的實(shí)話:初中這張牌桌,拼的從來(lái)不是孩子的智商

等孩子考完才敢說(shuō)的實(shí)話:初中這張牌桌,拼的從來(lái)不是孩子的智商

青蘋果sht
2026-01-15 06:17:00
央行出臺(tái)一批貨幣金融政策:各類結(jié)構(gòu)性貨幣政策工具降息25個(gè)基點(diǎn),商業(yè)用房購(gòu)房最低首付降至30%

央行出臺(tái)一批貨幣金融政策:各類結(jié)構(gòu)性貨幣政策工具降息25個(gè)基點(diǎn),商業(yè)用房購(gòu)房最低首付降至30%

澎湃新聞
2026-01-15 15:24:33
福建省委常委、統(tǒng)戰(zhàn)部部長(zhǎng)林文斌增補(bǔ)為福建省政協(xié)委員

福建省委常委、統(tǒng)戰(zhàn)部部長(zhǎng)林文斌增補(bǔ)為福建省政協(xié)委員

澎湃新聞
2026-01-15 15:56:30
植入電極戒毒后,一起醫(yī)療試驗(yàn)引發(fā)的“副作用”爭(zhēng)議

植入電極戒毒后,一起醫(yī)療試驗(yàn)引發(fā)的“副作用”爭(zhēng)議

新京報(bào)
2026-01-15 10:21:12
寶能姚振華實(shí)名舉報(bào),相關(guān)部門回應(yīng):舉報(bào)不實(shí),拍賣正常推進(jìn)

寶能姚振華實(shí)名舉報(bào),相關(guān)部門回應(yīng):舉報(bào)不實(shí),拍賣正常推進(jìn)

南方都市報(bào)
2026-01-15 11:04:11
笑不活!常墳鎮(zhèn)上開了肯德基,網(wǎng)友:肯德基已經(jīng)混到租這種房子了

笑不活!常墳鎮(zhèn)上開了肯德基,網(wǎng)友:肯德基已經(jīng)混到租這種房子了

火山詩(shī)話
2026-01-15 07:08:18
網(wǎng)傳追覓員工在公司群怒懟CEO俞浩:憑啥一年超過(guò)英偉達(dá)?

網(wǎng)傳追覓員工在公司群怒懟CEO俞浩:憑啥一年超過(guò)英偉達(dá)?

識(shí)礁Farsight
2026-01-15 14:39:41
加拿大總理剛到北京,又有兩國(guó)元首計(jì)劃訪華,特朗普突然喊話中國(guó)

加拿大總理剛到北京,又有兩國(guó)元首計(jì)劃訪華,特朗普突然喊話中國(guó)

時(shí)時(shí)有聊
2026-01-15 15:51:07
聶衛(wèi)平曾多次和鄧小平打橋牌:老爺子牌技比我好得多,但出錯(cuò)牌也會(huì)虛心聽取批評(píng)

聶衛(wèi)平曾多次和鄧小平打橋牌:老爺子牌技比我好得多,但出錯(cuò)牌也會(huì)虛心聽取批評(píng)

極目新聞
2026-01-15 15:09:28
回應(yīng)特朗普三點(diǎn):臺(tái)海、伊朗與所謂道德!

回應(yīng)特朗普三點(diǎn):臺(tái)海、伊朗與所謂道德!

新民周刊
2026-01-15 09:13:58
海外加價(jià)搶購(gòu),極氪9系究竟構(gòu)建了怎樣的“東方豪華”競(jìng)爭(zhēng)力?

海外加價(jià)搶購(gòu),極氪9系究竟構(gòu)建了怎樣的“東方豪華”競(jìng)爭(zhēng)力?

AutoBusiness
2026-01-15 16:50:25
利好來(lái)了!降息

利好來(lái)了!降息

中國(guó)基金報(bào)
2026-01-15 15:37:51
痛心!媽媽將女兒送回前夫家后躲藏,9歲女兒撕心裂肺找媽媽暈倒身亡!

痛心!媽媽將女兒送回前夫家后躲藏,9歲女兒撕心裂肺找媽媽暈倒身亡!

上觀新聞
2026-01-14 23:14:05
炸了!2026 網(wǎng)約車行業(yè)第一雷引爆,廣州租賃巨頭破產(chǎn),行業(yè)拐點(diǎn)已到

炸了!2026 網(wǎng)約車行業(yè)第一雷引爆,廣州租賃巨頭破產(chǎn),行業(yè)拐點(diǎn)已到

網(wǎng)約車觀察室
2026-01-15 09:53:33
2026-01-15 18:03:00
劃重點(diǎn)KeyPoints incentive-icons
劃重點(diǎn)KeyPoints
追蹤全球AI科技,記錄中國(guó)硬核崛起
145文章數(shù) 15關(guān)注度
往期回顧 全部

科技要聞

阿里最狠的一次“自我革命”

頭條要聞

賈國(guó)龍稱會(huì)爭(zhēng)取讓西貝活下來(lái) 再次強(qiáng)調(diào)西貝不是預(yù)制菜

頭條要聞

賈國(guó)龍稱會(huì)爭(zhēng)取讓西貝活下來(lái) 再次強(qiáng)調(diào)西貝不是預(yù)制菜

體育要聞

聶衛(wèi)平:黑白棋盤上的凡人棋圣

娛樂要聞

傳奇棋圣聶衛(wèi)平離世,網(wǎng)友集體悼念

財(cái)經(jīng)要聞

央行再次結(jié)構(gòu)性降息0.25個(gè)百分點(diǎn)

汽車要聞

今年推出超40款新車,BBA要把失去的奪回來(lái)

態(tài)度原創(chuàng)

健康
藝術(shù)
本地
房產(chǎn)
公開課

血常規(guī)3項(xiàng)異常,是身體警報(bào)!

藝術(shù)要聞

歷代書家集字春聯(lián)大集合

本地新聞

云游內(nèi)蒙|黃沙與碧波撞色,烏海天生會(huì)“混搭”

房產(chǎn)要聞

突發(fā)!商業(yè)用房購(gòu)房貸款最低首付比例下調(diào)至30%

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版