国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

摩爾線程的野心,不藏了

0
分享至

金磊 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

上市后的僅15天,摩爾線程

在這次首屆、也是國(guó)內(nèi)首個(gè)聚焦全功能GPU的開發(fā)者大會(huì)中,圍繞著MUSA這個(gè)關(guān)鍵詞,新品可謂是目接不暇:

  • 一個(gè)全新GPU架構(gòu):花港,密度提升50%,效能提升10倍。
  • 三款新芯片:華山、廬山、長(zhǎng)江,分別聚焦AI訓(xùn)推一體、圖形渲染和智能SoC。
  • 一個(gè)智算集群:夸娥萬(wàn)卡集群(KUAE2.0),定位國(guó)產(chǎn)自主研發(fā)的AI Foundry。
  • 兩款硬件產(chǎn)品:專為開發(fā)者打造的AIBOOK和AICube。

這并非零散的產(chǎn)品更新,而是摩爾線程用一套從云到端、從算力到生態(tài)的組合拳。



在長(zhǎng)達(dá)2個(gè)多小時(shí)的發(fā)布中,最直觀的感受就是,摩爾線程,已經(jīng)把國(guó)產(chǎn)GPU推向了下一個(gè)level。

接下來(lái),我們就從最最最核心的全新GPU架構(gòu)花港為起點(diǎn),對(duì)此次開發(fā)者大會(huì)一探究竟。

MUSA,已經(jīng)成了全功能GPU架構(gòu)的代名詞

什么是MUSA?

它的全名叫做Meta-computing Unified System Architecture,是摩爾線程自主研發(fā)的元計(jì)算統(tǒng)一計(jì)算架構(gòu)。

該怎么理解?可以說(shuō),從芯片架構(gòu)、指令集、編程模型,到軟件運(yùn)行庫(kù)及驅(qū)動(dòng)程序框架,都屬于MUSA的范疇。



歷經(jīng)五年的發(fā)展,MUSA已經(jīng)完整定義了全功能GPU從芯片設(shè)計(jì)到軟件生態(tài)的統(tǒng)一技術(shù)標(biāo)準(zhǔn),并且支持AI計(jì)算、圖形渲染、物理仿真和科學(xué)計(jì)算、超高清視頻編解碼等全場(chǎng)景高性能計(jì)算。

若是縱觀MUSA硬件架構(gòu)這幾年的迭代,從蘇堤、春曉、曲院,再到平湖,每一次的升級(jí)都是在探索著GPU算力的邊界。



最新發(fā)布的第五代全功能GPU架構(gòu)花港,亦是如此:

  • 算力密度提升50%:在同等芯片面積下,可部署更多計(jì)算單元;
  • 計(jì)算能效提升10倍:?jiǎn)挝煌咛匦阅艽蠓鶅?yōu)化,為大規(guī)模智算集群提供綠色底座;
  • 新增FP4計(jì)算:從FP4、FP6、FP8到FP16、BF16乃至FP64,實(shí)現(xiàn)全精度端到端計(jì)算,覆蓋AI、HPC、圖形等全場(chǎng)景需求;
  • 支持十萬(wàn)卡集群:通過(guò)MTLink高速互聯(lián),為超大規(guī)模模型訓(xùn)練鋪平道路。

尤為值得關(guān)注的是,花港在低精度計(jì)算上的深度優(yōu)化。架構(gòu)新增了MTFP6/MTFP4及混合低精度端到端加速技術(shù),專為未來(lái)AI主流場(chǎng)景——低比特訓(xùn)練與推理而生。

在Attention機(jī)制的關(guān)鍵路徑上,花港原生支持矩陣rowmax計(jì)算,大幅提升混合精度SIMT吞吐量,并內(nèi)置在線量化/反量化、隨機(jī)舍入等硬件加速能力,為下一代Transformer引擎(如MT Transformer Engine)提供底層支撐。



如果說(shuō)硬件架構(gòu)是能力的基石,那么軟件棧,就是將這些能力交到開發(fā)者手中的具體路徑。

除了架構(gòu)本身之外,摩爾線程這次還同步推出了MUSA軟件棧5.0,構(gòu)建從編譯器、算子庫(kù)到AI框架的全棧工具鏈:

  • AI框架廣泛適配:除PyTorch、PaddlePaddle外,新增對(duì)JAX、TensorFlow的支持;
  • 訓(xùn)練生態(tài)擴(kuò)展:在Megatron、DeepSpeed基礎(chǔ)上,新增強(qiáng)化學(xué)習(xí)訓(xùn)練框架MT VeRL;
  • 推理引擎豐富:深度優(yōu)化自研MTT推理引擎與TensorX,同時(shí)適配SGLang、vLLM、Ollama等新興推理框架;
  • 核心庫(kù)極致優(yōu)化:muDNN實(shí)現(xiàn)GEMM/FlashAttention效率超98%,通信效率達(dá)97%,編譯器性能提升3倍;
  • 編程語(yǔ)言創(chuàng)新:推出面向AI+渲染融合的muLang,兼容TileLang、Triton,原生支持MUSA C,并發(fā)布GPU中間表示語(yǔ)言MTX 1.0,提升開發(fā)者調(diào)優(yōu)自由度。

更關(guān)鍵的是,摩爾線程宣布將逐步開源MATE算子庫(kù)、MUTLASS、MT DeepEP通信庫(kù)、KUAE云原生工具包等核心組件,向開發(fā)者社區(qū)開放底層能力,加速生態(tài)構(gòu)建。

不難看出,MUSA并未將自身定位為單純的AI加速器,而是以“全功能 GPU”為錨點(diǎn),將 AI 能力深度嵌入圖形渲染、物理仿真、量子計(jì)算等高價(jià)值垂直場(chǎng)景。

這種從通用底座向產(chǎn)業(yè)縱深延伸的架構(gòu)哲學(xué),使其區(qū)別于純粹的大模型訓(xùn)練卡,而更接近英偉達(dá) CUDA 生態(tài)早期“以通用可編程性撬動(dòng)多元應(yīng)用”的戰(zhàn)略路徑。

可以說(shuō),MUSA 不僅是中國(guó)首個(gè)全功能GPU架構(gòu),更是對(duì)“下一代 AI 基礎(chǔ)設(shè)施應(yīng)長(zhǎng)什么樣”的一次系統(tǒng)性回答——

它不再只是算力的提供者,而是多模態(tài)智能、具身智能乃至物理AI時(shí)代的關(guān)鍵使能平臺(tái)。在這一意義上,摩爾線程的架構(gòu)創(chuàng)新,已不僅是技術(shù)突破,更是對(duì)未來(lái) AI 產(chǎn)業(yè)格局的一次主動(dòng)定義。

而圍繞著新升級(jí)的MUSA,摩爾線程這次還祭出了更多重磅產(chǎn)品。

三個(gè)新芯片,兩個(gè)新硬件,一個(gè)萬(wàn)卡集群

首先基于花港架構(gòu),摩爾線程發(fā)布了兩款芯片路線。

第一個(gè)便是聚焦在AI訓(xùn)推一體及高性能計(jì)算的GPU——華山



它的核心亮點(diǎn)可以總結(jié)為:

  • 全精度支持:從 FP4 到 FP64,覆蓋低精度訓(xùn)練與高精度科學(xué)計(jì)算;
  • MTFP4/MTFP6 混合低精度加速:Attention 計(jì)算從 BF16 向 FP8 甚至 FP6 演進(jìn),大幅提升 Transformer 吞吐;
  • 硬件級(jí)優(yōu)化:原生支持矩陣 rowmax 計(jì)算、在線量化/反量化、隨機(jī)舍入等算法,專為大模型訓(xùn)練定制;
  • 新一代異步編程模型:支持常駐核函數(shù)、線程束特化,極大提升并行效率。

并且從浮點(diǎn)算力、訪存寬帶、訪存容量和高速互聯(lián)寬帶等維度來(lái)看,華山正在追趕英偉達(dá)的系列產(chǎn)品。



華山的推出,標(biāo)志著摩爾線程正式具備支撐萬(wàn)億參數(shù)大模型訓(xùn)練的能力,為國(guó)產(chǎn)AI基礎(chǔ)設(shè)施補(bǔ)上關(guān)鍵一環(huán)。

如果說(shuō)華山主攻A 算力,那么接下來(lái)的GPU——廬山,則專為圖形計(jì)算而生。



相比上一代產(chǎn)品,其AI計(jì)算性能提升了驚人的64倍,3A游戲渲染性能提升15倍。

廬山引入了AI生成式渲染架構(gòu)(AGR)和硬件光追引擎,支持DirectX 12 Ultimate。這意味著,國(guó)產(chǎn)顯卡正式邁入“光追+AI渲染”的新范式,不僅僅是“算”畫面,更是“生成”畫面。

除此之外,在端側(cè),摩爾線程還首次推出了智能SoC芯片——長(zhǎng)江



據(jù)了解,長(zhǎng)江芯片不局限于傳統(tǒng)PC或服務(wù)器,而是面向具身智能、車載、AI計(jì)算終端等端側(cè)場(chǎng)景,提供50 TOPS的異構(gòu)AI算力。

有了芯片,自然要有承載的載體。

基于長(zhǎng)江芯片,摩爾線程這次還發(fā)布了兩個(gè)非常亮眼的硬件產(chǎn)品。

首先就是MTT AIBOOK

這個(gè)算力本是專門為AI學(xué)習(xí)與開發(fā)者打造的個(gè)人智算平臺(tái),運(yùn)行基于Linux內(nèi)核的MT AIOS操作系統(tǒng),具備多系統(tǒng)兼容能力,并預(yù)置完整AI開發(fā)環(huán)境與工具鏈,通過(guò)虛擬化和安卓容器,可無(wú)縫運(yùn)行Windows與安卓應(yīng)用。

如此一來(lái),你就可以直接在上面跑大模型、搞Agent開發(fā)。



MTT AIBOOK內(nèi)置的智能體小麥,還支持2K高清渲染、本地大模型(如 MUSAChat-72B)、端側(cè) ASR/TTS,這就讓它從工具變成了超級(jí)個(gè)體助手。



并且MTT AIBOOK還預(yù)裝了智源悟界Emu3.5多模態(tài)模型,開箱即可文本生圖、編輯圖像。

除此之外,針對(duì)端側(cè)場(chǎng)景,摩爾線程還推出了桌面上的AI小鋼炮——AICube

它更像是一個(gè)高性能的AI計(jì)算魔方,讓開發(fā)者在桌面上就能輕松獲取算力支持,處理復(fù)雜的推理任務(wù)。



最后,也是最重磅的——夸娥(KUAE 2.0)萬(wàn)卡智算集群;畢竟在大模型領(lǐng)域,萬(wàn)卡集群是公認(rèn)的入場(chǎng)券。

摩爾線程此次宣布,其萬(wàn)卡集群在Dense大模型上的算力利用率(MFU)達(dá)60%,在MOE大模型上達(dá)40%,有效訓(xùn)練時(shí)間占比超過(guò)90%。

最硬核的消息是:摩爾線程已完整復(fù)現(xiàn)了DeepSeek V3的FP8訓(xùn)練。 依靠S5000對(duì)低精度算子的優(yōu)化,其自研FP8 GEMM算力利用率高達(dá)90%。



在這次大會(huì)上,摩爾線程還前瞻性地披露了下一代高密硬件基石——MTT C256超節(jié)點(diǎn)。

這款產(chǎn)品采用了計(jì)算與交換一體化的高密設(shè)計(jì)。它的出現(xiàn),是為了系統(tǒng)性地提升萬(wàn)卡集群在超大規(guī)模智算中心里的能效比和訓(xùn)練效能。



這個(gè)量級(jí)的表現(xiàn),意味著它已經(jīng)具備了正面硬剛國(guó)際主流Hopper架構(gòu)AI GPU的底氣,是未來(lái)超大規(guī)模大模型訓(xùn)練和實(shí)時(shí)推理的國(guó)產(chǎn)標(biāo)準(zhǔn)答案

并且就在最近,摩爾線程還和硅基流動(dòng)(SiliconFlow)聯(lián)合宣布:

基于硅基流動(dòng)高性能推理引擎,雙方已在摩爾線程MTT S5000 GPU上成功完成對(duì)DeepSeek V3 671B滿血版大模型的深度適配與性能驗(yàn)證。

在FP8低精度推理技術(shù)加持下,MTT S5000單卡實(shí)測(cè)Prefill吞吐突破4000 tokens/s,Decode吞吐超1000 tokens/s,創(chuàng)下當(dāng)前國(guó)產(chǎn)GPU在大模型推理場(chǎng)景下的新高。

這一成果不僅刷新了國(guó)產(chǎn)GPU的推理性能基準(zhǔn),更傳遞出一個(gè)關(guān)鍵信號(hào):

在成熟軟件工程體系(如MUSA架構(gòu)與硅基流動(dòng)推理引擎)的協(xié)同優(yōu)化下,國(guó)產(chǎn)算力硬件正從“能跑”邁向“跑得快、跑得穩(wěn)、跑得值”。

換句話說(shuō):?jiǎn)挝凰懔Φ挠行Ю寐?,正在成為?guó)產(chǎn)AI芯片真正落地的關(guān)鍵指標(biāo)——而摩爾線程,這次交出了一份高分答卷。

生態(tài),生態(tài),還得看生態(tài)

在全球算力競(jìng)爭(zhēng)日益白熱化的今天,單一芯片的性能優(yōu)勢(shì)已不足以構(gòu)建護(hù)城河。

真正的壁壘,在于軟件生態(tài)、硬件協(xié)同、場(chǎng)景落地與開發(fā)者信任的綜合能力。

摩爾線程深諳此道,它的選擇也非常清晰:不走局部替代路線,而是以“MUSA架構(gòu)+國(guó)產(chǎn)GPU+全場(chǎng)景產(chǎn)品”三位一體,打造一個(gè)從底層指令集到上層應(yīng)用的完整生態(tài)閉環(huán)。

這不僅包括人才生態(tài),更涵蓋繁榮的軟件開發(fā)生態(tài)——從自研編譯器、高性能算子庫(kù),到對(duì)主流AI框架的廣泛適配,摩爾線程提供了釋放算力所需的全套軟件工具鏈;同時(shí),通過(guò)AIBOOK等面向開發(fā)者的硬件入口產(chǎn)品,讓開發(fā)者能夠隨時(shí)隨地接入并高效使用MUSA算力,真正實(shí)現(xiàn)軟硬協(xié)同、端云一體的全場(chǎng)景覆蓋。

但除此之外,開發(fā)者和開發(fā)生態(tài),亦是其中非常關(guān)鍵的一環(huán)。

這便是摩爾線程打造摩爾學(xué)院(MUSA開發(fā)者的成長(zhǎng)平臺(tái))的原因了。



截止2025年12月,摩爾學(xué)院已經(jīng)匯聚了20萬(wàn)名開發(fā)者。摩爾線程的目標(biāo)更宏大:培育百萬(wàn)規(guī)模的MUSA開發(fā)者社群。

為此,他們不僅提供了從入門到大師的專業(yè)課程,還把根扎到了人才源頭——走進(jìn)全國(guó)200所高校。通過(guò)產(chǎn)教融合、聯(lián)合實(shí)驗(yàn)室以及“繁星計(jì)劃”等競(jìng)賽,摩爾線程正在從象牙塔開始,培養(yǎng)屬于自己的、懂國(guó)產(chǎn)架構(gòu)的原生代開發(fā)者。

這也印證了中國(guó)工程院院士、清華大學(xué)計(jì)算機(jī)系教授鄭偉民的觀點(diǎn):“國(guó)產(chǎn)GPU的關(guān)鍵,在于要從能跑到愿意用?!?/strong>

整體來(lái)看,當(dāng)別人還在爭(zhēng)論“國(guó)產(chǎn) GPU 能不能用”時(shí),摩爾線程已經(jīng)通過(guò)從軟件棧工具、硬件入口到人才培育的全鏈路布局,讓開發(fā)者問(wèn)出另一個(gè)問(wèn)題:“我的下一個(gè)項(xiàng)目,能不能全在 MUSA 生態(tài)里完成?”

這,或許才是真正的突破。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中方介入勸和,為全面鏟除電詐鋪墊!泰柬和平的解藥是什么?

中方介入勸和,為全面鏟除電詐鋪墊!泰柬和平的解藥是什么?

Ck的蜜糖
2025-12-22 01:24:13
沈陽(yáng)恒大某項(xiàng)目的商場(chǎng)竟淪為廢品回收站

沈陽(yáng)恒大某項(xiàng)目的商場(chǎng)竟淪為廢品回收站

小樣雜談
2025-12-21 19:56:49
東南亞的色情產(chǎn)業(yè)還是太離譜了

東南亞的色情產(chǎn)業(yè)還是太離譜了

求實(shí)處
2025-12-03 20:08:14
四川足球城市聯(lián)賽比賽現(xiàn)場(chǎng)發(fā)生沖突 警方介入

四川足球城市聯(lián)賽比賽現(xiàn)場(chǎng)發(fā)生沖突 警方介入

封面新聞
2025-12-21 23:37:03
鉑金漲到800元/克!買首飾的人傻了:這玩意兒咋突然比黃金還瘋?

鉑金漲到800元/克!買首飾的人傻了:這玩意兒咋突然比黃金還瘋?

白宸侃片
2025-12-20 05:31:43
遺憾!李盈瑩被解約,三方聲明公布原因,天津女排需要負(fù)責(zé)

遺憾!李盈瑩被解約,三方聲明公布原因,天津女排需要負(fù)責(zé)

跑者排球視角
2025-12-21 21:20:12
近30年評(píng)分最高的10部電視劇,《漫長(zhǎng)的季節(jié)》第6,第1實(shí)至名歸

近30年評(píng)分最高的10部電視劇,《漫長(zhǎng)的季節(jié)》第6,第1實(shí)至名歸

皮皮電影
2025-12-19 10:47:48
6國(guó)已派兵過(guò)南海,菲防長(zhǎng)通告中國(guó),不許出手,中方直接噴射水炮

6國(guó)已派兵過(guò)南海,菲防長(zhǎng)通告中國(guó),不許出手,中方直接噴射水炮

諦聽骨語(yǔ)本尊
2025-12-18 16:17:58
一高中生全飛秒近視手術(shù)成功,40天后失明,醫(yī)生指出她犯了5個(gè)錯(cuò)

一高中生全飛秒近視手術(shù)成功,40天后失明,醫(yī)生指出她犯了5個(gè)錯(cuò)

健康科普365
2025-12-19 07:20:07
吳敬中死前對(duì)余則成說(shuō):"在天津找穿藍(lán)旗袍的女人,她知道你身份"

吳敬中死前對(duì)余則成說(shuō):"在天津找穿藍(lán)旗袍的女人,她知道你身份"

飯小妹說(shuō)歷史
2025-12-16 16:38:39
78歲林子祥葉倩文武漢過(guò)早!神情呆滯顯疲憊,脖上密集斑點(diǎn)引擔(dān)憂

78歲林子祥葉倩文武漢過(guò)早!神情呆滯顯疲憊,脖上密集斑點(diǎn)引擔(dān)憂

北極熊愛看海
2025-12-20 19:50:03
28年前直播香港回歸4位主持人,2人去世1人墮落,僅一人順利退休

28年前直播香港回歸4位主持人,2人去世1人墮落,僅一人順利退休

小熊侃史
2025-12-19 11:04:51
震驚!曼聯(lián)3將即將被替換,1.2億鎊大交易正在進(jìn)行!

震驚!曼聯(lián)3將即將被替換,1.2億鎊大交易正在進(jìn)行!

奶蓋熊本熊
2025-12-21 15:02:46
死都不告訴另一半的秘密是啥?網(wǎng)友:老公的叔搭過(guò)我,要我微信

死都不告訴另一半的秘密是啥?網(wǎng)友:老公的叔搭過(guò)我,要我微信

帶你感受人間冷暖
2025-12-18 00:20:06
郵報(bào):C羅回歸曼聯(lián)的原因是門德斯用曼城制造曼聯(lián)恐慌!

郵報(bào):C羅回歸曼聯(lián)的原因是門德斯用曼城制造曼聯(lián)恐慌!

氧氣是個(gè)地鐵
2025-12-21 21:54:57
一切不利于睡覺的事,都不要做

一切不利于睡覺的事,都不要做

十點(diǎn)讀書
2025-12-20 18:38:24
中國(guó)不先使用核武器,如果美國(guó)炸毀北斗衛(wèi)星,中國(guó)是不是就輸了?

中國(guó)不先使用核武器,如果美國(guó)炸毀北斗衛(wèi)星,中國(guó)是不是就輸了?

阿校談史
2025-12-21 20:06:05
何晴頭七,61歲許亞軍現(xiàn)狀曝光,穿紅色的衛(wèi)衣,在北京心情很不錯(cuò)

何晴頭七,61歲許亞軍現(xiàn)狀曝光,穿紅色的衛(wèi)衣,在北京心情很不錯(cuò)

鋭娛之樂
2025-12-21 08:39:50
英超替補(bǔ)登場(chǎng),達(dá)倫-弗萊徹之子杰克迎來(lái)曼聯(lián)一線隊(duì)首秀

英超替補(bǔ)登場(chǎng),達(dá)倫-弗萊徹之子杰克迎來(lái)曼聯(lián)一線隊(duì)首秀

懂球帝
2025-12-22 02:23:05
又一知名企業(yè)宣布破產(chǎn),3000家門店消失,上萬(wàn)員工慘遭拋棄

又一知名企業(yè)宣布破產(chǎn),3000家門店消失,上萬(wàn)員工慘遭拋棄

知鑒明史
2025-12-21 12:30:08
2025-12-22 02:51:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11894文章數(shù) 176340關(guān)注度
往期回顧 全部

科技要聞

生態(tài)適配已超95% 鴻蒙下一關(guān):十萬(wàn)個(gè)應(yīng)用

頭條要聞

洛熙爸爸看1000遍法醫(yī)視頻找女兒 發(fā)解剖臺(tái)畫面被禁播

頭條要聞

洛熙爸爸看1000遍法醫(yī)視頻找女兒 發(fā)解剖臺(tái)畫面被禁播

體育要聞

勇士火箭贏球:王牌之外的答案?

娛樂要聞

星光大賞太尷尬!搶話擋鏡頭,場(chǎng)地還小

財(cái)經(jīng)要聞

老房子“強(qiáng)制體檢”,政府出手了

汽車要聞

-30℃,標(biāo)致508L&凡爾賽C5 X冰雪"大考"

態(tài)度原創(chuàng)

藝術(shù)
教育
時(shí)尚
數(shù)碼
本地

藝術(shù)要聞

130米!韓國(guó)最“女性化”的摩天樓,曲線美艷

教育要聞

高二學(xué)得多,不如學(xué)得對(duì)

紅色不流行了?今年最火的穿搭居然是它

數(shù)碼要聞

Linux 6.19修復(fù)希捷2TB機(jī)械硬盤導(dǎo)致SATA總線掉線問(wèn)題

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版