国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

瞄準(zhǔn)AI、圖形頂端戰(zhàn)場:摩爾線程上演國產(chǎn)GPU硬核實力路演

0
分享至

編輯|澤南、+0

這就是摩爾線程最新 AI 計算卡 S5000,單卡跑滿血 DeepSeek 大模型的成績。


每秒 1024 token 的流暢解碼,超過 4000 token 的峰值吞吐,只需要搭載在通用服務(wù)器上。這個成績不僅刷新了國產(chǎn) GPU 的推理性能記錄,更以穩(wěn)定的低延遲,驗證了其 AI 算力的高效與可用性,成為了國產(chǎn)算力的一個里程碑。

上周六,國產(chǎn) GPU 第一股摩爾線程,首次完整揭幕了其新一代統(tǒng)一計算架構(gòu) MUSA 的路線圖。從芯片設(shè)計、AI 基礎(chǔ)設(shè)施、基礎(chǔ)軟件到生態(tài),MUSA 架構(gòu)旨在為各種形態(tài)的 AI 與圖形計算需求,提供全方位的支持。


這是摩爾線程的首屆 MUSA 開發(fā)者大會,也是其上市后技術(shù)體系的首次集中亮相。在長達(dá)兩個半小時的 Keynote 中,摩爾線程創(chuàng)始人、董事長兼 CEO 張建中系統(tǒng)總結(jié)了過去五年的技術(shù)沉淀與研究成果,密集發(fā)布了一系列新產(chǎn)品,并對未來的發(fā)展路徑進(jìn)行了展望。

整場發(fā)布會,從底層架構(gòu)到具體芯片,從整機(jī)到萬卡集群,再到對具身智能、科學(xué)智能(AI4S)與量子計算等前沿領(lǐng)域的布局 —— 信息量巨大,新產(chǎn)品應(yīng)接不暇,看起來已經(jīng)有點 GTC 大會的樣子了。

技術(shù)之根

MUSA 架構(gòu)全面進(jìn)化

在這其中,最先被介紹的是其技術(shù)底座:MUSA,元計算統(tǒng)一系統(tǒng)架構(gòu)。

MUSA(Meta-computing Unified System Architecture)是摩爾線程自主研發(fā)的、覆蓋從芯片架構(gòu)、指令集、編程模型到軟件運行庫及驅(qū)動程序框架等的全棧技術(shù)體系。它是貫穿摩爾線程全棧產(chǎn)品體系的技術(shù)基石,相當(dāng)于從軟件到硬件所有產(chǎn)品的設(shè)計藍(lán)圖。

張建中將 MUSA 架構(gòu)分為幾個層級進(jìn)行了介紹,其最底層是全功能 GPU 架構(gòu),其上為硬件產(chǎn)品與系統(tǒng)(從單卡到大規(guī)模集群),最上層為全套軟件棧與開發(fā)者生態(tài)。


在硬件層,本次發(fā)布的全功能 GPU 架構(gòu)「花港」,標(biāo)志著國產(chǎn) GPU 在核心技術(shù)上的突破。


據(jù)介紹,「花港」在處理器架構(gòu)、指令集層面進(jìn)行了重新設(shè)計,旨在實現(xiàn)算力密度與能效比的飛躍。數(shù)據(jù)顯示,相比上代,花港架構(gòu)在同芯片面積下的算力密度提升了 50%,能效提升了 10 倍。

作為全功能 GPU 的載體,花港在原有 MTFP8 的技術(shù)下,新增 MTFP6/MTFP4 及混合低精度支持,支持從 FP4 到 FP64 的全精度端到端計算加速,覆蓋了從低精度 AI 推理到高精度科學(xué)計算的廣泛場景。MUSA 支持國際主流 GPU 生態(tài),同時還支持國際通用的 CPU 系統(tǒng),也支持所有國產(chǎn)主流 CPU、操作系統(tǒng)和國內(nèi)開發(fā)環(huán)境。在安全層面,該架構(gòu)采用了全硬件設(shè)計的安全保護(hù)機(jī)制,從底層筑牢了算力設(shè)施的安全防線,實現(xiàn)自主可控。

異步編程與超大規(guī)模互聯(lián)是新架構(gòu)突出的特點?!富ǜ邸箮砹诵乱淮漠惒骄幊棠P图铀偌夹g(shù),全面優(yōu)化異步編程模型、任務(wù)與資源調(diào)度機(jī)制,提升并行執(zhí)行效率,這一能力能夠大幅提升大模型訓(xùn)練的效率。與此同時,其自研 MTLink 互聯(lián)技術(shù)實現(xiàn)了速度高達(dá) 1314GB/s 的片間互聯(lián),支持十萬卡以上規(guī)模的智能集群擴(kuò)展,為未來「AI 工廠」的建設(shè)奠定了基礎(chǔ)。

圖形處理方面,新架構(gòu)集成了 AI 生成式渲染架構(gòu)(AGR),增強(qiáng)的硬件光線追蹤加速引擎(光線追蹤性能比上一代提升 50 倍),并完整支持了 DirectX 12 Ultimate,這是國產(chǎn) GPU 首次實現(xiàn)對行業(yè)頂級圖形標(biāo)準(zhǔn)的完整支持。

與硬件架構(gòu)同步升級的,是基礎(chǔ)軟件層 MUSA 5.0 軟件棧。


張建中表示,MUSA 在 AI 框架上適配 PyTorch、Paddle 并新增了對 Jax、TensorFlow 的框架支持;訓(xùn)練套件在分布式訓(xùn)練框架 Megatron、DeepSpeed 的基礎(chǔ)上,新增了強(qiáng)化學(xué)習(xí)訓(xùn)練框架 MT VeRL;推理套件在 MTT 推理引擎和深度學(xué)習(xí)模型 TensorX 的基礎(chǔ)上,新增了對 SGLang、VLLM、Ollama 等推理框架的適配。

摩爾線程特別強(qiáng)調(diào)了在計算與通訊效率上的突破:其核心計算庫在 GEMM(通用矩陣乘法)上的效率據(jù)稱超過 98%,通訊效率達(dá)到 97%,這極大地降低了開發(fā)者在國產(chǎn)硬件上移植和優(yōu)化應(yīng)用的成本。

為了降低開發(fā)門檻,加速生態(tài)建設(shè),摩爾線程計劃逐步開源一系列高性能算子庫。與此同時,摩爾線程準(zhǔn)備推出四大基礎(chǔ)庫:

  • MTX—— 兼容跨帶 GPU 硬件指令架構(gòu)、中間語言開發(fā)者可以更細(xì)力度的調(diào)度和優(yōu)化 GPU 任務(wù);

  • muLang—— 面向全功能 GPU 全場景的編程語言渲染 + AI 場景統(tǒng)一語言,易于編程;

  • MUSA-Q—— 量子計算 GPU 融合框架,可以加速量子計算模擬仿真;

  • muLitho——MUSA 光刻計算加速庫,可用于加速 OPC 光刻計算。

這些工具計劃在明年陸續(xù)提供給開發(fā)者們使用。

通過 MUSA 基礎(chǔ)架構(gòu)的升級,摩爾線程可以實現(xiàn)芯片性能指數(shù)級的提升,與此同時也大幅降低了基于國產(chǎn)芯片的開發(fā)門檻。

下一代芯片

「華山」與「廬山」

有了新架構(gòu),下個問題就是:即將量產(chǎn)的產(chǎn)品是什么?

基于「花港」架構(gòu),摩爾線程公布了未來兩款芯片的路線圖,分別對應(yīng) AI 計算與專業(yè)圖形渲染兩大主戰(zhàn)場。

在 AI 計算領(lǐng)域,新一代芯片「華山」被定位為對標(biāo)國際頂尖水平的 AI 訓(xùn)推一體芯片。張建中在演講中透露,「華山」在浮點計算能力上處于 NVIDIA Hopper 與 Blackwell 芯片產(chǎn)品之間。


除了繼承新架構(gòu)的異步編程與超大規(guī)?;ヂ?lián)能力,「華山」在訪存帶寬與容量設(shè)計上向國際一流產(chǎn)品看齊,并集成了新一代張量計算單元(TCE)。通過獨特的 TCE-PAIR 模式,兩個計算單元可共享數(shù)據(jù),從而大幅減少數(shù)據(jù)調(diào)用開銷,提升計算效率。

新一代芯片還內(nèi)置了大語言模型專用加速引擎,可對 LLM 計算的全流程進(jìn)行硬件加速。

此外,為滿足萬卡級集群需求,「華山」內(nèi)置了支持多種協(xié)議的 MTLink 4.0,單節(jié)點即支持 1024 卡高速互聯(lián)。

從列出的數(shù)據(jù)上可以看到,作為高端 AI 芯片,「華山」的綜合能力已經(jīng)躋身第一梯隊水平,已經(jīng)可以承接目前科技公司對于領(lǐng)先大模型的訓(xùn)練和推理需求。

在圖形渲染領(lǐng)域,代號「廬山」的芯片則聚焦于解決國產(chǎn)顯卡在游戲與專業(yè)設(shè)計領(lǐng)域的性能瓶頸。數(shù)據(jù)顯示,相比上一代 S80 顯卡,「廬山」的 3A 游戲性能提升了 15 倍。

摩爾線程還列出了一系列更加細(xì)化的數(shù)據(jù)提升:


在游戲玩家、專業(yè)用戶關(guān)注的圖形處理領(lǐng)域,「廬山」GPU 給出了具有說服力的水平。張建中表示:「據(jù)我們所知,廬山具有目前全球最高的幾何能力。它不光能用來打 3A 游戲,所有的 CAD、CAE 等各種應(yīng)用場景都能勝任?!?/p>

「廬山」的核心亮點在于引入了 AI 生成式渲染架構(gòu)(AGR)和第二代硬件光線追蹤引擎。除此之外,它搭載的統(tǒng)一任務(wù)引擎可以極致優(yōu)化任務(wù)分配、平衡和同步,無論計算核心數(shù)量是多少,都能實現(xiàn)高效調(diào)度,,大幅提升運行效率。

從「花港」、「華山」到「廬山」,摩爾線程提供的新一代體系,可以帶來開發(fā)者們渴望已久的一流計算速度與圖形性能。

秀出肌肉

萬卡集群正式上線

單卡性能之上,高性能芯片面向 AI 計算等場景還要面臨大規(guī)?;ヂ?lián)(Scale-up)的挑戰(zhàn)。

摩爾線程展示了當(dāng)前產(chǎn)品的落地實測數(shù)據(jù),以此回應(yīng)市場對國產(chǎn)算力「實際效能」的關(guān)切,并給大家看了看姱娥(KUAE)萬卡智算集群的樣子。


摩爾線程正式發(fā)布了夸娥萬卡智算集群(KUAE2.0)。作為中國自主研發(fā)的超級 AI 基礎(chǔ)設(shè)施,其擁有 10 Exa-FLOPS 算力,可以支持萬億參數(shù)大模型的訓(xùn)練。它在 Dense 大模型上的訓(xùn)練算力利用率(MFU)超過 60%,線性加速比達(dá)到 95%,訓(xùn)練線性擴(kuò)展效率達(dá) 95%,證明了國產(chǎn)算力已具備承接超大規(guī)模模型訓(xùn)練工程化落地的卓越穩(wěn)定性。

摩爾線程還計劃推出超級節(jié)點產(chǎn)品 MTT C256,它能夠以一層 scale up 網(wǎng)絡(luò)實現(xiàn)兩柜 256GPU 全互聯(lián),規(guī)避兩層以上網(wǎng)絡(luò)帶來的帶寬損失和額外延遲,大幅提高新型智算中心 GPU 部署密度。


當(dāng)前,AI 算力競賽正在進(jìn)入「系統(tǒng)級對決」時代,單卡性能的比拼正在轉(zhuǎn)向「系統(tǒng)升維」,通過對通信能力、負(fù)載效率的優(yōu)化,摩爾線程正在將國產(chǎn)芯片的集群效應(yīng)推向極致。

前瞻布局

不止于大模型

面向未來,摩爾線程展開了其在前沿計算場景的廣闊布局,其著眼的方面不僅在于大模型、圖形技術(shù),還包括具身智能、AI for Science、量子計算、AI For 6G 等融合創(chuàng)新計算領(lǐng)域。

它們是一系列 AI 算力生態(tài)構(gòu)建的探索與成果,也是未來國產(chǎn)算力更大規(guī)模應(yīng)用的開始。


在圖形計算方面,摩爾線程的 GPU 架構(gòu)已邁入實時光線追蹤時代,基于花港架構(gòu)的硬件光線追蹤加速引擎可實現(xiàn)對 DirectX Raytracing 的支持,同時推出的全自研的 AI 生成式渲染技術(shù) MTAGR 1.0,推動渲染技術(shù)范式從「計算」走向「生成」。

在具身智能領(lǐng)域,摩爾線程發(fā)布了 MT Lambda 具身智能仿真訓(xùn)練平臺,深度融合物理、渲染與 AI 三大引擎,其還推出了基于智能 SoC 芯片「長江」、AI 模組 MTT E300 和夸娥智算集群「端云結(jié)合」的 MT Robot 具身智能解決方案。

更多領(lǐng)域上,更廣泛的前沿融合計算探索也已展開,MUSA 生態(tài)已與合作伙伴在科學(xué)智能、量子科技、AI for 6G 等前沿交叉領(lǐng)域開展工作,持續(xù)拓展全功能 GPU 作為通用算力底座的技術(shù)邊界與應(yīng)用價值。

構(gòu)建生態(tài)

從開發(fā)者到終端產(chǎn)品

一切技術(shù)的最終價值,在于生態(tài)的繁榮。

為此,摩爾線程發(fā)起了「摩爾學(xué)院」,它專為 GPU 開發(fā)者、科研人員以及產(chǎn)業(yè)實踐者設(shè)計,提供從入門到精通的全方位培訓(xùn)。摩爾線程表示,這項行動已經(jīng)走進(jìn)了全國 200 多所高校,吸引了超過 10 萬名青年學(xué)子參與。面向更廣泛開發(fā)者的「MUSA 開發(fā)者計劃」也已啟動。

最后,還有一款普通人最容易接觸得到的產(chǎn)品。

摩爾線程在大會上發(fā)布了 AI 算力筆記本 MTT AIBOOK,作為連接開發(fā)者與 MUSA 生態(tài)的核心入口,旨在讓先進(jìn)算力賦予每一個創(chuàng)作者和開發(fā)者。


MTT AIBOOK 是專為 AI 學(xué)習(xí)與開發(fā)的個人智算平臺,搭載了自主研發(fā)的智能 SoC 芯片「長江」,其中集成了 CPU、GPU、NPU、VPU、DPU、DSP、ISP 等 IP 核心,異構(gòu) AI 算力達(dá) 50TOPS,可以在本地運行 30B 參數(shù)的端側(cè)大模型,承載多種任務(wù)負(fù)載,并配置了可以自由構(gòu)建 Agent 的「工具集」,大幅降低 AI 開發(fā)的門檻。

同時,AIBOOK 還支持 Windows 虛擬機(jī)、Linux、安卓容器以及所有國產(chǎn)操作系統(tǒng),實現(xiàn)了從芯片、驅(qū)動到開發(fā)環(huán)境的全棧整合,還內(nèi)置了智能體「小麥」及多種 AI 應(yīng)用,在保留傳統(tǒng) PC 的完整功能上,實現(xiàn)了「開箱即用」的一站式 AI 開發(fā)體驗

目前 AIBOOK 已經(jīng)可以在京東上下單,明年一月就會發(fā)貨。面向 AI 開發(fā)者和專業(yè)用戶市場,甚至 AI 愛好者與初學(xué)者也能使用。估計過不了多久,就會出現(xiàn)不少有關(guān) AIBOOK 算力本的第三方評測了。

從 MTT AIBOOK 上,我們可以看到摩爾線程打造「全功能」計算產(chǎn)品的決心,它面向所有的數(shù)據(jù)類型與應(yīng)用場景,可以解決各個領(lǐng)域、行業(yè)的不同需求,也是最普遍意義上計算能力的體現(xiàn)。

在當(dāng)前 AI 爆發(fā)與計算范式變革的關(guān)鍵節(jié)點,摩爾線程用一系列扎實的技術(shù)突破與清晰的生態(tài)藍(lán)圖,有力宣告了國產(chǎn)算力自主化的時代,正加速到來。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
雷軍高調(diào)宣布,小米YU7獲“五星健康車”認(rèn)證,遙遙領(lǐng)先

雷軍高調(diào)宣布,小米YU7獲“五星健康車”認(rèn)證,遙遙領(lǐng)先

胡嚴(yán)亂語
2025-12-20 16:16:55
豐田打響第一槍,4.6米SUV四驅(qū)配獨懸,全系全速巡航,跌至11萬!

豐田打響第一槍,4.6米SUV四驅(qū)配獨懸,全系全速巡航,跌至11萬!

藍(lán)色海邊
2025-12-22 12:09:28
莫德里奇:我心中歷史最佳球員是馬拉多納,而非梅西或C羅

莫德里奇:我心中歷史最佳球員是馬拉多納,而非梅西或C羅

懂球帝
2025-12-22 07:24:19
49年毛主席關(guān)鍵抉擇:為漢字文脈按下“暫停鍵”避免一場文字浩劫

49年毛主席關(guān)鍵抉擇:為漢字文脈按下“暫停鍵”避免一場文字浩劫

顧史
2025-12-19 19:30:46
用力過猛!51歲林志玲打扮“日系”現(xiàn)身上海,網(wǎng)友:又老又年輕

用力過猛!51歲林志玲打扮“日系”現(xiàn)身上海,網(wǎng)友:又老又年輕

東方不敗然多多
2025-12-22 01:36:36
曝柬埔寨“生命研究中心”合作名單流出,好幾家湘雅醫(yī)院?

曝柬埔寨“生命研究中心”合作名單流出,好幾家湘雅醫(yī)院?

胡嚴(yán)亂語
2025-12-22 20:13:36
烏度卡:我知道絕殺球德羅贊會單打,但伊森漏防了施羅德

烏度卡:我知道絕殺球德羅贊會單打,但伊森漏防了施羅德

懂球帝
2025-12-22 14:50:09
善惡終有報!張本智和傳出新消息,原來樊振東早就猜中了他的結(jié)局

善惡終有報!張本智和傳出新消息,原來樊振東早就猜中了他的結(jié)局

千言娛樂記
2025-12-21 22:13:03
降息,突傳大消息!突然跳水,超8.8萬人爆倉

降息,突傳大消息!突然跳水,超8.8萬人爆倉

證券時報e公司
2025-12-21 22:33:11
演員王東近況曝光!一家5口擠小房子21歲大兒子有病生活不能自理

演員王東近況曝光!一家5口擠小房子21歲大兒子有病生活不能自理

曹幺妹的小廚房
2025-12-20 14:38:20
日剛說能干擾他國衛(wèi)星,南京導(dǎo)航和美衛(wèi)星就在同一天出事,巧合?

日剛說能干擾他國衛(wèi)星,南京導(dǎo)航和美衛(wèi)星就在同一天出事,巧合?

普陀動物世界
2025-12-22 12:21:43
杜江也沒想到,大他5歲的霍思燕會憑借一條狗,輕松實現(xiàn)口碑暴漲

杜江也沒想到,大他5歲的霍思燕會憑借一條狗,輕松實現(xiàn)口碑暴漲

凡知
2025-12-22 10:45:01
當(dāng)美國海軍突襲中國貨船時,外界普遍認(rèn)為北京只能默默承受損失。

當(dāng)美國海軍突襲中國貨船時,外界普遍認(rèn)為北京只能默默承受損失。

安安說
2025-12-21 14:41:07
69歲退休大爺哭訴:跳了半年廣場舞,每月8000元退休金都不夠用了

69歲退休大爺哭訴:跳了半年廣場舞,每月8000元退休金都不夠用了

人間百態(tài)大全
2025-12-17 06:35:03
地主看兒子閑得無聊,花萬兩白銀給兒子買官,沒想到成就一代名臣

地主看兒子閑得無聊,花萬兩白銀給兒子買官,沒想到成就一代名臣

銘記歷史呀
2025-12-20 19:21:15
中國籃球的希望!20歲小將閃耀NCAA賽場,曾收到60多所D1大學(xué)邀請

中國籃球的希望!20歲小將閃耀NCAA賽場,曾收到60多所D1大學(xué)邀請

籃球?qū)^(qū)
2025-12-22 13:19:11
53年來首次,日高官求中方一件事,不到24小時,高市涉臺措辭變了

53年來首次,日高官求中方一件事,不到24小時,高市涉臺措辭變了

議紀(jì)史
2025-12-21 13:00:10
至今健在的開國將帥只剩一位,已經(jīng)102歲高齡,身體依舊健朗

至今健在的開國將帥只剩一位,已經(jīng)102歲高齡,身體依舊健朗

興趣知識
2025-12-21 01:51:04
上海外賣員勸架,撲倒持錘行兇者!反被索賠12萬?法院判了

上海外賣員勸架,撲倒持錘行兇者!反被索賠12萬?法院判了

環(huán)球網(wǎng)資訊
2025-12-22 20:00:52
決戰(zhàn)今夜!CBA焦點戰(zhàn)!22日19點30分,附上CCTV5和CCTV5+直播表

決戰(zhàn)今夜!CBA焦點戰(zhàn)!22日19點30分,附上CCTV5和CCTV5+直播表

老吳說體育
2025-12-22 10:28:05
2025-12-22 21:47:00
呼呼歷史論
呼呼歷史論
分享有趣的歷史
240文章數(shù) 15847關(guān)注度
往期回顧 全部

科技要聞

商湯聯(lián)創(chuàng)親自下場 痛批主流機(jī)器人技術(shù)大錯

頭條要聞

德鐵下單200輛中國巴士 德財長:這決定讓我十分惱火

頭條要聞

德鐵下單200輛中國巴士 德財長:這決定讓我十分惱火

體育要聞

戴琳,中國足球的反向代言人

娛樂要聞

張柏芝不再隱瞞,三胎生父早有答案?

財經(jīng)要聞

央行信用新政:為失信者提供"糾錯"通道

汽車要聞

可享88元抵2000元等多重權(quán)益 昊鉑A800開啟盲訂

態(tài)度原創(chuàng)

游戲
親子
本地
公開課
軍事航空

獵魂世界:光翎斗羅全玩法攻略!又是一個PVP大殺器的降臨!

親子要聞

AI + 護(hù)眼!我為什么選它給娃當(dāng)學(xué)習(xí)搭子~

本地新聞

云游安徽|走進(jìn)銅陵,照見三千年不滅的爐火

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

俄軍中將在汽車炸彈爆炸中身亡 現(xiàn)場畫面披露

無障礙瀏覽 進(jìn)入關(guān)懷版