国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

單卡1000 TFLOPS!摩爾線程旗艦級計算卡首曝,性能逼近Blackwell

0
分享至



摩爾線程MTT S5000實現(xiàn)了對GLM-5的Day0“發(fā)布即適配”。

在國產(chǎn)AI算力領(lǐng)域,硬件性能的堆疊往往只是入場券,而軟硬協(xié)同的生態(tài)適配才是決定勝負的關(guān)鍵。隨著智譜AI最新一代“國模頂流”GLM-5的發(fā)布,這一Coding能力位居全球開源第一、總榜第四的模型迅速引發(fā)了行業(yè)熱議。

與此同時,摩爾線程宣布其AI旗艦級計算卡MTT S5000實現(xiàn)對GLM-5的Day0“發(fā)布即適配”,并首次披露了硬件性能參數(shù),不僅單卡算力1000 TFLOPS,并提供原生FP8支持,在顯存容量、互聯(lián)帶寬上也與英偉達H100對標。從2024年推出至今,這款專為訓推一體設(shè)計的全功能GPU智算卡,不僅在紙面參數(shù)上對標國際主流產(chǎn)品,更在智源研究院、硅基流動等頭部機構(gòu)的實戰(zhàn)檢驗中,展現(xiàn)出挑戰(zhàn)英偉達高端算力的統(tǒng)治力。



摩爾線程究竟做對了什么,使其能夠從GLM-4.6一路無縫銜接到GLM-5,讓“零時差”適配成為國產(chǎn)算力的常態(tài)?

生態(tài)的飛躍,GLM-5“Day-0”適配背后的全棧協(xié)同

此次GLM-5發(fā)布即適配的背后,是摩爾線程軟硬協(xié)同技術(shù)路線的集中爆發(fā)。作為定位Agentic Engineering的旗艦模型,GLM-5相較上一代性能提升20%,對長序列推理和復雜系統(tǒng)工程能力提出了極高要求。MTT S5000憑借充沛的算力儲備與對稀疏Attention的架構(gòu)級支持,在大規(guī)模上下文處理中依然保持了高吞吐與低延遲,完美承接了GLM-5在長程Agent任務中的計算需求。

更關(guān)鍵的是,MUSA軟件棧的敏捷性成為了實現(xiàn)“Day-0”適配的勝負手。基于MUSA架構(gòu)的TileLang原生算子單元測試覆蓋率已超過80%,使得絕大多數(shù)通用算子可直接復用,極大降低了移植成本。

通過高效算子融合及框架極致優(yōu)化,MTT S5000在GLM-5的運行中展現(xiàn)了極低的首字延遲(TTFT)和流暢的生成體驗,特別是在函數(shù)補全、漏洞檢測等Coding核心場景中表現(xiàn)優(yōu)異。



硬實力的底氣,S5000性能逼近Blackwell

MTT S5000性能的首次全面曝光,揭示了國產(chǎn)GPU在架構(gòu)設(shè)計與集群擴展上的成熟度。作為摩爾線程第四代MUSA架構(gòu)“平湖”的集大成者,S5000在單卡規(guī)格上能力接近國際一流水平,搭載80GB顯存,顯存帶寬高達1.6TB/s,卡間互聯(lián)帶寬達到784GB/s,單卡FP8算力更是飆升至1000 TFLOPS,在顯存、卡間互聯(lián)、單卡算力上與英偉達H100基本一致。



此外,MTT S5000對FP8到FP64全精度計算的完整支持,特別是硬件級FP8 Tensor Core的引入,成為了其性能躍升的核心引擎。據(jù)接近測試項目的行業(yè)人士透露,MTT S5000在產(chǎn)品精度層面已超越H100,技術(shù)特性更逼近英偉達下一代Blackwell架構(gòu)。



來自互聯(lián)網(wǎng)廠商場景的實測反饋,進一步印證了其在算力上的優(yōu)勢。數(shù)據(jù)顯示,在典型端到端推理及訓練任務中,MTT S5000的性能約為競品H20的2.5倍。分析指出,這主要得益于其高達1000 TFLOPS的單卡算力,在絕大多數(shù)計算密集型場景中,該卡不僅能提供更強勁的算力輸出,也在整體性價比上展現(xiàn)出顯著優(yōu)勢。

基于S5000構(gòu)建的“夸娥”萬卡集群,其浮點運算能力已達10Exa-Flops級別,標志著國產(chǎn)算力在超大規(guī)模集群層面邁入了世界前列。在該集群的實測中,S5000展現(xiàn)了極高的算力利用率(MFU),Dense模型訓練中MFU達60%,MoE模型維持在40%左右,F(xiàn)lash Attention算力利用率更是超過95%。這得益于摩爾線程獨創(chuàng)的ACE技術(shù),該技術(shù)通過將復雜的通信任務從計算核心卸載,實現(xiàn)了物理級的“通信計算重疊”,從而釋放了15%的被占算力。



實測數(shù)據(jù)顯示,從64卡擴展至1024卡,系統(tǒng)始終保持90%以上的線性擴展效率,這意味著訓練速度隨算力增加幾乎實現(xiàn)了同步倍增,有效訓練時間占比超過90%。



頂尖模型訓練與推理中的實戰(zhàn)中,對標H100

參數(shù)之外,真實的落地案例是檢驗算力成色的唯一標準。摩爾線程S5000在訓練與推理兩大核心場景中,均交出了令人信服的答卷。在訓練端,2026年1月,智源研究院利用S5000千卡集群完成了前沿具身大腦模型RoboBrain 2.5的端到端訓練與對齊驗證。結(jié)果顯示,其訓練過程與英偉達H100集群高度重合,訓練損失值(loss)的差異僅為0.62%,這證明了S5000在復現(xiàn)頂尖大模型訓練流程上的精準度與穩(wěn)定性。用戶依托MUSA全棧軟件平臺,能夠原生適配PyTorch、Megatron-LM等主流框架,實現(xiàn)“零成本”的代碼遷移,真正做到了兼容國際主流CUDA生態(tài)。



在推理端,S5000的表現(xiàn)同樣刷新了國產(chǎn)GPU的紀錄。2025年12月,摩爾線程聯(lián)合硅基流動,針對DeepSeek-V3 671B滿血版進行了深度適配與性能測試。得益于S5000原生FP8能力與SGLang-MUSA推理引擎的深度優(yōu)化,在PD分離的部署中,單卡Prefill(預填充)吞吐量超過4000 tokens/s,Decode(解碼)吞吐量超過1000 tokens/s。這一成績不僅大幅降低了顯存占用,更在高并發(fā)場景下保證了極低的響應延遲。配合首創(chuàng)的細粒度重計算技術(shù),S5000將開銷降至原有的1/4,全方位提升了系統(tǒng)吞吐量,證明了其作為高性能在線推理服務底座的卓越實力。



從GLM-4.6、GLM-4.7到如今的GLM-5,摩爾線程通過一次次“發(fā)布即適配”的實戰(zhàn),證明了國產(chǎn)全功能GPU及MUSA軟件棧已具備極高的成熟度。這種對前沿模型結(jié)構(gòu)與新特性的快速響應能力,不僅為開發(fā)者提供了第一時間觸達最新模型能力的通道,也為行業(yè)筑牢了一個堅實、易用且具備高度兼容性的國產(chǎn)算力底座。

*聲明:本文系原作者創(chuàng)作。文章內(nèi)容系其個人觀點,我方轉(zhuǎn)載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯(lián)系后臺。

想要獲取半導體產(chǎn)業(yè)的前沿洞見、技術(shù)速遞、趨勢解析,關(guān)注我們!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
遭受慘烈襲擊后,伊朗做了一件“史無前例”的事

遭受慘烈襲擊后,伊朗做了一件“史無前例”的事

環(huán)球時報國際
2026-03-02 23:59:38
100%賴賬,這何嘗不是一種極致的誠信!

100%賴賬,這何嘗不是一種極致的誠信!

財經(jīng)保探長
2026-02-28 10:46:25
加水加糖加廢料,椰子水系統(tǒng)性摻假翻車!網(wǎng)友:真夠歹毒……

加水加糖加廢料,椰子水系統(tǒng)性摻假翻車!網(wǎng)友:真夠歹毒……

柴狗夫斯基
2026-03-02 10:46:05
伊朗發(fā)射近1200枚導彈報復美國和以色列

伊朗發(fā)射近1200枚導彈報復美國和以色列

中國網(wǎng)
2026-03-01 16:43:10
參宿四爆炸后,地球夜空會亮如白晝,至少半年不用開燈了

參宿四爆炸后,地球夜空會亮如白晝,至少半年不用開燈了

觀察宇宙
2026-03-02 19:09:35
降薪潮下,很多家庭已經(jīng)供不起讀大學的兒子了!

降薪潮下,很多家庭已經(jīng)供不起讀大學的兒子了!

黯泉
2026-03-02 21:13:16
海瀾之家被“全軍拉黑”!中標后拒簽合同,200億撐不起一單軍需

海瀾之家被“全軍拉黑”!中標后拒簽合同,200億撐不起一單軍需

新浪財經(jīng)
2026-03-02 16:03:13
越南女子遠嫁廣西農(nóng)村,生下女兒后“跑”了,22年后女兒跨國尋親

越南女子遠嫁廣西農(nóng)村,生下女兒后“跑”了,22年后女兒跨國尋親

談史論天地
2026-03-02 19:45:03
凌晨浦東機場:四女孩險飛泰國,兩分鐘生死一線

凌晨浦東機場:四女孩險飛泰國,兩分鐘生死一線

解鎖世界風云
2026-03-02 10:04:08
紀實:浙江幼師幼兒園潛伏22年,警察曝光真實身份,家長很后怕

紀實:浙江幼師幼兒園潛伏22年,警察曝光真實身份,家長很后怕

談史論天地
2026-03-01 09:49:38
36歲副鎮(zhèn)長開會時腦出血暈倒,除夕當天不幸離世:上任僅10余天,最后一條動態(tài)為督促社火排練,留下3個孩子

36歲副鎮(zhèn)長開會時腦出血暈倒,除夕當天不幸離世:上任僅10余天,最后一條動態(tài)為督促社火排練,留下3個孩子

極目新聞
2026-03-02 15:45:15
新華時評:當炸彈落在校園,文明底線何在

新華時評:當炸彈落在校園,文明底線何在

澎湃新聞
2026-03-01 22:32:48
哈梅內(nèi)伊的死都沒讓伊朗人一條心,還有人鼓掌慶祝:是偉大的一天

哈梅內(nèi)伊的死都沒讓伊朗人一條心,還有人鼓掌慶祝:是偉大的一天

社會醬
2026-03-02 17:20:28
伊朗生死關(guān)頭,一個關(guān)鍵人物走向前臺……

伊朗生死關(guān)頭,一個關(guān)鍵人物走向前臺……

補壹刀
2026-03-02 16:08:19
內(nèi)賈德沒有死,秘書公布遇襲細節(jié)

內(nèi)賈德沒有死,秘書公布遇襲細節(jié)

世家寶
2026-03-02 14:06:27
現(xiàn)實教訓!重慶女子離婚無家可歸,抱娃跪求前任接盤,被連趕3次

現(xiàn)實教訓!重慶女子離婚無家可歸,抱娃跪求前任接盤,被連趕3次

今朝牛馬
2026-03-02 21:27:47
1勝9負,奪冠熱門慢慢倒下!作為聯(lián)盟第一人,或許你被高估了

1勝9負,奪冠熱門慢慢倒下!作為聯(lián)盟第一人,或許你被高估了

老梁體育漫談
2026-03-02 23:30:56
中東局勢緊張!多位網(wǎng)球名將被困,前世界第一恐無緣第五大滿貫

中東局勢緊張!多位網(wǎng)球名將被困,前世界第一恐無緣第五大滿貫

全景體育V
2026-03-02 18:51:55
8小時撤離德黑蘭,沈陽男子講述離開伊朗細節(jié):當?shù)貙χ袊擞押茫?次盤問都順利放行

8小時撤離德黑蘭,沈陽男子講述離開伊朗細節(jié):當?shù)貙χ袊擞押茫?次盤問都順利放行

瀟湘晨報
2026-03-02 19:49:19
“我爸是大官”韓方奕:當街打死32歲警察,入獄不到7年成功減刑

“我爸是大官”韓方奕:當街打死32歲警察,入獄不到7年成功減刑

談史論天地
2026-03-02 17:40:20
2026-03-03 08:36:49
半導體產(chǎn)業(yè)縱橫 incentive-icons
半導體產(chǎn)業(yè)縱橫
探索IC產(chǎn)業(yè)無限可能。
2501文章數(shù) 1284關(guān)注度
往期回顧 全部

科技要聞

蘋果iPhone17e發(fā)布:4499元起 升級A19芯片

頭條要聞

媒體:遭受慘烈襲擊后 伊朗做了件"史無前例"的事

頭條要聞

媒體:遭受慘烈襲擊后 伊朗做了件"史無前例"的事

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

霍爾木茲海峽近乎停擺 布油直逼80美元

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

藝術(shù)
親子
本地
手機
健康

藝術(shù)要聞

14個字,您能全認嗎?探討情緒對人際關(guān)系的影響。

親子要聞

笑死!幼兒園的小朋友胡說八道有多離譜,網(wǎng)友:說的比真話還真

本地新聞

津南好·四時總相宜

手機要聞

聯(lián)想moto首款大折疊!moto razr fold國行暫定第二季度發(fā)布

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

無障礙瀏覽 進入關(guān)懷版