国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

單卡突破1000TFLOPS!摩爾線程旗艦GPU參數(shù)首曝光:對(duì)標(biāo)H100,訓(xùn)練性能大漲30%

0
分享至


芯東西(公眾號(hào):aichip001)
作者 ZeR0
編輯 漠影

芯東西2月12日?qǐng)?bào)道,今日,摩爾線程發(fā)文宣布旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000率先完成對(duì)GLM-5大模型的適配,并首次曝光MTT S5000的硬件參數(shù)。

MTT S5000支持FP8FP64的全精度計(jì)算,F(xiàn)P8精度下單卡AI算力最高可達(dá)1000TFLOPS,配備80GB顯存,顯存帶寬達(dá)1.6TB/s,卡間互聯(lián)帶寬達(dá)784GB/s。

根據(jù)業(yè)內(nèi)人士消息,MTT S5000實(shí)測(cè)性能對(duì)標(biāo)H100,在多模態(tài)大模型微調(diào)任務(wù)中,部分性能甚至超越H100。


MTT S5000由摩爾線程在2024年推出,專(zhuān)為大模型訓(xùn)練、推理及高性能計(jì)算而設(shè)計(jì)。

據(jù)接近測(cè)試項(xiàng)目的行業(yè)人士透露,S5000在產(chǎn)品精度上已超越H100,更接近英偉達(dá)Blackwell架構(gòu)

在近期一次數(shù)千億參數(shù)模型的全流程訓(xùn)練驗(yàn)證中,該卡表現(xiàn)出了與H100集群極高的結(jié)果一致性,最終模型關(guān)鍵指標(biāo)誤差僅維持在千分之幾的范圍內(nèi),整體訓(xùn)練效果甚至實(shí)現(xiàn)小幅超越。

另?yè)?jù)來(lái)自互聯(lián)網(wǎng)廠商場(chǎng)景的實(shí)測(cè)信息反饋,S5000在典型端到端推理及訓(xùn)練任務(wù)中,性能可達(dá)競(jìng)品H20的2.5倍左右。

摩爾線程官網(wǎng)也已上線MTT S5000的詳情頁(yè)面。

產(chǎn)品形態(tài)上,S5000遵循OAM標(biāo)準(zhǔn)設(shè)計(jì),提供兩種計(jì)算模組形態(tài):

  • 液冷版:專(zhuān)為高密度綠色數(shù)據(jù)中心打造,釋放極致算力密度的同時(shí),顯著降低PUE與能耗;
  • 風(fēng)冷版:適配標(biāo)準(zhǔn)通用服務(wù)器,部署靈活便捷,有效降低運(yùn)維門(mén)檻與長(zhǎng)期持有成本。

同時(shí),摩爾線程推出面向AI和高性能計(jì)算的MGX 8-GPU模塊化平臺(tái):8顆MTT S5000 OAM計(jì)算模組通過(guò)MTLink高速互聯(lián),可為大模型訓(xùn)練、推理及科學(xué)計(jì)算等應(yīng)用場(chǎng)景提供超大規(guī)模算力。


MCCX D800 X2服務(wù)器是搭載8顆MTT S5000 OAM計(jì)算模組的一體化AI服務(wù)器,提供計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)的高端配置,可支撐千億、萬(wàn)億參數(shù)大模型高效運(yùn)行。

該服務(wù)器在散熱、供電、I/O 擴(kuò)展性等方面充分優(yōu)化,支持風(fēng)冷和液冷兩種機(jī)型,可預(yù)裝優(yōu)化訓(xùn)練、推理軟件棧,實(shí)現(xiàn)軟硬件一體化交付,開(kāi)箱即用。


一、基于第四代MUSA架構(gòu),原生支持FP8精度,訓(xùn)練性能提升30%

在大模型參數(shù)持續(xù)擴(kuò)張的趨勢(shì)下,F(xiàn)P8計(jì)算精度的支持已成為訓(xùn)練與推理的核心精度標(biāo)準(zhǔn)。相比傳統(tǒng)的BF16/FP16,F(xiàn)P8可將數(shù)據(jù)位寬減半,顯存帶寬壓力降低50%,理論計(jì)算吞吐量翻倍。

MTT S5000是國(guó)內(nèi)最早一批原生支持FP8精度的訓(xùn)練GPU,配置了硬件級(jí)FP8 Tensor Core加速單元。其FP8引擎全面支持DeepSeek、Qwen等前沿架構(gòu),在實(shí)測(cè)中可提升30%以上訓(xùn)練性能。


S5000采用第四代MUSA架構(gòu)“平湖”,專(zhuān)為大規(guī)模AI訓(xùn)練優(yōu)化,依托MUSA全棧軟件平臺(tái),原生適配PyTorch、Megatron-LM、vLLM及 SGLang等主流框架,讓用戶(hù)能夠以“零成本”完成代碼遷移,兼容國(guó)際主流CUDA生態(tài)。


這款A(yù)I計(jì)算卡深度優(yōu)化了Prefill階段的處理效率,在超長(zhǎng)序列輸入場(chǎng)景下,能顯著加速Prompt預(yù)處理過(guò)程,提供更快的上下文理解與首Token響應(yīng)速度,有效解決大規(guī)模知識(shí)庫(kù)檢索及長(zhǎng)文檔分析中的延遲瓶頸。

在16k長(zhǎng)序列輸入測(cè)試中,S5000單卡Prefill吞吐量是H20的2.5倍。這意味著在處理長(zhǎng)文本Prompt時(shí),國(guó)產(chǎn)算力具備更快的上下文理解速度。


這主要得益于其高達(dá)1000TFLOPS的單卡算力。在絕大多數(shù)計(jì)算密集型場(chǎng)景中,該卡不僅能提供更強(qiáng)勁的算力輸出,也在整體性?xún)r(jià)比上展現(xiàn)出顯著優(yōu)勢(shì)。

基于FSDP2框架,MTT S5000已率先完成Wan2.1視頻生成全模型訓(xùn)練驗(yàn)證,2節(jié)點(diǎn)16卡配置下訓(xùn)練吞吐量達(dá)61.83samples/s,模型算力利用率(MFU)達(dá)51%,生成效果在視頻邏輯、畫(huà)質(zhì)細(xì)膩度、動(dòng)態(tài)一致性上均對(duì)齊行業(yè)基準(zhǔn)。


二、10EFLOPS萬(wàn)卡集群已落地,下游任務(wù)評(píng)測(cè)得分優(yōu)于H100

基于S5000構(gòu)建的夸娥萬(wàn)卡集群已經(jīng)落地,其浮點(diǎn)運(yùn)算能力達(dá)到10EFLOPS,在Dense模型訓(xùn)練中MFU達(dá)60%,在MoE模型中維持在40%左右,有效訓(xùn)練時(shí)間占比超過(guò)90%,訓(xùn)練線性擴(kuò)展效率達(dá)95%


依托原生FP8能力,它能夠完整復(fù)現(xiàn)頂尖大模型的訓(xùn)練流程,其中Flash Attention算力利用率超過(guò)95%,多項(xiàng)關(guān)鍵指標(biāo)均達(dá)到國(guó)際主流水平。

在集群通信層面,S5000采用獨(dú)創(chuàng)的ACE技術(shù),將復(fù)雜通信任務(wù)從計(jì)算核心卸載,實(shí)現(xiàn)計(jì)算與通信的零沖突并行,大幅提升MFU。

實(shí)測(cè)顯示,從64卡擴(kuò)展至1024卡,其系統(tǒng)保持90%以上的線性擴(kuò)展效率,訓(xùn)練速度隨算力增加幾乎同步倍增。

第三方驗(yàn)證方面,2026年1月,智源研究院基于S5000千卡集群,完成了前沿具身大腦模型RoboBrain 2.5的端到端訓(xùn)練與對(duì)齊驗(yàn)證。

結(jié)果顯示,與英偉達(dá)H100集群的訓(xùn)練結(jié)果高度重合,訓(xùn)練損失值(loss)差異僅為0.62%。

根據(jù)摩爾線程官網(wǎng),在S5000集群上訓(xùn)練DeepSeek-236B,前3萬(wàn)步訓(xùn)練過(guò)程中,Loss曲線與H100集群的相對(duì)精度誤差僅為0.6%。同等數(shù)據(jù)量下,其下游任務(wù)評(píng)測(cè)得分優(yōu)于H100,驗(yàn)證了萬(wàn)卡集群的高精度。


GPU集群的可靠性、可用性和可維護(hù)性(RAS)是支撐大規(guī)模AI訓(xùn)練任務(wù)持續(xù)穩(wěn)定運(yùn)行的核心基礎(chǔ)設(shè)施能力。

S5000從芯片級(jí)到系統(tǒng)級(jí)構(gòu)建了完整的RAS體系,支持故障感知、上報(bào)與錯(cuò)誤隔離,可快速定位并替換故障節(jié)點(diǎn)、慢節(jié)點(diǎn)及靜默數(shù)據(jù)損壞節(jié)點(diǎn),并具備主動(dòng)檢測(cè)與修復(fù)功能,長(zhǎng)期守護(hù)集群健康,確保性能穩(wěn)定與結(jié)果正確。

三、刷新國(guó)產(chǎn)GPU大模型推理紀(jì)錄,科學(xué)計(jì)算性能完勝H100

S5000在推理場(chǎng)景同樣表現(xiàn)優(yōu)異。2025年12月,摩爾線程聯(lián)合硅基流動(dòng),基于S5000完成對(duì)DeepSeek-V3 671B滿(mǎn)血版的深度適配與性能測(cè)試,實(shí)測(cè)單卡Prefill吞吐超4000tokens/s,Decode吞吐超1000tokens/s,刷新了國(guó)產(chǎn)GPU的推理紀(jì)錄。


針對(duì)Agent間的高頻通訊與復(fù)雜代碼塊的瞬時(shí)生成需求,S5000在DeepSeek等前沿模型的推理實(shí)測(cè)中,實(shí)現(xiàn)了遠(yuǎn)超行業(yè)基準(zhǔn)的token生成速率

S5000針對(duì)文生視頻模型進(jìn)行了深度優(yōu)化,基于原生FP8硬件加速能力,在大幅提升推理速度的同時(shí),確保生成內(nèi)容精度無(wú)損,單機(jī)性能達(dá)到H100的64%-79%,兼顧高性能輸出與高投入產(chǎn)出比(ROI)。


同時(shí),S5000憑借原生FP64雙精度計(jì)算能力,通過(guò)與國(guó)家級(jí)實(shí)驗(yàn)室的深度合作與調(diào)優(yōu),在關(guān)鍵科學(xué)計(jì)算領(lǐng)域?qū)崿F(xiàn)性能提升。在SPONGE模擬引擎中,其性能達(dá)到H100的1.7倍;在分子對(duì)接工具DSDP的實(shí)測(cè)中,其計(jì)算效能展現(xiàn)出壓倒性?xún)?yōu)勢(shì),性能達(dá)到H100的8.1倍。


此外,作為一款全功能GPU,S5000集成了高性能的多媒體編解碼引擎,硬件原生支持H264、H265、VP9、AV1、AVS2、AVS+、VP8等格式。


結(jié)語(yǔ):國(guó)產(chǎn)GPU已經(jīng)扛起大模型訓(xùn)練的重任

根據(jù)摩爾線程官網(wǎng)披露信息,無(wú)論是構(gòu)建萬(wàn)卡級(jí)超大規(guī)模訓(xùn)練集群,還是部署高并發(fā)、低延遲的在線推理服務(wù),MTT S5000均展現(xiàn)出對(duì)標(biāo)國(guó)際主流旗艦產(chǎn)品的卓越性能與穩(wěn)定性。

作為目前國(guó)內(nèi)少數(shù)具備完整大模型訓(xùn)練能力的AI計(jì)算卡之一,MTT S5000提供了一套可行的國(guó)產(chǎn)算力替代方案,從FP8精度支持、單卡1000EFLOPS算力等參數(shù)到經(jīng)過(guò)萬(wàn)卡集群實(shí)訓(xùn)、第三方機(jī)構(gòu)驗(yàn)證的實(shí)戰(zhàn)成績(jī),都證明了國(guó)產(chǎn)GPU不僅能做好推理,而且已經(jīng)能支撐起大規(guī)模模型訓(xùn)練的計(jì)算需求。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
醪糟再次被關(guān)注!醫(yī)生發(fā)現(xiàn):高血脂患者喝醪糟,不用多久4大變化

醪糟再次被關(guān)注!醫(yī)生發(fā)現(xiàn):高血脂患者喝醪糟,不用多久4大變化

芹姐說(shuō)生活
2026-04-19 15:52:53
尷尬!董宇輝被吐槽:喜歡支教,一天沒(méi)去;不喜歡帶貨,一天沒(méi)停

尷尬!董宇輝被吐槽:喜歡支教,一天沒(méi)去;不喜歡帶貨,一天沒(méi)停

火山詩(shī)話(huà)
2026-04-21 06:59:47
周亮,被免職

周亮,被免職

新京報(bào)政事兒
2026-04-21 10:28:07
保密期限終到期,中央首長(zhǎng)透露:毛岸英真相,可以向外界公開(kāi)了

保密期限終到期,中央首長(zhǎng)透露:毛岸英真相,可以向外界公開(kāi)了

歷史點(diǎn)行
2026-03-29 13:38:28
不比不知道,一比嚇一跳!蘇林回國(guó)后很焦慮:原來(lái)我們落后這么多

不比不知道,一比嚇一跳!蘇林回國(guó)后很焦慮:原來(lái)我們落后這么多

小俎娛樂(lè)
2026-04-21 03:08:17
壽命與大便次數(shù)有關(guān)?壽命長(zhǎng)的人,每天排便在這個(gè)次數(shù),真的嗎?

壽命與大便次數(shù)有關(guān)?壽命長(zhǎng)的人,每天排便在這個(gè)次數(shù),真的嗎?

荷蘭豆愛(ài)健康
2026-04-21 14:57:39
美方稱(chēng)在霍爾木茲海峽扣押的船只是從中國(guó)開(kāi)往伊朗的,被用于運(yùn)輸導(dǎo)彈化工原料,外交部:中方反對(duì)在霍爾木茲海峽問(wèn)題上的惡意關(guān)聯(lián)和炒作

美方稱(chēng)在霍爾木茲海峽扣押的船只是從中國(guó)開(kāi)往伊朗的,被用于運(yùn)輸導(dǎo)彈化工原料,外交部:中方反對(duì)在霍爾木茲海峽問(wèn)題上的惡意關(guān)聯(lián)和炒作

瀟湘晨報(bào)
2026-04-21 16:34:11
神仙拼圖!本賽季的迪溫琴佐,什么水平?

神仙拼圖!本賽季的迪溫琴佐,什么水平?

籃球?qū)嶄?/span>
2026-04-21 15:35:23
強(qiáng)闖臺(tái)海后,高市再惹大禍,中朝聯(lián)合亮劍,解放軍現(xiàn)身日本家門(mén)口

強(qiáng)闖臺(tái)海后,高市再惹大禍,中朝聯(lián)合亮劍,解放軍現(xiàn)身日本家門(mén)口

基斯默默
2026-04-20 15:41:02
美伊?;饏f(xié)議明天到期,外交部:中方支持繼續(xù)保持?;鸷驼勁袆?shì)頭

美伊?;饏f(xié)議明天到期,外交部:中方支持繼續(xù)保持?;鸷驼勁袆?shì)頭

環(huán)球網(wǎng)資訊
2026-04-21 15:40:19
“葉祖新的臉怎么了”沖上熱搜,當(dāng)事人深夜發(fā)文:春天易敏,已無(wú)大礙,此前李現(xiàn)也中招

“葉祖新的臉怎么了”沖上熱搜,當(dāng)事人深夜發(fā)文:春天易敏,已無(wú)大礙,此前李現(xiàn)也中招

極目新聞
2026-04-21 09:09:59
趙心童VS丁俊暉,比賽時(shí)間敲定+央視全程直播,進(jìn)8強(qiáng)能拿多少獎(jiǎng)金

趙心童VS丁俊暉,比賽時(shí)間敲定+央視全程直播,進(jìn)8強(qiáng)能拿多少獎(jiǎng)金

體育大學(xué)僧
2026-04-21 09:47:46
俄羅斯梁贊州向各單位下達(dá)征兵命令,翻譯成中文很親切

俄羅斯梁贊州向各單位下達(dá)征兵命令,翻譯成中文很親切

李未熟擒話(huà)2
2026-04-20 10:47:19
4320線!禾賽發(fā)布6D全彩激光雷達(dá):可干掉攝像頭了

4320線!禾賽發(fā)布6D全彩激光雷達(dá):可干掉攝像頭了

快科技
2026-04-20 14:55:21
6月1日起全國(guó)工地統(tǒng)一用工新規(guī),明確60歲以上農(nóng)民工上崗標(biāo)準(zhǔn)

6月1日起全國(guó)工地統(tǒng)一用工新規(guī),明確60歲以上農(nóng)民工上崗標(biāo)準(zhǔn)

阿嚼影視評(píng)論
2026-04-20 21:02:56
千億市值的大瓜:當(dāng)“金絲雀”遇上“正宮團(tuán)”!

千億市值的大瓜:當(dāng)“金絲雀”遇上“正宮團(tuán)”!

挖掘機(jī)007
2026-04-21 11:31:00
34歲韋東奕官宣喜訊,恭喜!

34歲韋東奕官宣喜訊,恭喜!

二胡的歲月如歌
2026-04-21 15:37:16
何剛掏出麒麟X90時(shí),臺(tái)下安靜了三秒

何剛掏出麒麟X90時(shí),臺(tái)下安靜了三秒

爬蟲(chóng)飼養(yǎng)員
2026-04-20 17:30:46
全球最貴電車(chē)來(lái)了

全球最貴電車(chē)來(lái)了

大象新聞
2026-04-20 10:35:05
最后48小時(shí),賴(lài)清德將登機(jī)離臺(tái),大陸斬釘截鐵,鄭麗文判斷準(zhǔn)確

最后48小時(shí),賴(lài)清德將登機(jī)離臺(tái),大陸斬釘截鐵,鄭麗文判斷準(zhǔn)確

聞識(shí)
2026-04-20 11:25:39
2026-04-21 18:55:00
芯東西 incentive-icons
芯東西
專(zhuān)注AI芯片、半導(dǎo)體產(chǎn)業(yè)媒體
2287文章數(shù) 8153關(guān)注度
往期回顧 全部

數(shù)碼要聞

重磅官宣:庫(kù)克卸任,約翰·特努斯正式接任蘋(píng)果CEO

頭條要聞

男子買(mǎi)"隨用隨取"保險(xiǎn)后得知百歲才能取本金 法院判了

頭條要聞

男子買(mǎi)"隨用隨取"保險(xiǎn)后得知百歲才能取本金 法院判了

體育要聞

62歲,成為中國(guó)足壇最火的人

娛樂(lè)要聞

周潤(rùn)發(fā)時(shí)隔16年再賣(mài)樓,變現(xiàn)數(shù)億資產(chǎn)

財(cái)經(jīng)要聞

現(xiàn)實(shí)是最大的荒誕:千億平臺(tái)的沖突始末

科技要聞

重磅官宣:庫(kù)克卸任,特努斯接任蘋(píng)果CEO

汽車(chē)要聞

全新坦克700正式上市 售價(jià)42.8萬(wàn)-50.8萬(wàn)元

態(tài)度原創(chuàng)

教育
數(shù)碼
時(shí)尚
家居
本地

教育要聞

以沃土育良種——王淑慧家教好故事

數(shù)碼要聞

浩鑫發(fā)布XPC Barebone DL40N迷你主機(jī):1.35L體積無(wú)風(fēng)扇設(shè)計(jì)

今年春夏最流行的4組通勤穿搭,誰(shuí)穿誰(shuí)時(shí)髦!

家居要聞

詩(shī)意光影 窺見(jiàn)自然之境

本地新聞

春色滿(mǎn)城關(guān)不?。座N梅浪漫盛放,吳山藏了一片四月雪

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版