国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Nvidia在MLPerf基準測試中展示Blackwell Ultra性能

0
分享至

MLCommons本周發(fā)布了最新MLPerf基準測試結(jié)果,Nvidia GPU良好的表現(xiàn)一如既往,其中最亮眼的則是最新的Nvidia Blackwell Ultra GPU,結(jié)果令人印象深刻。


在MLCommons發(fā)布的MLPerf 5.1基準測試的93個項目中,74個系統(tǒng)包含Nvidia Blackwell GPU,而19個系統(tǒng)配備了各種AMD Instinct GPU。Nvidia系統(tǒng)在MLPerf 5.1中包含的七個AI模型中均排名第一,這些模型涵蓋了大型語言模型(LLM)、圖像生成、推薦系統(tǒng)、計算機視覺和圖神經(jīng)網(wǎng)絡(luò)。

比Nvidia的勝利更重要的是有機會展示其最新、最強大的設(shè)備——Blackwell Ultra GB300 GPU,該GPU于2024年3月推出,兩個月前才開始批量出貨。

基準測試顯示,Blackwell Ultra GB300能夠提供大約兩倍于Blackwell GB200的FP4性能,是Nvidia于2022年3月推出并于當年晚些時候開始出貨的Hopper H100 GPU的四至五倍。

例如,在Llama 3.1 405B預訓練基準測試中,配備512個Blackwell Ultra GB300 GPU的系統(tǒng)能夠在64.6分鐘內(nèi)完成測試。這大約是配備512個Blackwell GB200 GPU的系統(tǒng)在MLPerf 5.0基準測試中完成任務(wù)的速度的兩倍,也比同樣在MLPerf 1.0上的等效H100系統(tǒng)快4倍。


在涉及Llama 2 70B LoRA模型的微調(diào)基準測試中,8 GPU Blackwell Ultra GB300設(shè)置將在8.5分鐘內(nèi)完成任務(wù),這比在MLPerf 4.1上運行的8 GPU Hopper H100設(shè)置快5倍,比在MLPerf 5.0上運行的Blackwell GB200等效設(shè)置快1.6倍。

雖然MLPerf版本每年都在變化,但各個基準保持一致,從而能夠進行公平的比較。對于MLPerf 5.1,MLCommons拋棄了兩個舊模型,BERT Large and Stable Diffusion,并用Llama 3.1 8B和FLUX.1(用于圖像生成)替換了它們。這種演變也反映了與人工智能訓練工作負載相比,人工智能推理工作負載的重要性日益增加。

MLCommons MLPerf負責人David Kanter在一篇博客文章中表示:“總的來說,向GenAI基準提交的數(shù)據(jù)增加以及這些測試中記錄的可觀的性能改進表明,大家非常關(guān)注GenAI場景,在某種程度上以犧牲AI技術(shù)的其他潛在應(yīng)用為代價?!?/p>


這些測試還使Nvidia能夠展示Blackwell Ultra GB300在使用超低精度4位浮點數(shù)據(jù)格式的新興AI工作負載上的性能。6月,Nvidia推出了第二種FP4數(shù)據(jù)格式NVFP4,以配合Blackwell和Blackwell Ultra現(xiàn)有的MXFP4格式。

在周一的新聞發(fā)布會上,Nvidia分享了記錄NVPF4格式與MXFP4相比準確度的數(shù)據(jù)。雖然兩者都不如16位浮點格式bfloat16(BF16)準確,但NVPF4顯示的損失比MXFP4少,高達8000億個Token,之后兩種格式的損失率都會加速。

Nvidia加速計算主管Dave Salvator表示:“基本的結(jié)論是,我們通過自己的經(jīng)驗觀察發(fā)現(xiàn),NVFP4實際上比MXFP4提供了更好的準確性,這就是為什么我們不僅傾向于在推理方面,而且在訓練方面使用它?!?/p>

Salvator還指出,Blackwell Ultra擁有279GB的HBM3內(nèi)存,可提供15petaflops的NVFP4計算,英偉達配置了一組配備5120個GPU的GB300 NVL72系統(tǒng),通過800Gbps Quantum-X800 InfiniBand互聯(lián)連接。它能夠在10.0分鐘內(nèi)完成Llama 3.1 405B的預訓練工作負載,這比Nvidia之前的系統(tǒng)快2.7倍,Nvidia以前的系統(tǒng)有大約2500個GPU。


Salvator說:“正如你所看到的,當我們從512個GPU增加到5120個GPU時,我們基本上能夠?qū)崿F(xiàn)約85%的縮放效率?!薄坝嬎悴⒉皇腔鶞蕼y試中的唯一因素。還有其他因素。有內(nèi)存移動、I/O、網(wǎng)絡(luò)通信,還有其他因素在起作用。因此,我們實現(xiàn)了85%的擴展效率,同時基本上將GPU數(shù)量增加了10倍,這一事實真的令人印象深刻?!?/p>

Nvidia在本輪新增的兩個基準測試中創(chuàng)造了性能記錄,包括Llama 3.1 8B和FLUX.1。Nvidia能夠在5.2分鐘內(nèi)用512個Blackwell Ultra GPU組成的系統(tǒng)訓練Llama 3.1 8B模型。它能夠在由1152個Blackwell CPU組成的系統(tǒng)上以12.5分鐘的創(chuàng)紀錄時間完成FLUX.1圖像生成器基準測試。該公司現(xiàn)有的圖神經(jīng)網(wǎng)絡(luò)、對象檢測和推薦系統(tǒng)測試記錄仍然有效。


在人工智能時代,一個訓練或微調(diào)模型,然后過渡到生產(chǎn)(即推理)模式的速度將決定競爭能力。正如Salvator所指出的那樣,Nvidia的設(shè)備在人工智能游戲的每個階段都占據(jù)主導地位。

他說:“訓練領(lǐng)域的性能提升轉(zhuǎn)化為模型的更快收斂。模型收斂越快,模型部署得越快,組織獲得投資回報率的速度就越快,這最終是許多組織的目標,即能夠以一種實際上有利可圖的方式部署這些東西?!?/p>

與 Ai 時代前沿合作,將大門向更多普通用戶敞開!無論你是對新技術(shù)充滿好奇心的愛好者,還是希望提升自己技能的職場人士,這里都有適合你的課程和資源。歡迎掃碼加入我們!


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
官方:多納魯馬當選IFFHS年度最佳男足門將

官方:多納魯馬當選IFFHS年度最佳男足門將

懂球帝
2025-12-28 00:07:03
面對6連勝,杜鋒高興不起來,賽后著重強調(diào)球隊的被動和傷害

面對6連勝,杜鋒高興不起來,賽后著重強調(diào)球隊的被動和傷害

小樓侃體育
2025-12-28 00:05:09
多國損失高達百億,聯(lián)合要求中國廢除禁令,溫鐵軍:輪不到你發(fā)言

多國損失高達百億,聯(lián)合要求中國廢除禁令,溫鐵軍:輪不到你發(fā)言

趣文說娛
2025-12-27 13:46:33
高濤被罷免遼寧省人大代表職務(wù),9個月前被免去副省長

高濤被罷免遼寧省人大代表職務(wù),9個月前被免去副省長

澎湃新聞
2025-12-27 10:34:27
劉芳菲登門向龐叔令道歉!眼里滿是淚光,龐叔令拿出一柜子藏品來

劉芳菲登門向龐叔令道歉!眼里滿是淚光,龐叔令拿出一柜子藏品來

阿纂看事
2025-12-26 19:09:14
何晴閨蜜爆料!揭開許何搬離許亞軍家真相,收到許何喪母消息落淚

何晴閨蜜爆料!揭開許何搬離許亞軍家真相,收到許何喪母消息落淚

洲洲影視娛評
2025-12-25 15:15:01
郭士強嚴選!男籃4大現(xiàn)役國手本輪合砍5分,球迷:不腦溢血才怪

郭士強嚴選!男籃4大現(xiàn)役國手本輪合砍5分,球迷:不腦溢血才怪

弄月公子
2025-12-27 22:44:10
臺灣宜蘭海域發(fā)生6.6級強震,臺北持續(xù)搖晃近一分鐘,震中地形圖公布!福建沿海多地震感明顯

臺灣宜蘭海域發(fā)生6.6級強震,臺北持續(xù)搖晃近一分鐘,震中地形圖公布!福建沿海多地震感明顯

臺州交通廣播
2025-12-28 00:00:35
姜昆美國豪宅過圣誕僅2天,惡心一幕上演,郭德綱昔日諷刺說對了

姜昆美國豪宅過圣誕僅2天,惡心一幕上演,郭德綱昔日諷刺說對了

秋月寒江
2025-12-26 18:48:50
河南網(wǎng)紅“蹭飯書記”11月中旬卸任,稱將回老家當村干部

河南網(wǎng)紅“蹭飯書記”11月中旬卸任,稱將回老家當村干部

澎湃新聞
2025-12-27 12:12:27
殲-36:當我消失在雷達里,世界才開始害怕,5.2馬赫的沉默

殲-36:當我消失在雷達里,世界才開始害怕,5.2馬赫的沉默

正直小墨
2025-12-26 21:51:07
菲律賓擱淺船事件的驚人解決方案:填海造地與戰(zhàn)略圍困

菲律賓擱淺船事件的驚人解決方案:填海造地與戰(zhàn)略圍困

阿郎娛樂
2025-12-26 19:11:59
輕松一刻:牛馬見多了,第一次見到海馬!

輕松一刻:牛馬見多了,第一次見到海馬!

萊月昂
2025-12-13 21:58:38
40年前的奢侈飲料“麥乳精”,到底是什么東西?

40年前的奢侈飲料“麥乳精”,到底是什么東西?

簡食記工作號
2025-12-12 21:11:15
南博事件新證據(jù)!龐叔令律師:龐家捐贈的江南春,不是曝光的兩幅

南博事件新證據(jù)!龐叔令律師:龐家捐贈的江南春,不是曝光的兩幅

火山詩話
2025-12-26 07:14:22
龐家在香港發(fā)布會上“火力全開”,龐家發(fā)言怒懟:你們也配是記者

龐家在香港發(fā)布會上“火力全開”,龐家發(fā)言怒懟:你們也配是記者

范剬舍長
2025-12-23 22:52:07
雙胞胎寶媽冰柜-40℃凍母乳,幾天后發(fā)現(xiàn)母乳全化溫度顯示5℃,美的客服:-40℃僅能維持24小時,賠償100元

雙胞胎寶媽冰柜-40℃凍母乳,幾天后發(fā)現(xiàn)母乳全化溫度顯示5℃,美的客服:-40℃僅能維持24小時,賠償100元

臺州交通廣播
2025-12-27 17:12:31
寧肯停電也不找中國?越南硬逼5年建成核電站,日本直接掀桌子

寧肯停電也不找中國?越南硬逼5年建成核電站,日本直接掀桌子

芳芳歷史燴
2025-12-27 19:28:19
3:1!天津女排冠軍相,爆冷擊敗上海隊,37歲老將獨得30分

3:1!天津女排冠軍相,爆冷擊敗上海隊,37歲老將獨得30分

跑者排球視角
2025-12-27 19:26:41
看了南北朝150年的歷史,才明白劉裕滅司馬家全族,埋了多大的雷

看了南北朝150年的歷史,才明白劉裕滅司馬家全族,埋了多大的雷

銘記歷史呀
2025-12-27 17:41:59
2025-12-28 00:44:49
Ai時代前沿
Ai時代前沿
人工智能新聞動態(tài)及應(yīng)用案例。
1607文章數(shù) 510關(guān)注度
往期回顧 全部

數(shù)碼要聞

蘋果曾測試多彩版初代AirPods充電盒 原型配色對應(yīng)iPhone 5c

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

張昊唯逃稅涉黃風波落幕:法院認定朋友造謠

財經(jīng)要聞

注意,開始拉物價了!

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

教育
本地
旅游
數(shù)碼
藝術(shù)

教育要聞

南京市首創(chuàng)杯金屬機器人系列交流展示活動

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

旅游要聞

“請3休8”倒計時,12月27日迎來元旦假期首波出游高峰

數(shù)碼要聞

最高5.19 萬!小米新品火熱開賣,“價格屠夫”徹底不裝了

藝術(shù)要聞

驚艷!這件木雕美得讓人心動,絕對不容錯過!

無障礙瀏覽 進入關(guān)懷版