国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

計(jì)算和存儲(chǔ)團(tuán)隊(duì),準(zhǔn)備解散了!

0
分享至

站在機(jī)房門口,就能聽到老顧的咆哮——



老顧,某能源集團(tuán)新成立的三產(chǎn)數(shù)科公司技術(shù)負(fù)責(zé)人。

集團(tuán)做數(shù)智化轉(zhuǎn)型,借大模型東風(fēng),年初拉起一支隊(duì)伍,搞行業(yè)專屬大模型,不僅服務(wù)內(nèi)部,也要服務(wù)行業(yè)。



剛開始,老顧還志得意滿,可最近幾個(gè)月,火太大了。

因?yàn)樗窒碌膱F(tuán)隊(duì)在干兩件事↓

①模型訓(xùn)練
基于開源模型,基于集團(tuán)的行業(yè)數(shù)據(jù),作后訓(xùn)練和全參微調(diào),以便開發(fā)自家的能源行業(yè)專屬模型。
②推理服務(wù)
搭建本地化推理服務(wù),滿足集團(tuán)和兄弟業(yè)務(wù)部門的AI需求。

這兩件事干得都非常不順利。



眼看Q4就要結(jié)束了,模型還沒訓(xùn)練出一個(gè)像樣的,推理服務(wù)也天天被人投訴。

老顧自己也被集團(tuán)分管領(lǐng)導(dǎo)天天點(diǎn)名。



老顧急眼了,拉團(tuán)隊(duì)骨干開會(huì)。

最終,大家一致的結(jié)論是:這屆存儲(chǔ)不行!





老顧聽完,麻了。

一拍桌子:好,那就解散吧!



?。柯牭浇馍ⅲ蠹毅铝?。

團(tuán)隊(duì)才成立,怎么能說解散就解散?!



此時(shí),老顧神秘一笑——

我說的解散,不是團(tuán)隊(duì)解散,是把現(xiàn)在的存儲(chǔ)架構(gòu)「解散」,從存算緊耦合,變成存算解耦。



老顧打開準(zhǔn)備了很久的PPT,開始給大家“上課”↓

以前我們走的彎路就是注意力都在算力上,現(xiàn)在看,存儲(chǔ)同樣重要。

GPU決定了模型能多聰明,但存儲(chǔ)系統(tǒng)決定了它能否吃飽,真正讓AI跑起來,離不開底層數(shù)據(jù)高速公路。



大模型訓(xùn)練對(duì)存儲(chǔ)系統(tǒng)的挑戰(zhàn)不是快,而是要在【高吞吐+高可靠+可擴(kuò)展+高能效】四個(gè)維度同時(shí)達(dá)標(biāo)。



同樣的,大模型推理不只是單純的算力游戲,更是數(shù)據(jù)效率的較量,它要求存儲(chǔ)系統(tǒng)既快、又穩(wěn)、又省、還能靈活擴(kuò)展。



這時(shí),存儲(chǔ)team的負(fù)責(zé)人開腔了:“那我們的存儲(chǔ)怎么改造呢?”

老顧胸有成竹:“我最近看到一套方案,非常不錯(cuò)?!?/strong>



老顧繼續(xù)“口若懸河”——

這是一種分離式的架構(gòu):在不改變邏輯連接的情況下,將存儲(chǔ)和計(jì)算資源從服務(wù)器中解耦。



能做到這點(diǎn),離不開一個(gè)支撐技術(shù):NVMe-oF?。

通過它,服務(wù)器能像訪問本地NVMe SSD一樣訪問遠(yuǎn)程存儲(chǔ)陣列,并且吞吐更高、延遲更低、成本更可控、運(yùn)維更簡(jiǎn)單。



這才是大模型這種數(shù)據(jù)密集型場(chǎng)景,最需要的架構(gòu)。



在這場(chǎng)存儲(chǔ)革命中,西部數(shù)據(jù)走在了行業(yè)前列。

OpenFlex? Data24系列NVMe-oF? 存儲(chǔ)平臺(tái), 正是適用于大模型應(yīng)用場(chǎng)景的「新一代智能存儲(chǔ)底座」。



說著,老顧招呼大家來看硬件規(guī)格↓

首先,OpenFlex Data24系列為2U 24盤位,支持24塊U.2接口的NVMe SSD,容量密度相當(dāng)高,單節(jié)點(diǎn)可達(dá)驚人的1474TB。



同時(shí),提供12個(gè)100GbE網(wǎng)口,支持RoCE和NVMe over TCP融合以太網(wǎng),網(wǎng)絡(luò)帶寬能力拉滿。



下面這顆芯片是精華,由西部數(shù)據(jù)自研專用于NVMe-oF?硬件加速的ASIC芯片,負(fù)責(zé)把NVMe SSD的PCIe協(xié)議與以太網(wǎng)協(xié)議“橋接”起來,不需CPU參與。

這樣,服務(wù)器就可以通過網(wǎng)絡(luò)直接高速讀寫NVMe,不再需要傳統(tǒng)的存儲(chǔ)控制器,延遲接近本地NVMe的水準(zhǔn)(幾十微秒級(jí))。



OpenFlex Data24系列目前具體包括兩款產(chǎn)品,4100和4200,核心區(qū)別在SSD端口上。

4100采用單端口SSD設(shè)計(jì),適用于以吞吐量?jī)?yōu)先的云環(huán)境,而4200采用雙端口SSD,具備原生的高可用能力。



這兩款產(chǎn)品,不光規(guī)格勁爆,實(shí)戰(zhàn)也很能打。

在MLPerf Storage V2 基準(zhǔn)測(cè)試中,OpenFlex Data24展現(xiàn)出作為AI存儲(chǔ)優(yōu)秀的性能。



3D-UNet工作負(fù)載擁有龐大的三維輸入數(shù)據(jù)集和密集流式讀取模式,對(duì)存儲(chǔ)系統(tǒng)的持續(xù)高帶寬和低延遲能力構(gòu)成了挑戰(zhàn)。

測(cè)試中,OpenFlex Data24實(shí)現(xiàn)了高達(dá) 106.5 GB/s的持續(xù)讀取吞吐量,足以“喂飽”三臺(tái)GPU服務(wù)器共計(jì)36張H100顯卡,輕松應(yīng)對(duì)帶寬密集型、高并行度的訓(xùn)練任務(wù)。



ResNet50工作負(fù)載包含大量小文件、混合I/O、頻繁迭代,是驗(yàn)證存儲(chǔ)系統(tǒng)能否為GPU提供高吞吐數(shù)據(jù)的黃金基準(zhǔn)。

這項(xiàng)測(cè)試中,OpenFlex Data24表現(xiàn)更為出色,扛住了橫跨3個(gè)服務(wù)器節(jié)點(diǎn)、186個(gè)模擬H100 GPU的數(shù)據(jù)需求。



接下來,大家開始討論如何用OpenFlex Data24來解決大模型訓(xùn)推實(shí)戰(zhàn)項(xiàng)目中的坑——



大模型訓(xùn)練場(chǎng)景,對(duì)存儲(chǔ)的要求是這樣的:高吞吐量、大規(guī)模并行、高可用性,還要求優(yōu)秀的擴(kuò)展性和更好的性價(jià)比。



而大模型推理場(chǎng)景,對(duì)存儲(chǔ)的要求是這樣的:高并發(fā)低延遲、高頻隨機(jī)訪問、模型權(quán)重快速加載,以及低成本高能效。



我們綜合一下兩種場(chǎng)景,看看西部數(shù)據(jù)OpenFlex Data24怎么搞定這些難題。

首先,針對(duì)高吞吐與并行訪問的需求,NVMe-oF?讓GPU節(jié)點(diǎn)可以遠(yuǎn)程直接訪問NVMe SSD,網(wǎng)絡(luò)帶寬匹配PCIe Gen4的帶寬,大幅減少全鏈路的性能瓶頸。



通過高帶寬順序讀取,縮短模型初始化與數(shù)據(jù)加載時(shí)間,減少GPU的空轉(zhuǎn)時(shí)間,個(gè)個(gè)滿負(fù)荷扛活提升訓(xùn)練效率。



同時(shí),有西部數(shù)據(jù)自研的NVMe-oF?加速芯片加持,AI節(jié)點(diǎn)訪問遠(yuǎn)端NVMe SSD的讀寫延遲與本地幾乎一致。

高帶寬順序讀+穩(wěn)定低延遲,可以保證推理服務(wù)時(shí),AI節(jié)點(diǎn)迅速從存儲(chǔ)加載數(shù)百GB甚至TB級(jí)的模型權(quán)重,縮短推理服務(wù)的“冷啟動(dòng)”時(shí)間。



在超低延遲的前提下,OpenFlex Data24單節(jié)點(diǎn)24塊SSD組成強(qiáng)大的隨機(jī)讀寫存儲(chǔ)池,且企業(yè)級(jí)NVMe SSD原生支持多隊(duì)列高IOPS。

這樣,面對(duì)大模型推理多用戶場(chǎng)景下的高頻隨機(jī)訪問和高并發(fā)需求,存儲(chǔ)無壓力。



針對(duì)訓(xùn)推穩(wěn)定性和高可用的需求,OpenFlex Data24可提供雙端口SSD與主動(dòng)故障切換設(shè)計(jì),確保訪問持續(xù)可用、不中斷。

大帶寬高速讀寫能力,也可以保證模型訓(xùn)練Checkpoint的快速保存和恢復(fù)。

再加上N+2風(fēng)扇冗余、硬件容錯(cuò)等設(shè)計(jì),可進(jìn)一步提升訓(xùn)練期間系統(tǒng)穩(wěn)定性。



當(dāng)然,降本增效的大背景下,OpenFlex Data24也為客戶算好了經(jīng)濟(jì)賬。

對(duì)企業(yè)來講,模型規(guī)模和數(shù)據(jù)集都會(huì)動(dòng)態(tài)增長,OpenFlex Data24存算解耦,讓存儲(chǔ)可以獨(dú)立擴(kuò)展,并通過智能緩存和分層存儲(chǔ),進(jìn)一步平衡成本和效率。



另外,西部數(shù)據(jù)通過垂直整合設(shè)計(jì),提供高速NIC、存儲(chǔ)平臺(tái)一站式方案。

降低復(fù)雜度,幫用戶省心省錢、少踩坑,TCO更優(yōu)。



最后,OpenFlex Data24提供了相當(dāng)優(yōu)秀的能效指標(biāo):每瓦IOPS↑、每瓦吞吐量↑、每TB能耗↓,堪稱行業(yè)領(lǐng)先水平。

這種典型的「高性能密度+優(yōu)化能效比」,為AI智算項(xiàng)目帶來更優(yōu)的TCO。



就這樣,這場(chǎng)「團(tuán)隊(duì)解散」的會(huì)議,在大家齊聲點(diǎn)贊的氣氛中,愉快地結(jié)束了

把存儲(chǔ)和計(jì)算“解散”,就這么辦!



* 以上故事情節(jié)為虛構(gòu),僅用于技術(shù)科普與場(chǎng)景舉例,不代表任何真實(shí)客戶情況。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
種地還是毀林?農(nóng)民被訴案背后的萬畝林耕之爭(zhēng)

種地還是毀林?農(nóng)民被訴案背后的萬畝林耕之爭(zhēng)

重案組37號(hào)
2025-12-28 18:51:05
南博事件后,知名博主爆料:江西博物館的《米芾三札》疑似被調(diào)包

南博事件后,知名博主爆料:江西博物館的《米芾三札》疑似被調(diào)包

奇思妙想生活家
2025-12-28 12:11:18
特朗普對(duì)中國說話算話,8艘滿載巨輪已放行,正連夜趕往中國

特朗普對(duì)中國說話算話,8艘滿載巨輪已放行,正連夜趕往中國

瞳哥視界
2025-12-28 21:04:47
姜昆“美國唱紅歌”事件再度升級(jí),郭德綱和寧靜的話,一針見血

姜昆“美國唱紅歌”事件再度升級(jí),郭德綱和寧靜的話,一針見血

得得電影
2025-12-26 13:58:03
成都豐田爆炸原因曝光,現(xiàn)場(chǎng)一片狼藉損失慘重

成都豐田爆炸原因曝光,現(xiàn)場(chǎng)一片狼藉損失慘重

映射生活的身影
2025-12-28 19:35:49
3大國家保密中成藥:中風(fēng)急救、心??祻?fù),心血管的護(hù)身符!

3大國家保密中成藥:中風(fēng)急救、心梗康復(fù),心血管的護(hù)身符!

展望云霄
2025-12-25 21:39:14
南博事件升溫!徐鶯被杭師大開除,她開口大罵龐書令

南博事件升溫!徐鶯被杭師大開除,她開口大罵龐書令

平老師666
2025-12-28 20:04:36
中國不是就業(yè)難,是已經(jīng)全面進(jìn)入「零工社會(huì)」

中國不是就業(yè)難,是已經(jīng)全面進(jìn)入「零工社會(huì)」

匹夫來搞笑
2025-12-28 13:12:18
重磅:波三小邁出了第一步

重磅:波三小邁出了第一步

西樓飲月
2025-12-28 20:27:01
官宣!上海終于入冬!跨年冷空氣已候場(chǎng),元旦假期氣溫直逼冰點(diǎn)

官宣!上海終于入冬!跨年冷空氣已候場(chǎng),元旦假期氣溫直逼冰點(diǎn)

上觀新聞
2025-12-28 20:43:05
張?jiān)⑷枞A升級(jí)!在港參加活動(dòng)發(fā)言挑釁,相關(guān)代言被抵制連夜捂嘴

張?jiān)⑷枞A升級(jí)!在港參加活動(dòng)發(fā)言挑釁,相關(guān)代言被抵制連夜捂嘴

小咪侃娛圈
2025-12-28 13:56:36
財(cái)政部:明年財(cái)政將促進(jìn)居民就業(yè)增收

財(cái)政部:明年財(cái)政將促進(jìn)居民就業(yè)增收

極目新聞
2025-12-28 12:14:55
巴菲特老爺子又去了赫爾松!又有兩名美國志愿者犧牲:真正的人

巴菲特老爺子又去了赫爾松!又有兩名美國志愿者犧牲:真正的人

鷹眼Defence
2025-12-28 18:15:43
瑞茂通“大動(dòng)脈”式裁員 超20億債務(wù)逾期業(yè)務(wù)或已停擺

瑞茂通“大動(dòng)脈”式裁員 超20億債務(wù)逾期業(yè)務(wù)或已停擺

財(cái)聯(lián)社
2025-12-27 18:47:06
永州主帥:之前我和女老板說她承諾送車沒事的,我們奪不了冠

永州主帥:之前我和女老板說她承諾送車沒事的,我們奪不了冠

懂球帝
2025-12-28 22:28:06
不被允許的欲望:老年人性需求正在演變?yōu)橹卮蠊残l(wèi)生風(fēng)險(xiǎn)

不被允許的欲望:老年人性需求正在演變?yōu)橹卮蠊残l(wèi)生風(fēng)險(xiǎn)

黑噪音
2025-12-27 20:51:40
“莫斯科遭襲擊”

“莫斯科遭襲擊”

揚(yáng)子晚報(bào)
2025-12-28 21:55:26
俄羅斯發(fā)動(dòng)大規(guī)模打擊 普京穿上軍裝: 已無興趣等待烏軍撤出

俄羅斯發(fā)動(dòng)大規(guī)模打擊 普京穿上軍裝: 已無興趣等待烏軍撤出

每日經(jīng)濟(jì)新聞
2025-12-28 11:49:18
首批中國援柬埔寨緊急人道主義物資運(yùn)抵金邊

首批中國援柬埔寨緊急人道主義物資運(yùn)抵金邊

界面新聞
2025-12-28 16:09:12
美國夢(mèng)黃了!自稱智力頂峰的羅玉鳳,如今病困交加離死不遠(yuǎn)了

美國夢(mèng)黃了!自稱智力頂峰的羅玉鳳,如今病困交加離死不遠(yuǎn)了

璀璨幻行者
2025-12-28 22:32:12
2025-12-29 07:20:49
AI全球總部
AI全球總部
全球最新、最酷AI解決方案
1099文章數(shù) 715關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

英偉達(dá)的收購史

頭條要聞

途經(jīng)俄羅斯航班墜機(jī)38人身亡 機(jī)身或被彈片擊中

頭條要聞

途經(jīng)俄羅斯航班墜機(jī)38人身亡 機(jī)身或被彈片擊中

體育要聞

MVP概率達(dá)82.5%!約基奇連超大鳥喬丹

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

科技要聞

特斯拉將在華布局自動(dòng)駕駛?記者求證→

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

本地
藝術(shù)
數(shù)碼
房產(chǎn)
公開課

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

藝術(shù)要聞

42張清末老照片,令人莫名的鼻酸!

數(shù)碼要聞

曝光的AirPods原型機(jī)顯示,蘋果曾計(jì)劃推出多彩配色方案!

房產(chǎn)要聞

降維打擊!三亞CBD驚現(xiàn)“豪宅新王”,高端局要變天了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版