国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

KV Cache需求暴漲32倍,AI如何重寫(xiě)存儲(chǔ)產(chǎn)業(yè)鏈的「舊分工」?| MemoryS 2026觀察

0
分享至

作者 | 楊依婷

編輯 | 包永剛

去年的CFMS|MemoryS峰會(huì)上,存儲(chǔ)廠商們討論的是:價(jià)格何時(shí)企穩(wěn)、QLC何時(shí)上量、AI PC何時(shí)落地。彼時(shí),“AI會(huì)讓存儲(chǔ)變得更基礎(chǔ)、更關(guān)鍵”,還更像是一種行業(yè)判斷,一種面向未來(lái)的趨勢(shì)預(yù)演。

一年之后,站在MemoryS 2026的會(huì)場(chǎng)里,問(wèn)題已經(jīng)徹底變了。

人們談?wù)摰牟辉僦皇俏辉杀?、顆粒供給和容量節(jié)奏,而是GPU利用率、token成本、系統(tǒng)調(diào)度效率,甚至物理AI場(chǎng)景中的實(shí)時(shí)決策能力。那些原本屬于AI基礎(chǔ)設(shè)施和系統(tǒng)架構(gòu)層面的議題,正在越來(lái)越頻繁地出現(xiàn)在存儲(chǔ)產(chǎn)業(yè)的討論中心。

在傳統(tǒng)計(jì)算架構(gòu)里,存儲(chǔ)的職責(zé)更多是“存”。數(shù)據(jù)被寫(xiě)入、留存,在需要時(shí)調(diào)取,不需要時(shí)則靜靜停留在系統(tǒng)邊緣。它長(zhǎng)期是BOM成本中的一項(xiàng),是容量規(guī)劃的問(wèn)題,而很少直接參與算力效率的定義。

但在大模型訓(xùn)練與推理時(shí)代,這一角色被徹底改寫(xiě)。

KV Cache的訪問(wèn)延遲,開(kāi)始直接影響token生成速率;Checkpoint的寫(xiě)入效率,決定著GPU在訓(xùn)練過(guò)程中的等待時(shí)間;SSD的IOPS密度,則進(jìn)一步影響大模型推理場(chǎng)景下的并發(fā)能力和系統(tǒng)吞吐。

存儲(chǔ)開(kāi)始進(jìn)入計(jì)算主路徑,它決定數(shù)據(jù)流動(dòng)的速度,也在某種程度上決定GPU算力能否被充分兌現(xiàn)。而這,正在反向重塑整個(gè)存儲(chǔ)產(chǎn)業(yè)鏈的分工邏輯。

存儲(chǔ)進(jìn)入計(jì)算路徑,舊分工開(kāi)始失效

AI推理有一個(gè)被反復(fù)討論的瓶頸:KV Cache。

大模型在處理長(zhǎng)上下文時(shí),需要把每一層、每一個(gè)token生成過(guò)程中的Key和Value結(jié)果臨時(shí)保存下來(lái),以避免重復(fù)計(jì)算。上下文越長(zhǎng),并發(fā)越高,這部分緩存的體量就越驚人。

當(dāng)高帶寬顯存無(wú)法繼續(xù)承接,KV Cache只能向下一層存儲(chǔ)介質(zhì)下沉,NVMe SSD由此正式進(jìn)入大模型推理的實(shí)時(shí)數(shù)據(jù)路徑。

如果說(shuō)過(guò)去SSD的使命是“提升加載速度”,那么在AI時(shí)代,它開(kāi)始直接約束或決定推理吞吐的上限。

慧榮科技總經(jīng)理茍嘉章的總結(jié)更為直接:“新一代存儲(chǔ),正在從數(shù)據(jù)存儲(chǔ)進(jìn)入計(jì)算存儲(chǔ)?!?/p>

這句話幾乎點(diǎn)破了整個(gè)行業(yè)變化的本質(zhì)。一旦存儲(chǔ)進(jìn)入計(jì)算路徑,它就不再只是靜態(tài)保存數(shù)據(jù),而是開(kāi)始影響token生成效率:訪問(wèn)時(shí)延影響輸出速度,IOPS密度決定并發(fā)能力,寫(xiě)入效率左右Checkpoint節(jié)奏,最終共同作用于單位token成本。

也正因如此,AI場(chǎng)景對(duì)存儲(chǔ)提出的要求,已經(jīng)明顯超出了“標(biāo)準(zhǔn)顆粒 + 通用主控 + 標(biāo)準(zhǔn)模組產(chǎn)線”這套舊模式的能力邊界。

2026年,全球也許沒(méi)有任何一款主流AI存儲(chǔ)產(chǎn)品能夠?qū)崿F(xiàn)供需平衡。

表面看,這是先進(jìn)產(chǎn)能持續(xù)向高毛利AI產(chǎn)品傾斜,消費(fèi)級(jí)市場(chǎng)被進(jìn)一步擠壓;但更深層的問(wèn)題在于,即便產(chǎn)能跟上,舊有分工模式也難以高效承接AI場(chǎng)景對(duì)定制化、快速迭代的需求。

存儲(chǔ)廠商集體越界

當(dāng)存儲(chǔ)真正進(jìn)入計(jì)算路徑,產(chǎn)業(yè)鏈上原本清晰的角色邊界開(kāi)始松動(dòng):主控廠介入系統(tǒng)定義,模組廠延伸至固件與方案優(yōu)化,各自補(bǔ)全過(guò)去并不屬于自己的能力版圖。

以慧榮為例,傳統(tǒng)主控的核心任務(wù),是管理閃存介質(zhì)、優(yōu)化讀寫(xiě)效率,并在穩(wěn)定性、兼容性和壽命之間尋找平衡。但在AI時(shí)代,這套能力模型已經(jīng)不夠。

如今,慧榮開(kāi)始反復(fù)強(qiáng)調(diào)一種新的能力——性能動(dòng)態(tài)調(diào)節(jié)。

慧榮科技總經(jīng)理茍嘉章在與雷峰網(wǎng)交流時(shí)多次強(qiáng)調(diào),主控需要“根據(jù)工作負(fù)載、功耗和需求量,在動(dòng)態(tài)中快速調(diào)整”。這已經(jīng)不再是傳統(tǒng)意義上的硬件參數(shù)調(diào)優(yōu),而是直接響應(yīng)英偉達(dá)新架構(gòu)中“上下文內(nèi)存存儲(chǔ)(Context Memory Storage)”對(duì)實(shí)時(shí)調(diào)度的需求。


換句話說(shuō),主控正在從“閃存控制器”,演變?yōu)锳I存儲(chǔ)系統(tǒng)里的調(diào)度層,它不只是負(fù)責(zé)把數(shù)據(jù)寫(xiě)進(jìn)去、讀出來(lái),更開(kāi)始參與數(shù)據(jù)在GPU、顯存和SSD之間的流動(dòng)節(jié)奏定義。

這種變化,也在推動(dòng)主控廠進(jìn)一步向下游延伸。

慧榮正在積極與長(zhǎng)江存儲(chǔ)聯(lián)合推進(jìn)車(chē)規(guī)級(jí)方案,目標(biāo)是在第三季度末至第四季度實(shí)現(xiàn)規(guī)模上量,直接供貨國(guó)內(nèi)車(chē)廠。過(guò)去賣(mài)芯片的公司,如今越來(lái)越多地以“聯(lián)合方案提供方”的身份出現(xiàn)。

這意味著主控廠的商業(yè)角色也在變化:一方面向上理解AI工作負(fù)載,把主控納入系統(tǒng)調(diào)度;另一方面向下輸出完整方案,從賣(mài)芯片走向賣(mài)系統(tǒng)能力。

未來(lái)存儲(chǔ)產(chǎn)業(yè)的競(jìng)爭(zhēng),不再只發(fā)生在顆粒、主控或模組層,而是進(jìn)一步延伸到封裝架構(gòu)、異構(gòu)互連和系統(tǒng)級(jí)協(xié)同,是生態(tài)、技術(shù)、產(chǎn)能、客戶(hù)、資本的綜合戰(zhàn)爭(zhēng)。

端側(cè)AI反向定義存儲(chǔ)

AI對(duì)存儲(chǔ)的重構(gòu),顯然不只發(fā)生在數(shù)據(jù)中心。

另一條同樣重要的戰(zhàn)場(chǎng)正在端側(cè)迅速展開(kāi)——AI PC、機(jī)器人、游戲掌機(jī)、智能眼鏡,乃至更多尚未被完全定義的新型終端,都在把存儲(chǔ)推向更核心的位置。

正如眾多廠商在峰會(huì)上提到的,物理AI/端側(cè)AI將迎來(lái)更廣泛的發(fā)展,并帶來(lái)更智能化的體驗(yàn)。而這些更新更好的體驗(yàn)將帶來(lái)更多的產(chǎn)品溢價(jià),足以抵抗存儲(chǔ)價(jià)格上漲的壓力。 “

這句話背后,點(diǎn)出了端側(cè)AI最現(xiàn)實(shí)的商業(yè)邏輯:只要體驗(yàn)提升足夠明顯,存儲(chǔ)成本就不再只是成本,而會(huì)轉(zhuǎn)化為產(chǎn)品價(jià)值的一部分。

但與數(shù)據(jù)中心不同,端側(cè)AI面臨的不是單一性能問(wèn)題,而是高度碎片化的場(chǎng)景挑戰(zhàn)。

一臺(tái)AI PC,需要在本地運(yùn)行大模型,對(duì)存儲(chǔ)的核心訴求是大容量 + 高速讀取;一臺(tái)機(jī)器人,需要在高震動(dòng)、高移動(dòng)性的復(fù)雜環(huán)境中持續(xù)穩(wěn)定運(yùn)行,同時(shí)還要支持后期擴(kuò)容;一副智能眼鏡,則把需求進(jìn)一步推向極致的小尺寸、低功耗和高集成度。

可插拔、可擴(kuò)容、高抗震、小尺寸、高容量——這些要求往往彼此拉扯,很難通過(guò)同一款標(biāo)準(zhǔn)化模組同時(shí)滿足。

這也是為什么,端側(cè)AI正在比數(shù)據(jù)中心更早倒逼存儲(chǔ)方案走向場(chǎng)景化重構(gòu)。

佰維給出的解法非常具有代表性。

針對(duì)機(jī)器人場(chǎng)景,其推出了一套 “BGA SSD + Mini SSD” 的組合方案:BGA SSD直接焊接在主板上,以更強(qiáng)抗震性承擔(dān)系統(tǒng)盤(pán)角色,保障操作系統(tǒng)和本地AI模型穩(wěn)定運(yùn)行;Mini SSD則采用類(lèi)SIM卡槽設(shè)計(jì),支持用戶(hù)無(wú)工具插拔,作為數(shù)據(jù)盤(pán)解決嵌入式設(shè)備后期無(wú)法擴(kuò)容的長(zhǎng)期痛點(diǎn)。

這套方案的關(guān)鍵,并不只是形態(tài)創(chuàng)新,而是它背后的產(chǎn)品邏輯:把“穩(wěn)定”和“靈活”拆分為兩個(gè)獨(dú)立部件,并分別做到最優(yōu)。這本質(zhì)上已經(jīng)不是傳統(tǒng)意義上的“賣(mài)一塊SSD”,而是在重新定義機(jī)器人存儲(chǔ)架構(gòu)。

更值得關(guān)注的是,佰維的動(dòng)作并未停留在單一產(chǎn)品層面。

它正在推動(dòng)Mini SSD從企業(yè)級(jí)方案,進(jìn)一步走向行業(yè)標(biāo)準(zhǔn)。通過(guò)聯(lián)合產(chǎn)業(yè)鏈上下游成立IP公司,并同步制定激勵(lì)機(jī)制和權(quán)益金分配規(guī)則,佰維試圖把“可插拔存儲(chǔ)”推進(jìn)為下一代AI終端的標(biāo)準(zhǔn)能力。

其目標(biāo)場(chǎng)景并不局限于機(jī)器人,而是進(jìn)一步覆蓋AI PC、游戲掌機(jī)等多類(lèi)設(shè)備——這些終端當(dāng)前仍采用不同形態(tài)的本地存儲(chǔ)方案,而Mini SSD的野心,是用統(tǒng)一接口去重新組織它們。

換句話說(shuō),它爭(zhēng)奪的不只是產(chǎn)品份額,而是下一代端側(cè)AI設(shè)備的標(biāo)準(zhǔn)定義權(quán)。

而在這個(gè)過(guò)程中,過(guò)去那套面向PC和手機(jī)時(shí)代的標(biāo)準(zhǔn)化存儲(chǔ)模組,已經(jīng)越來(lái)越難承接碎片化、多形態(tài)、高迭代的終端需求。

更深層的變化在于,設(shè)備與存儲(chǔ)之間的關(guān)系,正在發(fā)生方向性的逆轉(zhuǎn)——過(guò)去,是設(shè)備定義存儲(chǔ):設(shè)備要做什么,存儲(chǔ)就被動(dòng)適配什么。

而現(xiàn)在,隨著本地AI能力越來(lái)越依賴(lài)容量、帶寬、功耗和形態(tài)協(xié)同,存儲(chǔ)開(kāi)始反過(guò)來(lái)影響設(shè)備形態(tài)、產(chǎn)品定義,乃至最終用戶(hù)體驗(yàn)。

下一戰(zhàn):功耗、延遲、智能

AI最大的痛點(diǎn)并非算力不足,而是數(shù)據(jù)在存儲(chǔ)與計(jì)算單元間的頻繁搬運(yùn),降低系統(tǒng)效率。如何減少數(shù)據(jù)在存儲(chǔ)與計(jì)算單元之間的頻繁搬運(yùn),已成為行業(yè)共同攻關(guān)的核心命題。

這句話放在一年前,可能還有點(diǎn)抽象。但經(jīng)過(guò)過(guò)去一年產(chǎn)業(yè)鏈上下游一連串幾乎同步發(fā)生的變化之后,它開(kāi)始落到一個(gè)個(gè)極其具體的技術(shù)指標(biāo)上:KV Cache的訪問(wèn)時(shí)延、Checkpoint的寫(xiě)入效率、單位token成本等等。

過(guò)去十年,產(chǎn)業(yè)比拼的是單位容量的成本;下一個(gè)十年,勝負(fù)手將取決于數(shù)據(jù)在計(jì)算與存儲(chǔ)之間流動(dòng)的效率、功耗與智能。

至于那些仍固守在舊分工里、只盯著顆粒價(jià)格波動(dòng)的玩家,留給他們的時(shí)間,或許真的不多了。

雷峰網(wǎng)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
又有官二代要坑爹?找茬刁難服務(wù)人員,并威脅:你知道我爹是咱們區(qū)的誰(shuí)嗎?

又有官二代要坑爹?找茬刁難服務(wù)人員,并威脅:你知道我爹是咱們區(qū)的誰(shuí)嗎?

小蘿卜絲
2026-04-10 18:37:25
央視緊急提醒!手機(jī)綁銀行卡,這2個(gè)設(shè)置不開(kāi),錢(qián)沒(méi)了都不知道

央視緊急提醒!手機(jī)綁銀行卡,這2個(gè)設(shè)置不開(kāi),錢(qián)沒(méi)了都不知道

娛樂(lè)圈見(jiàn)解說(shuō)
2026-04-10 09:19:37
演員趙達(dá)官宣結(jié)婚,周也發(fā)文祝賀:“恭喜舅舅,新婚快樂(lè)”

演員趙達(dá)官宣結(jié)婚,周也發(fā)文祝賀:“恭喜舅舅,新婚快樂(lè)”

韓小娛
2026-04-11 11:46:56
鄭麗文對(duì)“和平統(tǒng)一”表態(tài)后,宋楚瑜發(fā)聲,郭正亮一句話亮了!

鄭麗文對(duì)“和平統(tǒng)一”表態(tài)后,宋楚瑜發(fā)聲,郭正亮一句話亮了!

達(dá)文西看世界
2026-04-11 10:47:38
全紅嬋后續(xù):香港媒體爆料,廣東體委撐腰,滬圈京圈打壓窮孩子!

全紅嬋后續(xù):香港媒體爆料,廣東體委撐腰,滬圈京圈打壓窮孩子!

眼光很亮
2026-04-10 14:29:21
鄭麗文女保鏢火了!她的眼神讓全場(chǎng)震驚。

鄭麗文女保鏢火了!她的眼神讓全場(chǎng)震驚。

小貓娛樂(lè)叭叭
2026-04-09 21:03:31
中東停戰(zhàn)不到48小時(shí),高市突然調(diào)轉(zhuǎn)槍口對(duì)準(zhǔn)中國(guó),30國(guó)大使將訪日

中東停戰(zhàn)不到48小時(shí),高市突然調(diào)轉(zhuǎn)槍口對(duì)準(zhǔn)中國(guó),30國(guó)大使將訪日

書(shū)紀(jì)文譚
2026-04-10 19:04:38
油價(jià),暴跌!

油價(jià),暴跌!

環(huán)球網(wǎng)資訊
2026-04-11 13:32:09
阿爾忒彌斯2號(hào)成功濺落,隔熱罩驚險(xiǎn)過(guò)關(guān)

阿爾忒彌斯2號(hào)成功濺落,隔熱罩驚險(xiǎn)過(guò)關(guān)

DeepTech深科技
2026-04-11 09:54:58
女大學(xué)生吐槽“普信男”視頻火了,卻因長(zhǎng)相被嘲:你也照照鏡子吧

女大學(xué)生吐槽“普信男”視頻火了,卻因長(zhǎng)相被嘲:你也照照鏡子吧

妍妍教育日記
2026-04-11 07:35:08
百億遺產(chǎn)說(shuō)扔就扔?73歲遲重瑞現(xiàn)身寺廟,白巖松一語(yǔ)道破小心思

百億遺產(chǎn)說(shuō)扔就扔?73歲遲重瑞現(xiàn)身寺廟,白巖松一語(yǔ)道破小心思

動(dòng)物奇奇怪怪
2026-04-11 09:51:59
阿耳忒彌斯2號(hào)最終一搏:13分鐘穿越2760℃,時(shí)隔53年月球歸來(lái)大考

阿耳忒彌斯2號(hào)最終一搏:13分鐘穿越2760℃,時(shí)隔53年月球歸來(lái)大考

三體引力波
2026-04-11 01:02:06
以色列對(duì)歐洲譴責(zé)其襲擊黎巴嫩真主黨的反問(wèn)

以色列對(duì)歐洲譴責(zé)其襲擊黎巴嫩真主黨的反問(wèn)

名人茍或
2026-04-11 06:54:11
標(biāo)120W的充電器實(shí)際功率僅22.5W,商家:120W是產(chǎn)品型號(hào)

標(biāo)120W的充電器實(shí)際功率僅22.5W,商家:120W是產(chǎn)品型號(hào)

極目新聞
2026-04-11 00:53:31
鄭麗文在北京新造型!穿藍(lán)紫色西服彰顯貴氣,還雙手背后很有氣勢(shì)

鄭麗文在北京新造型!穿藍(lán)紫色西服彰顯貴氣,還雙手背后很有氣勢(shì)

八八尚語(yǔ)
2026-04-10 12:58:23
巴基斯坦大批預(yù)警機(jī)升空,給以色列上了一課:中方顯然背后指點(diǎn)了

巴基斯坦大批預(yù)警機(jī)升空,給以色列上了一課:中方顯然背后指點(diǎn)了

安安說(shuō)
2026-04-11 11:30:55
烏克蘭摧毀俄羅斯最后一艘鐵路輪渡,俄羅斯占領(lǐng)烏東四州的目標(biāo)更加虛無(wú)

烏克蘭摧毀俄羅斯最后一艘鐵路輪渡,俄羅斯占領(lǐng)烏東四州的目標(biāo)更加虛無(wú)

李未熟擒話2
2026-04-11 11:42:35
縣城少婦們的幸福感很強(qiáng)

縣城少婦們的幸福感很強(qiáng)

微微熱評(píng)
2026-04-11 12:04:02
笑噴全網(wǎng)!高速路上妻子數(shù)落丈夫停不下來(lái),貓咪聽(tīng)不下去直接捂嘴

笑噴全網(wǎng)!高速路上妻子數(shù)落丈夫停不下來(lái),貓咪聽(tīng)不下去直接捂嘴

搗蛋窩
2026-04-11 10:57:44
時(shí)隔半世紀(jì)人類(lèi)再出發(fā),美國(guó)繞月展示的技術(shù)差距,中國(guó)必須正視

時(shí)隔半世紀(jì)人類(lèi)再出發(fā),美國(guó)繞月展示的技術(shù)差距,中國(guó)必須正視

無(wú)人傾聽(tīng)無(wú)人傾聽(tīng)
2026-04-10 22:43:33
2026-04-11 15:20:49
雷峰網(wǎng) incentive-icons
雷峰網(wǎng)
關(guān)注智能與未來(lái)!
68978文章數(shù) 656108關(guān)注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

媒體:多套雷達(dá)系統(tǒng)受損 美國(guó)尷尬發(fā)現(xiàn)"又要求助中國(guó)"

頭條要聞

媒體:多套雷達(dá)系統(tǒng)受損 美國(guó)尷尬發(fā)現(xiàn)"又要求助中國(guó)"

體育要聞

換帥之后,他們從降級(jí)區(qū)沖到升級(jí)區(qū)

娛樂(lè)要聞

浪姐7淘汰 該走的沒(méi)走,不該走的走了

財(cái)經(jīng)要聞

從日本翻身看:這次誰(shuí)能扛住高油價(jià)?

汽車(chē)要聞

煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

態(tài)度原創(chuàng)

本地
旅游
親子
公開(kāi)課
軍事航空

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

旅游要聞

藍(lán)色浪漫大片!上海這里已成夢(mèng)幻花海,一秒走入偶像劇中!

親子要聞

碳板跑鞋又貴,又有害健康,但為什么小孩哥都這么喜歡?

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗議長(zhǎng)帶四名遇難兒童照片赴美伊談判

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版