国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

這些趨勢(shì)推動(dòng)2026年進(jìn)入“內(nèi)存超級(jí)周期”

0
分享至

“超級(jí)周期”這個(gè)詞,再次回到了存儲(chǔ)半導(dǎo)體的敘事中心。

過(guò)去,內(nèi)存價(jià)格起起伏伏,總被視為資本開支與庫(kù)存的游戲。2021年,行業(yè)沉浸于短缺經(jīng)濟(jì)的繁榮之中,兩年后,行業(yè)又旋即陷入“傳統(tǒng)周期”低谷,三巨頭的美光、三星與SK海力士,利潤(rùn)率無(wú)一不是跌破零點(diǎn)。


正是GPT的橫空出世,重新定義了內(nèi)存的價(jià)值。AI的性能,很大程度上去取決于它們存儲(chǔ)數(shù)據(jù)的方式,訪問數(shù)據(jù)的速度,以及可以儲(chǔ)存的數(shù)據(jù)的規(guī)模。計(jì)算是能源的處理形式,但能源也越來(lái)越多地用于數(shù)據(jù)不斷寫入、讀出與傳輸。彼時(shí),為內(nèi)存這一標(biāo)準(zhǔn)化的“大宗商品”帶去新生的是HBM。

如果機(jī)械照搬四五年一輪回的“傳統(tǒng)周期”,很快內(nèi)存行業(yè)又將陷入低谷。但這一次,行業(yè)相信AI正在改寫這條曲線。需求不再僅僅是短期庫(kù)存回補(bǔ),而是對(duì)計(jì)算、帶寬及能效的結(jié)構(gòu)性重塑。

賣方市場(chǎng)

整個(gè)AI都是芯片的賣方市場(chǎng)。硅谷巨頭們陷入了第二波AI基建熱潮,不僅GPU短缺,HBM同樣短缺。SK海力士明年的訂單也早已售罄。

面向數(shù)據(jù)中心的HBM,由堆疊的DRAM構(gòu)建而成,創(chuàng)造了更高的價(jià)值。它與主要面向消費(fèi)電子市場(chǎng)的DDR,存在產(chǎn)能分配矛盾。從Ampere到Blackwell Ultra,HBM不僅在AI基礎(chǔ)設(shè)施硬件中的材料清單(BOM)中成本超過(guò)一半,而且還在繼續(xù)增長(zhǎng);在BOM增長(zhǎng)中,絕對(duì)和相對(duì)增長(zhǎng)的最大部分,都來(lái)自HBM。因此,內(nèi)存巨頭們也更有動(dòng)力將產(chǎn)能分配給它。

另一方面,消費(fèi)電子也在接受AI的棲身;又撞上了PC換機(jī)周期。最近,蘋果已經(jīng)開始搶購(gòu)三星明年二季度出貨的LPDDR5X內(nèi)存(低功耗版),以應(yīng)對(duì)已經(jīng)遲到的個(gè)人AI體驗(yàn);小米干脆宣布上調(diào)新品售價(jià)。

盡管NAND領(lǐng)域與DRAM沒有直接的產(chǎn)能分配矛盾,但它們往往在資本開支層面此消彼長(zhǎng)。這也導(dǎo)致內(nèi)存的“超級(jí)周期”從DRAM領(lǐng)域蔓延至NAND領(lǐng)域。另一方面,隨著Veo 3與Sora 2將視頻生成推向競(jìng)爭(zhēng)前沿,AI對(duì)于大容量?jī)?chǔ)存的需求,本身也在飛漲。上個(gè)月,閃迪率先宣布漲價(jià),全系上調(diào)10%;這個(gè)月,三星和SK海力士更是提價(jià)高達(dá)30%。

市場(chǎng)普遍預(yù)計(jì),這場(chǎng)由AI驅(qū)動(dòng)的供應(yīng)短缺,不只是供需錯(cuò)配的結(jié)果,將比以往任何一次“傳統(tǒng)”的繁榮周期都更長(zhǎng)、更強(qiáng)。

以內(nèi)存為中心視角的AI基礎(chǔ)設(shè)施


這張來(lái)自Seagate(希捷)的圖示,清晰地展示了,在AI基礎(chǔ)設(shè)施的整體架構(gòu)中,各類存儲(chǔ)(Storage )與內(nèi)存(Memory)產(chǎn)品在不同環(huán)節(jié)中的分工與作用。

GPU或XPU等處理器,與HBM/DRAM緊密耦合,從而構(gòu)建出強(qiáng)大的計(jì)算集群(Compute Cluster)。越靠近GPU,數(shù)據(jù)就越“熱”,也就越需要更高的帶寬與更低的延遲。最終,這些數(shù)據(jù)會(huì)流入一個(gè)基于HDD(機(jī)械硬盤)或SSD(固態(tài)硬盤)構(gòu)建的網(wǎng)絡(luò)化存儲(chǔ)集群(Storage Cluster),“冷卻”下來(lái),用于長(zhǎng)期保存。它們?nèi)萘扛螅杀靖?,速度則會(huì)更慢。

在過(guò)去,大模型預(yù)訓(xùn)練是AI基礎(chǔ)設(shè)施的主要需求。這是一個(gè)數(shù)據(jù)如何被存儲(chǔ)、預(yù)處理、分發(fā),以及模型權(quán)重如何更新的流程。龐大的訓(xùn)練數(shù)據(jù)集通常存放在存儲(chǔ)集群,前端配備了一層SSD緩存,以提高讀取效率。訓(xùn)練開始前,數(shù)據(jù)會(huì)被token化,以二進(jìn)制格式寫入SSD。在訓(xùn)練中,這些token會(huì)被分批(batch)加載到GPU,使得HBM得以充分利用;模型的權(quán)重與狀態(tài)會(huì)周期性地保存為檢查點(diǎn)(checkpoints),存放在NVMe(基于PCIe總線的高性能存儲(chǔ)協(xié)議)SSD上,以便中斷后快速恢復(fù)。

如今,推理已成為新的主角。它意味著模型權(quán)重、鍵值緩存(KV cache)以及RAG(檢索增強(qiáng)生成)的不同數(shù)據(jù)訪問模式。在這個(gè)過(guò)程中,模型參數(shù)不再頻繁重寫,也讓不擅長(zhǎng)此道的NAND獲得新的機(jī)會(huì)。當(dāng)查詢觸發(fā)時(shí),模型權(quán)重必須加載到HBM。隨后生成的鍵值矩陣(KV matrices),也會(huì)暫存在HBM中,用于后續(xù)注意力計(jì)算。如果KV緩存過(guò)大,就要先后分層卸載(offload)至DRAM與SSD中。RAG的向量數(shù)據(jù)庫(kù)通常也存放在SSD上,在推理時(shí)快速檢索并載入HBM。

容量、帶寬與成本,構(gòu)成了AI基礎(chǔ)設(shè)施中內(nèi)存技術(shù)的“不可能三角”。但市場(chǎng)仍試圖突破邊界,或同時(shí)提升三者上限,或在特定應(yīng)用中強(qiáng)化某一項(xiàng)性能。這為即將到來(lái)的“超級(jí)周期” 注入了新的結(jié)構(gòu)性增量與想象力。

定制HBM

不斷擴(kuò)展的大模型,對(duì)帶寬的追求也沒有盡頭。越靠近計(jì)算核心的內(nèi)存,就越成為性能提升的關(guān)鍵。被稱為“HBM之父”的,已經(jīng)將HBM的路線圖,規(guī)劃至 2038年。從HBM4到HBM8,每一代都在推高帶寬、速度與容量上限,其中帶寬的提升尤為顯著。


如今,SK海力士、美光與三星已經(jīng)進(jìn)入HBM4的首輪競(jìng)速。三家公司已經(jīng)先后向英偉達(dá)送樣,HBM4將成為2026 年下一代AI基礎(chǔ)設(shè)施與AI加速芯片的標(biāo)準(zhǔn)配置。

但正如AI芯片,HBM也開始講訴同樣的敘事。為了壓縮能耗、減少延遲與信號(hào)損失,AI芯片廠商開始與存儲(chǔ)廠深度共設(shè)計(jì)(co-design),推出定制化基底裸片(custom base die)。這意味著HBM堆疊底部的邏輯層不再通用,而是針對(duì)特定AI架構(gòu)優(yōu)化信號(hào)路徑、電源分配與接口協(xié)議,從而實(shí)現(xiàn)更高的能效和帶寬密度。這是一次革新架構(gòu)層面的重大飛躍,徹底改變了HBM與AI加速器的集成方式。

今年6月,SK海力士同時(shí)鎖定了英偉達(dá)、微軟、博通,達(dá)成HBM4E定制合作;三星也在與博通、AMD談判。英偉達(dá)已經(jīng)拿出了自己的基礎(chǔ)裸片的設(shè)計(jì),預(yù)計(jì)2027年小規(guī)模量產(chǎn)。它現(xiàn)在不僅要自己掌握GPU、CPU與網(wǎng)絡(luò),還要掌握HBM,未來(lái)無(wú)論HBM由哪家制造,都必須兼容它的底層架構(gòu)。亞馬遜AWS高管直言,HBM定制化“可能會(huì)關(guān)閉其他玩家的大門”。

存算一體

如果HBM代表著“更大的帶寬”,那么“更近的距離”也是業(yè)界開始思考大幅降低數(shù)據(jù)延遲的另一條路徑。初創(chuàng)企業(yè)d-Matrix就認(rèn)為,與其堆疊更多帶寬,不如直接。

在今年夏天的 Hot Chips 2025 上,這家成立于2019年的企業(yè),展示了這種理念的最新形態(tài)。它就是Pavehawk 架構(gòu),其核心是3D堆疊數(shù)字內(nèi)存計(jì)算(3DIMC)技術(shù),使用改進(jìn)型SRAM單元,在內(nèi)存內(nèi)部直接執(zhí)行計(jì)算。通過(guò)在垂直方向上將計(jì)算層與存儲(chǔ)層堆疊,數(shù)據(jù)移動(dòng)距離被壓縮到極限。它還發(fā)布了存算一體的Corsair芯片,宣稱帶寬性能比HBM4高出10倍,能耗則降低90%。


到了OCP全球峰會(huì)2025上,d-Matrix更進(jìn)一步,展示了機(jī)架級(jí)解決方案 SquadRack。它在性價(jià)比、能效、token生成速度上,分別提升了3倍、3倍、10倍。單機(jī)架可以運(yùn)行千億參數(shù)大模型;想要部署更大的模型,還可以通過(guò)以太網(wǎng)橫向擴(kuò)展。明年,這家公司還會(huì)拿出迭代后的Raptor架構(gòu)。

推理工作負(fù)載正遷移至邊緣與端側(cè)。隨著小模型性能逐步提升,存算一體能在延遲高度敏感的應(yīng)用場(chǎng)景下找到自己的機(jī)會(huì)。側(cè)重SRAM層面的創(chuàng)新,也是Groq等芯片初創(chuàng)企業(yè)努力突破的方向。

熱數(shù)據(jù)擴(kuò)展

隨著推理負(fù)載不斷擴(kuò)大,壓力也在從DARM向NAND傳導(dǎo)。當(dāng)上下文窗口與并發(fā)請(qǐng)求同時(shí)增長(zhǎng)時(shí),推理系統(tǒng)開始需要一種更廉價(jià)、更大容量的“緩沖層”。這讓SSD成為了創(chuàng)新焦點(diǎn)。

當(dāng)初,為了減輕HBM的壓力,無(wú)論是英偉達(dá)的Dynamo Distributed KVCache Manager框架,還是華為的UCM技術(shù),都在通過(guò)多級(jí)緩存算法,將訪問壓力逐層下沉到存儲(chǔ)層。但HDD帶寬實(shí)在太低,帶寬性能(BW/TB)反而隨著單盤容量持續(xù)提升而逐年下降。而主流TLC(三層單元)SSD容量稍顯不足;一個(gè)單位SLC(單層單元)能儲(chǔ)存1個(gè)比特(2種狀態(tài)),到了量產(chǎn)級(jí)的最新主流技術(shù)QLC(四層單元)則能儲(chǔ)存4個(gè)比特,相當(dāng)于閃存容量翻了16倍。


今年年中,Meta宣布與PureStorage合作,將QLC SSD引入數(shù)據(jù)中心架構(gòu),以取代部分HDD和TLC SSD。Meta認(rèn)為,盡管TLC在寫入密集型環(huán)境中仍具優(yōu)勢(shì),但QLC擁有更高密度、更好能效和更低的每TB成本,足以承擔(dān)“熱數(shù)據(jù)”的一部分任務(wù)。

HBF終局

如果說(shuō)HBM代表著DRAM的堆疊形態(tài),那么HBF則是NAND的堆疊形態(tài)。前者在內(nèi)存層級(jí)持續(xù)追求更高帶寬,后者則在存儲(chǔ)層級(jí)探索更高帶寬與更大容量。這種架構(gòu)尤其適合向量數(shù)據(jù)庫(kù)與AI智能體等場(chǎng)景,它們渴求內(nèi)存容量的高速增長(zhǎng)。

金教授相信,未來(lái),HBF將左右整個(gè)業(yè)界的性能表現(xiàn)。力積電(Powerchip)也是這么想的,在上周的財(cái)報(bào)發(fā)布會(huì)上表示,HBF將成為未來(lái)的重要技術(shù),能夠滿足文本、圖像甚至視頻模型帶來(lái)的超大規(guī)模存儲(chǔ)需求。Rubin CPX的出現(xiàn)已經(jīng)證明,并非所有階段都必須超高的內(nèi)存帶寬;是時(shí)候追求更高的內(nèi)存容量了。

當(dāng)前,HBM最大的短板正是容量。由于DRAM采用“1T1C”結(jié)構(gòu),即每個(gè)單元包含一個(gè)晶體管(Transistor)和一個(gè)電容(Capacitor),其擴(kuò)展空間已經(jīng)逼近物理極限,內(nèi)存密度難以繼續(xù)提升。相比之下,NAND采用單晶體管浮柵(floating gate)結(jié)構(gòu),單元間距更緊湊,便于擴(kuò)展?;贜AND的架構(gòu)可實(shí)現(xiàn)比HBM高8至16倍的存儲(chǔ)密度,并在相近成本下提供可比的讀取帶寬。

今年8月,閃迪(SanDisk)與SK海力士簽署了諒解備忘錄(MoU),宣布共同開發(fā)HBF產(chǎn)品,首批樣品預(yù)計(jì)將于2026年下半年面市。在本月的OCP大會(huì)上,SK海力士官宣了“AI-NAND B”系列,正是一款通過(guò)堆疊NAND閃存以擴(kuò)大帶寬的HBF。

AI時(shí)代,AI基礎(chǔ)設(shè)施中的內(nèi)存棧正在被逐步重構(gòu)。大模型的未來(lái),取決于它能裝下多少數(shù)據(jù),又能以多快的速度讀寫這些數(shù)據(jù)。市場(chǎng)在擴(kuò)產(chǎn)HBM,滿足周期性上行的需求,也在發(fā)明新的內(nèi)存形態(tài),創(chuàng)造新的增量市場(chǎng)。于是,內(nèi)存或許真的迎來(lái)了屬于自己的“超級(jí)周期”。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
株洲殺豬宴失控!央視新華社接連怒批,句句戳心窩,這下麻煩大了

株洲殺豬宴失控!央視新華社接連怒批,句句戳心窩,這下麻煩大了

以茶帶書
2026-01-24 23:18:39
中國(guó)隊(duì)丟冠僅1夜,隊(duì)長(zhǎng)赴英超!王鈺棟遭批:態(tài)度有問題 基本廢了

中國(guó)隊(duì)丟冠僅1夜,隊(duì)長(zhǎng)赴英超!王鈺棟遭批:態(tài)度有問題 基本廢了

侃球熊弟
2026-01-25 10:37:48
1970年陳獨(dú)秀女兒被批斗后,打算偷渡香港,結(jié)果剛上岸就遇到警察

1970年陳獨(dú)秀女兒被批斗后,打算偷渡香港,結(jié)果剛上岸就遇到警察

鑒史錄
2026-01-22 18:43:41
日媒:最新民調(diào)顯示高市內(nèi)閣支持率暴跌10%,解散眾議院決定引不滿

日媒:最新民調(diào)顯示高市內(nèi)閣支持率暴跌10%,解散眾議院決定引不滿

環(huán)球網(wǎng)資訊
2026-01-25 16:06:11
美國(guó)“退群”,加州“入群”

美國(guó)“退群”,加州“入群”

極目新聞
2026-01-24 18:34:19
太猛了,特斯拉中國(guó)官宣降價(jià)!

太猛了,特斯拉中國(guó)官宣降價(jià)!

XCiOS俱樂部
2026-01-24 20:44:49
美國(guó)放話:誰(shuí)敢攔截軍售,就是宣戰(zhàn)!中國(guó)用實(shí)力劃下紅線!

美國(guó)放話:誰(shuí)敢攔截軍售,就是宣戰(zhàn)!中國(guó)用實(shí)力劃下紅線!

華山穹劍
2026-01-23 20:19:29
多地將器官捐獻(xiàn)納入“見義勇為”評(píng)定,專家稱概念擴(kuò)展需審慎

多地將器官捐獻(xiàn)納入“見義勇為”評(píng)定,專家稱概念擴(kuò)展需審慎

澎湃新聞
2026-01-24 22:55:05
隊(duì)記:這應(yīng)該是詹姆斯第一次意識(shí)到,自己已經(jīng)不再受湖人高層歡迎

隊(duì)記:這應(yīng)該是詹姆斯第一次意識(shí)到,自己已經(jīng)不再受湖人高層歡迎

移動(dòng)擋拆
2026-01-25 06:41:41
廣州人注意!陽(yáng)性率上升,傳染性強(qiáng)!目前暫無(wú)疫苗或者特效藥!

廣州人注意!陽(yáng)性率上升,傳染性強(qiáng)!目前暫無(wú)疫苗或者特效藥!

羊城攻略
2026-01-24 22:58:42
張宗遜明明戰(zhàn)功高、資歷老,卻沒能評(píng)上大將,這事兒和惹惱兩大元帥毫無(wú)關(guān)系,真正原因另有他處

張宗遜明明戰(zhàn)功高、資歷老,卻沒能評(píng)上大將,這事兒和惹惱兩大元帥毫無(wú)關(guān)系,真正原因另有他處

清風(fēng)鑒史
2025-12-24 13:59:10
殺豬宴后呆呆首場(chǎng)直播:辟謠不是23歲而是91年,未婚,并未入編!

殺豬宴后呆呆首場(chǎng)直播:辟謠不是23歲而是91年,未婚,并未入編!

天天熱點(diǎn)見聞
2026-01-25 08:46:20
平均每人負(fù)債1300萬(wàn),書記吳仁寶去世10年后,華西村的現(xiàn)況如何?

平均每人負(fù)債1300萬(wàn),書記吳仁寶去世10年后,華西村的現(xiàn)況如何?

哄動(dòng)一時(shí)啊
2026-01-24 21:29:54
離譜!挪威帝王蟹堆成山,中國(guó)人買一只卻要花上千,原因太現(xiàn)實(shí)

離譜!挪威帝王蟹堆成山,中國(guó)人買一只卻要花上千,原因太現(xiàn)實(shí)

掉了顆大白兔糖
2026-01-25 07:34:58
2025年新生兒僅有792萬(wàn),一個(gè)重要原因是育兒的廉價(jià)勞動(dòng)力已經(jīng)不足了

2025年新生兒僅有792萬(wàn),一個(gè)重要原因是育兒的廉價(jià)勞動(dòng)力已經(jīng)不足了

風(fēng)向觀察
2026-01-25 12:07:51
美國(guó)運(yùn)動(dòng)員霍諾德成功徒手攀爬508米高臺(tái)北101,耗時(shí)約1小時(shí)31分鐘

美國(guó)運(yùn)動(dòng)員霍諾德成功徒手攀爬508米高臺(tái)北101,耗時(shí)約1小時(shí)31分鐘

瀟湘晨報(bào)
2026-01-25 12:00:17
突發(fā)!美聯(lián)儲(chǔ),大消息!

突發(fā)!美聯(lián)儲(chǔ),大消息!

魏家東
2026-01-25 14:29:25
A股:人民日?qǐng)?bào)罕見就股市發(fā)聲!證監(jiān)會(huì)監(jiān)管升溫,下周迎更大級(jí)別變盤

A股:人民日?qǐng)?bào)罕見就股市發(fā)聲!證監(jiān)會(huì)監(jiān)管升溫,下周迎更大級(jí)別變盤

股市皆大事
2026-01-25 16:52:15
日本U23主帥:面對(duì)更年長(zhǎng)、對(duì)抗強(qiáng)硬的中國(guó)隊(duì),我們踢出了該有的水平

日本U23主帥:面對(duì)更年長(zhǎng)、對(duì)抗強(qiáng)硬的中國(guó)隊(duì),我們踢出了該有的水平

懂球帝
2026-01-25 01:51:15
安東尼奧即將成為國(guó)奧主帥,兩年后將挑戰(zhàn)40年魔咒

安東尼奧即將成為國(guó)奧主帥,兩年后將挑戰(zhàn)40年魔咒

澎湃新聞
2026-01-25 14:07:05
2026-01-25 19:07:00
未盡研究 incentive-icons
未盡研究
新能源、人工智能、合成生物、地緣X
292文章數(shù) 61關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

隋廣義等80人被公訴 千億騙局進(jìn)入末路

頭條要聞

游客自稱爬衡山時(shí)掛脖子上80克金牌遺失 價(jià)值超10萬(wàn)元

頭條要聞

游客自稱爬衡山時(shí)掛脖子上80克金牌遺失 價(jià)值超10萬(wàn)元

體育要聞

中國(guó)足球不會(huì)一夜變強(qiáng),但他們已經(jīng)創(chuàng)造歷史

娛樂要聞

王玉雯方嚴(yán)正聲明 劇方回應(yīng):涉事人員已被開除

科技要聞

黃仁勛在上海逛菜市場(chǎng),可能惦記著三件事

汽車要聞

別克至境E7內(nèi)飾圖曝光 新車將于一季度正式發(fā)布

態(tài)度原創(chuàng)

房產(chǎn)
親子
教育
旅游
手機(jī)

房產(chǎn)要聞

正式官宣!三亞又一所名校要來(lái)了!

親子要聞

她是折翼的蝴蝶寶貝,卻也是被父母捧在手心的無(wú)價(jià)之寶??!素材來(lái)源

教育要聞

看似復(fù)雜,尖子生一個(gè)技巧口算

旅游要聞

一秒入仙境!金佛山冬雪、日出、云海絕美同框

手機(jī)要聞

榮耀泡泡瑪特聯(lián)名手機(jī)今日開售:首銷即引爆,線下再現(xiàn)排隊(duì)熱潮

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版