国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AMD:內(nèi)存而非算力,將成為AI數(shù)據(jù)中心的下一個瓶頸

0
分享至


AMD正將內(nèi)存重新定位為AI時代數(shù)據(jù)中心的核心瓶頸,認(rèn)為其已成為制約系統(tǒng)性能與能耗的關(guān)鍵因素。

AMD在近期發(fā)布的一篇官方博客中指出,隨著模型規(guī)模持續(xù)擴(kuò)大、推理任務(wù)日趨密集,現(xiàn)代AI工作負(fù)載正在暴露傳統(tǒng)服務(wù)器內(nèi)存架構(gòu)的局限性。這一制約越來越體現(xiàn)在物理層面:數(shù)據(jù)的搬運效率,而非單純的計算能力,正在成為影響系統(tǒng)整體效率的主導(dǎo)因素。

"這個問題很難量化,因為內(nèi)存架構(gòu)種類繁多,"Moor Insights & Strategy副總裁兼首席分析師Matt Kimball表示,"HBM、DDR、SRAM和LPDDR各有不同。"

常見內(nèi)存類型簡介

SRAM(靜態(tài)隨機(jī)存取內(nèi)存):速度極快、延遲極低的片上內(nèi)存(例如緩存)。效率高但容量有限,成本較高。

HBM(高帶寬內(nèi)存):通過堆疊結(jié)構(gòu)實現(xiàn)超大帶寬,效率較強(qiáng),廣泛應(yīng)用于GPU及AI加速器。

LPDDR(低功耗雙倍數(shù)據(jù)率內(nèi)存):專為低功耗場景優(yōu)化,長期用于移動設(shè)備,如今逐步向特定服務(wù)器工作負(fù)載延伸。

DDR(雙倍數(shù)據(jù)率動態(tài)內(nèi)存):標(biāo)準(zhǔn)服務(wù)器內(nèi)存,容量大、通用性強(qiáng),但相較新型方案效率較低。

Kimball進(jìn)一步梳理了一套大致的效率層級:SRAM性能最強(qiáng),其次是HBM和LPDDR,DDR通用性最高但效率相對最低。各類內(nèi)存各司其職,直接比較并不精確,但在方向上具有參考價值。

這一判斷與AMD的立場高度吻合——內(nèi)存已成為驅(qū)動AI系統(tǒng)性能與能耗的重要因素。

"內(nèi)存越來越成為關(guān)鍵組件,對性能和功耗都構(gòu)成實質(zhì)性的一階約束,"Kimball說,"隨著模型規(guī)模擴(kuò)大、推理持續(xù)化趨勢加深,快速高效地搬運和訪問數(shù)據(jù),與原始算力同等重要。"

AMD為何力推LPDDR5X進(jìn)入服務(wù)器市場

AMD博客的核心主題是LPDDR5X。AMD將其定位為在AI和云計算環(huán)境中提升每瓦性能的解決方案。LPDDR此前主要用于移動和客戶端設(shè)備,在服務(wù)器領(lǐng)域的應(yīng)用受限于容量、可維護(hù)性及生態(tài)系統(tǒng)成熟度等問題。AMD表示,這些限制正逐步緩解,為其在數(shù)據(jù)中心的廣泛應(yīng)用打開了空間。

LPDDR5X的工作電壓低于DDR5,可有效降低內(nèi)存子系統(tǒng)的功耗,在供電和散熱條件受限的環(huán)境中優(yōu)勢明顯。在機(jī)架規(guī)模下,這些節(jié)省會不斷積累。隨著功耗預(yù)算持續(xù)攀升、散熱成為瓶頸,內(nèi)存效率的邊際改善可轉(zhuǎn)化為可觀的總擁有成本收益。

向混合內(nèi)存架構(gòu)轉(zhuǎn)型

這篇博客折射出業(yè)界更廣泛的轉(zhuǎn)變趨勢——從標(biāo)準(zhǔn)化DIMM(雙列直插內(nèi)存模塊)走向針對特定工作負(fù)載的內(nèi)存架構(gòu)。

"我并不認(rèn)為這是一個小眾方向,"Kimball說,"LPDDR在某種程度上是市場更大范圍轉(zhuǎn)型的組成部分,背后是工作負(fù)載專屬內(nèi)存架構(gòu)的興起,也就是'為正確的工作負(fù)載選配正確的內(nèi)存'。"

運營商正越來越多地將HBM、LPDDR、SRAM和池化內(nèi)存混合使用,以匹配不同工作負(fù)載的需求。"傳統(tǒng)的'一刀切'DIMM模式正在讓位于我們所看到的這種混合形態(tài)——HBM、DDR、LPDDR、SRAM,乃至池化內(nèi)存,"他說,"每一種都針對不同的工作負(fù)載進(jìn)行了優(yōu)化。"

AMD將AI推理視為這一趨勢的核心驅(qū)動力。推理的不同階段對帶寬、延遲和功耗有著截然不同的需求。

"HBM非常適合在預(yù)填充階段以并行方式輸送大量數(shù)據(jù),而SRAM則主導(dǎo)解碼階段——實現(xiàn)真正快速的、基于Token的逐Token生成,"Kimball說。

由此形成的是一個更加異構(gòu)但也更加高效的內(nèi)存棧。

尚未解決的問題:可靠性、可維護(hù)性與生態(tài)系統(tǒng)

LPDDR在服務(wù)器端的普及障礙,不僅是技術(shù)層面的,更是運營層面的。與傳統(tǒng)DIMM不同,LPDDR通常采用焊接方式安裝,這限制了可維護(hù)性,也在生產(chǎn)環(huán)境中引發(fā)了可靠性方面的顧慮。AMD著重介紹了SOCAMM(小型壓縮附接內(nèi)存模塊)等新興封裝形式,認(rèn)為其有望在效率與可替換性之間取得平衡。

"LPDDR在規(guī)模化部署中確實能帶來顯著的效率提升,"Kimball表示,"這里說的不只是單個機(jī)架,而是'成規(guī)模的機(jī)架群'——功耗和散熱都是固定約束的場景。"

但權(quán)衡取舍依然存在。"可靠性、可維護(hù)性以及生態(tài)系統(tǒng)成熟度仍然至關(guān)重要,"他說,"這也是SOCAMM等封裝形式的價值所在——它們試圖在效率與生產(chǎn)基礎(chǔ)設(shè)施的現(xiàn)實需求之間架起橋梁。"

這些差距目前尚未完全彌合。"滯后確實存在,"Kimball坦言。

尚處早期,但方向明確

AMD的這篇博客并未提出全新概念,而是對AI基礎(chǔ)設(shè)施領(lǐng)域已有趨勢的系統(tǒng)性梳理。

"我最大的感觸在于,內(nèi)存架構(gòu)的異構(gòu)化是真實存在的,并且正在向企業(yè)AI領(lǐng)域加速滲透,"Kimball說,"但我們?nèi)蕴幱谠缙陔A段,我認(rèn)為未來會逐步走向整合。"

對于運營商而言,內(nèi)存正從一個固定組件,演變?yōu)橹鲃訁⑴c系統(tǒng)設(shè)計的核心變量。AMD力推LPDDR5X,正是這一轉(zhuǎn)變的具體體現(xiàn)。從更宏觀的視角來看,統(tǒng)一化的服務(wù)器設(shè)計正在讓位于針對特定工作負(fù)載、功耗限制和性能目標(biāo)量身定制的系統(tǒng)方案。

在AI時代,系統(tǒng)搬運數(shù)據(jù)的效率,或許最終將決定其算力的發(fā)揮上限。

Q&A

Q1:AI數(shù)據(jù)中心為什么說內(nèi)存比算力更重要?

A:隨著AI模型規(guī)模擴(kuò)大和推理任務(wù)持續(xù)化,數(shù)據(jù)搬運效率成為制約系統(tǒng)性能的核心因素。AMD指出,快速高效地訪問和移動數(shù)據(jù),與原始算力同等重要,內(nèi)存已對性能和功耗形成實質(zhì)性約束,成為AI數(shù)據(jù)中心的新瓶頸。

Q2:LPDDR5X在服務(wù)器中有什么優(yōu)勢和局限性?

A:LPDDR5X工作電壓低于DDR5,可降低內(nèi)存子系統(tǒng)功耗,在供電和散熱受限的環(huán)境中優(yōu)勢明顯,規(guī)模化部署后總擁有成本收益顯著。但其通常采用焊接安裝方式,限制了可維護(hù)性,在可靠性、生態(tài)系統(tǒng)成熟度方面仍存在不足,SOCAMM等新封裝形式正嘗試解決這些問題。

Q3:AI推理的不同階段對內(nèi)存類型有什么不同需求?

A:AI推理分為預(yù)填充和解碼兩個主要階段,需求差異明顯。預(yù)填充階段需要并行輸送大量數(shù)據(jù),HBM憑借超大帶寬更為適合;解碼階段則需要快速逐Token生成,對延遲要求極高,SRAM因其超低延遲特性占據(jù)主導(dǎo)地位。這也是混合內(nèi)存架構(gòu)興起的核心驅(qū)動力之一。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
許家?。乎r為人知的太康往事

許家?。乎r為人知的太康往事

牛刀財經(jīng)
2026-04-14 21:42:54
李敖之子李勘:大陸網(wǎng)民以為邱毅在臺灣很有影響力!邱毅的價值

李敖之子李勘:大陸網(wǎng)民以為邱毅在臺灣很有影響力!邱毅的價值

風(fēng)雨與陽光
2026-02-25 10:10:44
當(dāng)年害得游戲廳倒閉的罪魁禍?zhǔn)?,麻將BUG的使用者早已不在人世

當(dāng)年害得游戲廳倒閉的罪魁禍?zhǔn)?,麻將BUG的使用者早已不在人世

小怪吃美食
2026-04-11 00:12:11
阿里通義實驗室開源Qwen3.6-35B-A3B模型

阿里通義實驗室開源Qwen3.6-35B-A3B模型

界面新聞
2026-04-16 21:33:06
俄羅斯專家:“中國綜合國力太強(qiáng)大了,美國始終不敢動手!”

俄羅斯專家:“中國綜合國力太強(qiáng)大了,美國始終不敢動手!”

安安說
2026-04-16 11:01:02
中美制造大反轉(zhuǎn)!以美國為首的外媒齊發(fā)聲:中國已在眾多關(guān)鍵領(lǐng)域崛起

中美制造大反轉(zhuǎn)!以美國為首的外媒齊發(fā)聲:中國已在眾多關(guān)鍵領(lǐng)域崛起

新浪財經(jīng)
2026-04-16 20:09:04
俯臥撐需要天天做嗎?權(quán)威研究一次講明白

俯臥撐需要天天做嗎?權(quán)威研究一次講明白

健身狂人
2026-04-16 16:22:53
《縱橫四?!?K修復(fù)版5月3日上映

《縱橫四?!?K修復(fù)版5月3日上映

小椰的奶奶
2026-04-17 00:17:50
CBA最新排名!京粵力拼第4,遼寧有望沖進(jìn)前8,北控第12優(yōu)勢明顯

CBA最新排名!京粵力拼第4,遼寧有望沖進(jìn)前8,北控第12優(yōu)勢明顯

籃球資訊達(dá)人
2026-04-16 21:56:12
想念哈登!小卡被格林防的不會打球,登哥若在快船已晉級

想念哈登!小卡被格林防的不會打球,登哥若在快船已晉級

湖人侃球師
2026-04-16 16:44:29
《楚喬傳2》撲街真相:不是換不換人,是沒人敢接趙麗穎的盤

《楚喬傳2》撲街真相:不是換不換人,是沒人敢接趙麗穎的盤

情感大頭說說
2026-04-15 03:41:48
廣東15分逆轉(zhuǎn)一天后,3次爭議判罰曝光,裁判專家認(rèn)定徐杰2+1錯判

廣東15分逆轉(zhuǎn)一天后,3次爭議判罰曝光,裁判專家認(rèn)定徐杰2+1錯判

林子說事
2026-04-16 14:07:09
“46歲羅志祥在家中猝死”登熱搜,經(jīng)紀(jì)人回應(yīng)

“46歲羅志祥在家中猝死”登熱搜,經(jīng)紀(jì)人回應(yīng)

齊魯壹點
2026-04-14 14:44:12
國運又來了,儲量相當(dāng)于煤炭4億倍,中國地底深處藏著超級能源庫

國運又來了,儲量相當(dāng)于煤炭4億倍,中國地底深處藏著超級能源庫

混沌錄
2026-04-13 20:11:12
中國運-9“空中炮艇”終于要來了?炮艇機(jī)在現(xiàn)代戰(zhàn)爭里還有用嗎?

中國運-9“空中炮艇”終于要來了?炮艇機(jī)在現(xiàn)代戰(zhàn)爭里還有用嗎?

軍武次位面
2026-04-16 11:30:20
上學(xué)時老師說過哪句“高水平”的話,讓你至今難忘?網(wǎng)友:真牛!

上學(xué)時老師說過哪句“高水平”的話,讓你至今難忘?網(wǎng)友:真牛!

音樂時光的娛樂
2026-04-15 13:36:55
逃了?匈牙利外長西雅爾多神秘失蹤,已攜帶涉俄密件前往莫斯科?

逃了?匈牙利外長西雅爾多神秘失蹤,已攜帶涉俄密件前往莫斯科?

小蔣愛嘮嗑
2026-04-16 07:58:19
蔣介石孫子召開發(fā)布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

蔣介石孫子召開發(fā)布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

老謝談史
2026-03-18 18:33:35
徹底不能搶票了!4月10日12306出新規(guī),以后買火車票就按這法子來

徹底不能搶票了!4月10日12306出新規(guī),以后買火車票就按這法子來

米果說識
2026-04-16 16:55:11
祖巴茨與嬌妻觀戰(zhàn)快船附加賽憾負(fù)勇士!妻子生娃后仍是高顏值

祖巴茨與嬌妻觀戰(zhàn)快船附加賽憾負(fù)勇士!妻子生娃后仍是高顏值

Emily說個球
2026-04-16 19:20:27
2026-04-17 00:48:49
至頂AI實驗室 incentive-icons
至頂AI實驗室
一個專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實驗室。
3306文章數(shù) 169關(guān)注度
往期回顧 全部

數(shù)碼要聞

英特爾發(fā)布全新第三代酷睿移動處理器:首支持混合AI 算力高達(dá)40 TOPS

頭條要聞

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

頭條要聞

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

科技要聞

趙明:智駕之戰(zhàn),看誰在大模型上更高效

汽車要聞

空間大五個乘客都滿意?體驗嵐圖泰山X8

態(tài)度原創(chuàng)

時尚
健康
教育
本地
軍事航空

爆火的前額葉梗,讓多少年輕人主動確診「腦殘」?

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

教育要聞

985學(xué)院官宣!學(xué)碩,停招

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

軍事要聞

封鎖霍爾木茲海峽后 美釋放雙重信號

無障礙瀏覽 進(jìn)入關(guān)懷版