国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

SemiAnalysis GTC深度解讀:三款新系統(tǒng)背后,英偉達(dá)正在重新定義AI基礎(chǔ)設(shè)施的邊界

0
分享至

在GTC 2026大會上,英偉達(dá)一口氣推出三款全新系統(tǒng)——Groq LPX推理機(jī)架、Vera ETL256 CPU機(jī)架與STX存儲參考架構(gòu),將其產(chǎn)品版圖從GPU算力核心向低延遲推理、CPU編排與存儲層全面延伸,標(biāo)志著英偉達(dá)正系統(tǒng)性地重構(gòu)AI基礎(chǔ)設(shè)施的定義邊界。

其中最受市場關(guān)注的是Groq LPX系統(tǒng)。這是英偉達(dá)以200億美元完成對Groq知識產(chǎn)權(quán)授權(quán)與核心團(tuán)隊(duì)引進(jìn)后,不到四個月內(nèi)推出的首款產(chǎn)品化成果。

LPX機(jī)架將Groq的LP30芯片與英偉達(dá)GPU深度整合,并引入"注意力與前饋網(wǎng)絡(luò)解耦"(Attention FFN Disaggregation,下稱AFD)技術(shù),在高交互推理場景中針對性地壓縮解碼延遲,為大規(guī)模推理系統(tǒng)開辟了此前不存在的優(yōu)化路徑。

與此同時,Vera ETL256將256顆CPU塞入單一液冷機(jī)架,以銅纜拓?fù)鋵?shí)現(xiàn)機(jī)架內(nèi)全互聯(lián),直接瞄準(zhǔn)隨AI規(guī)模擴(kuò)張而日益凸顯的CPU供給瓶頸;STX則通過標(biāo)準(zhǔn)化存儲參考架構(gòu),將英偉達(dá)的掌控范圍從算力層和網(wǎng)絡(luò)層正式延伸至存儲基礎(chǔ)設(shè)施層。

SemiAnalysis認(rèn)為,三款系統(tǒng)共同指向同一個戰(zhàn)略信號:英偉達(dá)不再僅僅是GPU供應(yīng)商,而是在向全棧AI基礎(chǔ)設(shè)施平臺商演進(jìn),其觸角已覆蓋推理優(yōu)化、CPU密度、存儲編排等此前由其他廠商主導(dǎo)的領(lǐng)域,這將深刻影響整個AI硬件供應(yīng)鏈的競爭格局。

LPX與LP30:Groq架構(gòu)正式融入英偉達(dá)推理?xiàng)?/strong>

英偉達(dá)與Groq之間的交易在結(jié)構(gòu)上被設(shè)計(jì)為知識產(chǎn)權(quán)授權(quán)與人才引進(jìn),而非傳統(tǒng)并購。英偉達(dá)由此幾乎即時獲得了Groq的全部IP和核心團(tuán)隊(duì),并在不到四個月內(nèi)推出基于Groq第三代LPU架構(gòu)的LP30芯片與LPX機(jī)架系統(tǒng)。

LP30采用三星SF4工藝,配備500MB片上SRAM,F(xiàn)P8精度下算力為1.2 PFLOPS,相較于Groq第一代LPU(230MB SRAM,750 TFLOPS INT8)實(shí)現(xiàn)了大幅提升,性能增長主要由制程節(jié)點(diǎn)從GF16遷移至SF4驅(qū)動。

LP30以單一整體裸片形式存在,無需先進(jìn)封裝。值得關(guān)注的是,SF4工藝不擠占英偉達(dá)在臺積電N3上的稀缺產(chǎn)能配額,也不消耗同樣緊張的HBM資源,因此LPX系統(tǒng)代表的是真正意義上的增量產(chǎn)能與增量收入,據(jù)SemiAnalysis指出,這是競爭對手無法復(fù)制的差異化優(yōu)勢。

LPU的核心價值與天然局限

LPU架構(gòu)的競爭優(yōu)勢在于高帶寬SRAM與確定性流水線執(zhí)行機(jī)制,這使其在單用戶低延遲場景下具備GPU難以企及的首token生成速度。然而,高密度SRAM的代價是容量受限——權(quán)重加載后所??臻g極為有限,隨批量增大KV Cache迅速飽和,整體吞吐量顯著弱于GPU。

據(jù)SemiAnalysis分析,獨(dú)立部署的LPU系統(tǒng)在大規(guī)模token服務(wù)上并不經(jīng)濟(jì),但在對延遲極度敏感的場景中可獲取可觀的溢價,這正是LPU在解耦解碼系統(tǒng)中的定位基礎(chǔ)。


AFD技術(shù):GPU與LPU的角色分工

AFD技術(shù)將大模型推理中的注意力計(jì)算(Attention)與前饋網(wǎng)絡(luò)計(jì)算(FFN)拆分至不同硬件。注意力計(jì)算因涉及動態(tài)KV Cache加載,天然適合GPU處理;FFN計(jì)算因其無狀態(tài)、可靜態(tài)調(diào)度的特性,與LPU確定性架構(gòu)高度契合。

在這一框架下,GPU專注處理注意力計(jì)算,HBM容量得以充分釋放用于KV Cache,提升系統(tǒng)可并發(fā)處理的token總量;LPU則承擔(dān)FFN計(jì)算,發(fā)揮其低延遲優(yōu)勢。GPU與LPU之間通過All-to-All集合通信完成token的分發(fā)與匯聚,并以乒乓流水線方式隱藏通信延遲。

此外,LPU也可在投機(jī)解碼(Speculative Decoding)框架中發(fā)揮作用,將草稿模型或多token預(yù)測(MTP)層部署至LPU,進(jìn)一步降低單次解碼步驟的延遲開銷,通常可將每次解碼步驟的輸出token數(shù)提升至1.5至2倍。


LPX機(jī)架架構(gòu)

LPX機(jī)架由32個1U LPU計(jì)算托盤與2臺Spectrum-X交換機(jī)構(gòu)成。每個計(jì)算托盤搭載16塊LP30、2塊Altera FPGA(英偉達(dá)稱之為"Fabric Expansion Logic")、1顆Intel Granite Rapids主機(jī)CPU及1塊BlueField-4前端模塊。

FPGA在系統(tǒng)中承擔(dān)多重關(guān)鍵職能:將LPU的C2C協(xié)議轉(zhuǎn)換為以太網(wǎng)以接入Spectrum-X規(guī)模擴(kuò)展網(wǎng)絡(luò),提供LPU與主機(jī)CPU之間的PCIe橋接,并為系統(tǒng)提供每塊最高256GB的DDR5擴(kuò)展內(nèi)存用于KV Cache存儲。整個機(jī)架的規(guī)模擴(kuò)展帶寬總計(jì)約640TB/s。

LPU模塊以"腹對腹"方式安裝于PCB板兩側(cè),上下各8塊,旨在縮短全互聯(lián)網(wǎng)格所需的X和Y方向走線長度。節(jié)點(diǎn)內(nèi)16塊LPU以全互聯(lián)Mesh拓?fù)湎噙B,節(jié)點(diǎn)間通過銅纜背板互聯(lián),跨機(jī)架連接則通過前面板OSFP接口實(shí)現(xiàn)。


Vera ETL256:256顆CPU的密度極限

隨著AI工作負(fù)載對數(shù)據(jù)預(yù)處理、調(diào)度編排和強(qiáng)化學(xué)習(xí)驗(yàn)證的需求持續(xù)攀升,CPU正成為制約GPU利用率的新瓶頸。強(qiáng)化學(xué)習(xí)場景尤為突出——CPU需要并行運(yùn)行仿真環(huán)境、執(zhí)行代碼并對輸出進(jìn)行驗(yàn)證。GPU規(guī)模的擴(kuò)張速度遠(yuǎn)超CPU,使得維持GPU滿載所需的CPU集群規(guī)模不斷擴(kuò)大。

英偉達(dá)的應(yīng)對方案是Vera ETL256,將256顆Vera CPU集成于單一機(jī)架,依賴液冷實(shí)現(xiàn)這一密度目標(biāo)。

該系統(tǒng)的設(shè)計(jì)邏輯與NVL計(jì)算機(jī)架一脈相承:將算力密度提升至銅纜可覆蓋機(jī)架內(nèi)全部連接的臨界點(diǎn),從而在主干網(wǎng)絡(luò)層面完全消除光收發(fā)器的需求。銅纜帶來的成本節(jié)約,足以抵消液冷引入的額外開銷。

具體而言,Vera ETL機(jī)架由32個計(jì)算托盤構(gòu)成,上下各16個,以4個1U MGX ETL交換托盤(基于Spectrum-6)為中軸對稱排列。這種對稱布局刻意壓縮各計(jì)算托盤與主干交換托盤之間的線纜長度差異,確保全部連接均處于銅纜可達(dá)范圍內(nèi)。

每個交換托盤的后向端口負(fù)責(zé)機(jī)架內(nèi)銅纜主干通信,32個前向OSFP接口則提供與POD其余節(jié)點(diǎn)的光纖連接。機(jī)架內(nèi)網(wǎng)絡(luò)采用Spectrum-X多平面拓?fù)?,?00 Gb/s通道分布至四臺交換機(jī),在單一網(wǎng)絡(luò)層內(nèi)實(shí)現(xiàn)256顆CPU的全互聯(lián)以太網(wǎng)連接,每個計(jì)算托盤承載8顆Vera CPU。


STX:英偉達(dá)向存儲層的系統(tǒng)性延伸

STX是英偉達(dá)在GTC 2026發(fā)布的存儲參考機(jī)架架構(gòu),與此前推出的CMX上下文存儲平臺配套,共同構(gòu)成英偉達(dá)向存儲基礎(chǔ)設(shè)施層滲透的完整布局。

STX在CMX基礎(chǔ)上進(jìn)一步建立參考架構(gòu),精確規(guī)定一個集群中需要配置多少磁盤驅(qū)動器、Vera CPU、BF-4 DPU、CX-9網(wǎng)卡和Spectrum-X交換機(jī)。

每個STX機(jī)箱內(nèi)含2個BF-4單元,合計(jì)2顆Vera CPU、4塊CX-9網(wǎng)卡和4個SOCAMM模塊;整個STX機(jī)架共16個機(jī)箱,對應(yīng)32顆Vera CPU、64塊CX-9網(wǎng)卡和64個SOCAMM。

英偉達(dá)在發(fā)布STX的同時罕見地點(diǎn)名一批主要存儲廠商——包括DDN、Dell Technologies、HPE、IBM、NetApp、Supermicro及VAST Data等——表示上述廠商均將支持STX標(biāo)準(zhǔn),延續(xù)了英偉達(dá)以行業(yè)背書強(qiáng)化參考架構(gòu)話語權(quán)的一貫做法。


據(jù)SemiAnalysis分析,BlueField-4、CMX與STX的組合,代表英偉達(dá)在完成算力層(GPU)與網(wǎng)絡(luò)層(Spectrum-X及NVLink)的主導(dǎo)地位之后,正在系統(tǒng)性地向存儲層、軟件層和基礎(chǔ)設(shè)施運(yùn)營層推進(jìn)。

三款新系統(tǒng)合力拓寬了英偉達(dá)的產(chǎn)品護(hù)城河,也意味著AI基礎(chǔ)設(shè)施供應(yīng)鏈中更大比例的市場份額將持續(xù)向英偉達(dá)集中。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
姆巴佩:說我在皇馬遭誤診是假的,也怪我留下了可解讀的空間

姆巴佩:說我在皇馬遭誤診是假的,也怪我留下了可解讀的空間

懂球帝
2026-03-26 04:09:06
張雪峰家屬:周六舉行追悼會!平時沒胸悶、沒心臟病,能放心運(yùn)動嗎?醫(yī)生提醒

張雪峰家屬:周六舉行追悼會!平時沒胸悶、沒心臟病,能放心運(yùn)動嗎?醫(yī)生提醒

上觀新聞
2026-03-26 14:45:10
凈利潤62%高增創(chuàng)歷史新高,紫金礦業(yè)“礦茅”與“現(xiàn)金?!彪p標(biāo)簽成色幾何

凈利潤62%高增創(chuàng)歷史新高,紫金礦業(yè)“礦茅”與“現(xiàn)金牛”雙標(biāo)簽成色幾何

華夏時報
2026-03-25 21:50:05
華為老將創(chuàng)業(yè)4年,一款產(chǎn)品賣了70億

華為老將創(chuàng)業(yè)4年,一款產(chǎn)品賣了70億

每日經(jīng)濟(jì)新聞
2026-03-25 20:01:35
男子干活時摔成高位截癱,妻子一看男子不能賺錢養(yǎng)家了,丟下男子和6歲的女兒跑了

男子干活時摔成高位截癱,妻子一看男子不能賺錢養(yǎng)家了,丟下男子和6歲的女兒跑了

張曉磊
2026-03-26 11:22:06
《超人》女演員治病花光積蓄后去世,好友為其葬禮發(fā)起籌款

《超人》女演員治病花光積蓄后去世,好友為其葬禮發(fā)起籌款

紅星新聞
2026-03-24 14:16:15
深圳多處出現(xiàn),一大批人都在偶遇!網(wǎng)友:“我都舍不得踩!”

深圳多處出現(xiàn),一大批人都在偶遇!網(wǎng)友:“我都舍不得踩!”

深圳晚報
2026-03-26 10:20:44
蘇敏旅游6年后簡直不敢認(rèn),連面相都變了,網(wǎng)友:這16萬花得值!

蘇敏旅游6年后簡直不敢認(rèn),連面相都變了,網(wǎng)友:這16萬花得值!

共工之錨
2026-03-24 01:31:15
林彪的兒子要結(jié)婚,葉群在全國選美,毛主席得知說了5個字

林彪的兒子要結(jié)婚,葉群在全國選美,毛主席得知說了5個字

揚(yáng)平說史
2026-03-25 21:04:04
“已囤一年機(jī)票”!燃油費(fèi)上漲催生“提前鎖票潮”,“五一”機(jī)票預(yù)訂量漲近兩成

“已囤一年機(jī)票”!燃油費(fèi)上漲催生“提前鎖票潮”,“五一”機(jī)票預(yù)訂量漲近兩成

封面新聞
2026-03-26 13:24:05
闖禍的最高境界是什么?看網(wǎng)友講述,這是正常人能做出的事情嗎?

闖禍的最高境界是什么?看網(wǎng)友講述,這是正常人能做出的事情嗎?

侃神評故事
2026-03-21 19:15:03
樊振東空降邁阿密,新身份曝光!回歸國乒成謎!吳敬平發(fā)文!

樊振東空降邁阿密,新身份曝光!回歸國乒成謎!吳敬平發(fā)文!

好乒乓
2026-03-26 12:28:10
戲都沒演明白還當(dāng)評委,自己都沒拿過獎,坐在評審團(tuán)位置不心虛嗎

戲都沒演明白還當(dāng)評委,自己都沒拿過獎,坐在評審團(tuán)位置不心虛嗎

娛樂圈筆娛君
2026-03-25 10:46:06
印度想拿中國尿素救春耕?先把欠中企百億欠款還了,否則一粒不售

印度想拿中國尿素救春耕?先把欠中企百億欠款還了,否則一粒不售

達(dá)文西看世界
2026-03-26 12:05:42
美容院老板娘大實(shí)話:55歲后臉再光也沒用,脫了衣服見真章!

美容院老板娘大實(shí)話:55歲后臉再光也沒用,脫了衣服見真章!

距離距離
2026-03-25 16:53:55
電飯鍋哪個牌子質(zhì)量好?2026電飯煲排名前十盤點(diǎn)!大眾主流精選

電飯鍋哪個牌子質(zhì)量好?2026電飯煲排名前十盤點(diǎn)!大眾主流精選

小柱解說游戲
2026-03-25 17:56:15
譚瑞松,被判死緩

譚瑞松,被判死緩

新京報政事兒
2026-03-25 17:17:03
加州州長猛批馬斯克:這個時代最令人失望的人物之一!

加州州長猛批馬斯克:這個時代最令人失望的人物之一!

達(dá)文西看世界
2026-03-26 10:23:53
四川高縣村支書暴打殘疾村婦致輕傷 法院判決免于刑事處罰引爭議

四川高縣村支書暴打殘疾村婦致輕傷 法院判決免于刑事處罰引爭議

律法刑道
2026-03-26 10:55:03
四川多所中學(xué)發(fā)布嚴(yán)正聲明

四川多所中學(xué)發(fā)布嚴(yán)正聲明

四川省教育廳
2026-03-26 10:57:12
2026-03-26 15:24:49
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領(lǐng)先的金融商業(yè)信息提供商
143548文章數(shù) 2653025關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時盡力摧毀伊設(shè)施

頭條要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時盡力摧毀伊設(shè)施

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會喪事從簡

財經(jīng)要聞

黃仁勛:芯片公司的時代已經(jīng)結(jié)束了

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

時尚
教育
藝術(shù)
本地
房產(chǎn)

2026年了,最好看的還是“這件針織”!

教育要聞

高考地理中的花海經(jīng)濟(jì)

藝術(shù)要聞

哪一座橋不是風(fēng)景?

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬遍

房產(chǎn)要聞

質(zhì)價比標(biāo)桿!三亞首創(chuàng)浮島全景艙亮相,還得是萬科!

無障礙瀏覽 進(jìn)入關(guān)懷版