国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GPU英偉達(dá)發(fā)布LPU芯片:AI推理的「加速器」來了

0
分享至

當(dāng)?shù)貢r(shí)間 3 月 16 日,英偉達(dá)在加州舉辦了 GTC 2026 大會(huì),發(fā)布了全新的 Vera Rubin 平臺(tái)。雖然算力再破紀(jì)錄的 Rubin GPU 依舊是全場(chǎng)焦點(diǎn),但在雷科技看來,Vera Rubin 中的 LPU(Language Processing Unit,語言處理單元),同樣值得大家的關(guān)注。



圖片來源:NVIDIA

我們先簡單回顧一下 LPU 的「前世今生」:

嚴(yán)格來說, LPU 這一概念并非英偉達(dá)自己的創(chuàng)意。2016 年,前谷歌 TPU(張量處理單元)團(tuán)隊(duì)的核心成員創(chuàng)立了 Groq,后者在 2020 年就推出了用于大語言模型的 LPU 芯片。2025 年 12 月,英偉達(dá)收購了 Groq 的核心技術(shù)和技術(shù)團(tuán)隊(duì),并在 2026 年的 GTC 上正式發(fā)布了英偉達(dá)的 LPU 芯片,用于 AI 推理加速。

那么是什么,讓英偉達(dá)決定斥 200 億美元巨資買下 Groq 呢?這還得從 LPU 芯片的功能和定位說起。

業(yè)內(nèi)首個(gè)專為「推理」設(shè)計(jì)的協(xié)處理器,強(qiáng)在哪?

在大多數(shù)人的認(rèn)知里,AI 芯片功能都差不多,畢竟 GPU、NPU 甚至是 CPU 都能跑推理,英偉達(dá)的 GPU 長期以來也是這種「全能型」選手。但在Vera Rubin 平臺(tái),LPU 并不直接用于通用計(jì)算。

簡單來說,LPU 是大模型的「推理加速器」,它要用 SRAM 極高的顯存帶寬,解決大模型在生成回復(fù)時(shí)慢的問題。



圖片來源:NVIDIA

要知道在大模型的技術(shù)邏輯中,「AI 推理」的瓶頸往往不在于計(jì)算核心的算力上限,而在于顯存帶寬。以當(dāng)前主流的 HBM(高帶寬內(nèi)存)方案為例,雖然 HBM 的帶寬本身就比標(biāo)準(zhǔn) DDR、GDDR 這些內(nèi)存、顯存要快,但其本質(zhì)上是堆疊 DRAM,而 DRAM 的工作模式?jīng)Q定了其在讀寫延遲方面的短板。

相比之下,LPU 采用的是 SRAM 方案,從數(shù)據(jù)結(jié)構(gòu)上繞開了 HBM 方案較高的延遲,讓模型可以直接在緩存中進(jìn)行推理。盡管 SRAM 在空間表現(xiàn)上不如 HBM,但對(duì)于 AI 推理這一應(yīng)用場(chǎng)景,SRAM 的優(yōu)勢(shì)足以彌補(bǔ)其短板。

Agent 時(shí)代為什么英偉達(dá)急需 LPU

根據(jù)英偉達(dá)的介紹,基于 SRAM 方案的 LPU 每秒帶寬高達(dá) 150 TB/s,能讓 AI 之間通信的吞吐量從每秒 100 個(gè) Token 提升到了 1500 個(gè)以上。這種源自數(shù)據(jù)傳輸?shù)讓拥募夹g(shù)升級(jí),就像給 AI 開了專門的「5G 網(wǎng)絡(luò)」,讓模型「直播」(邊推理邊輸出)成為可能。

當(dāng)然了,LPU 架構(gòu)也有自己的短板。作為「空間換時(shí)間」的技術(shù)代表,SRAM 雖然讀寫速度極快、帶寬極高,但其數(shù)據(jù)結(jié)構(gòu)和成本決定了它不可能像 HBM 那樣動(dòng)不動(dòng)就堆疊幾百 GB 的容量。這也意味著 LPU 必須與 Rubin GPU 配合工作,無法獨(dú)立運(yùn)行大規(guī)模模型。



圖片來源:NVIDIA

但從另一個(gè)角度想,LPU 的出現(xiàn)其實(shí)就像當(dāng)年的 NPU 一樣,利用異構(gòu)單元「各取所長」,讓大模型知道哪些任務(wù)交給 GPU 去算,哪些實(shí)時(shí)交互交給 LPU 去跑。在雷科技看來,這種算力分流的模式,才是 LPU 最有價(jià)值的地方,也是前幾年英偉達(dá)愿意重金買下 Groq 的關(guān)鍵原因。

可能有人覺得奇怪,就全球市場(chǎng)來說,英偉達(dá)早已控制了「頭部算力」,GTC 2026 上也發(fā)布了 Rubin GPU,那為什么不繼續(xù)走「絕對(duì)算力」的路線,要用 LPU 進(jìn)行加速分流呢?

在雷科技看來,這種算力結(jié)構(gòu)的變化,其誕生也和 Agent 時(shí)代的 AI 交互模式有關(guān)。以往我們用 ChatGPT、Gemini 或千問等 AI 服務(wù),本質(zhì)上都是單線操作的「回合制 AI」;在 AI 給出結(jié)果之前,我們不需要、也不能做下一個(gè)操作。

但在 Agent 時(shí)代,AI 需要在多個(gè)應(yīng)用間執(zhí)行超長的任務(wù)鏈,而這種「AI 間通訊」對(duì)延遲有著極高的要求。如果用傳統(tǒng)的 GPU 跑推理,Token 生成速度可能只有每秒幾十個(gè)。

在一個(gè)需要跨越數(shù)十步?jīng)Q策的長任務(wù)鏈中,這種延遲會(huì)成倍增加。而 LPU 的加入,將部分推理前置,用低延遲換來了「連續(xù)響應(yīng)」的能力。也正因如此,雷科技認(rèn)為 LPU 的出現(xiàn),必然會(huì)推動(dòng) AI 算力體系搭建的新一輪轉(zhuǎn)型。

國產(chǎn)廠商如何突圍

從性能表現(xiàn)來看,Vera Rubin 平臺(tái)、LPU 等概念的出現(xiàn),確實(shí)又一次奠定了英偉達(dá)在 AI 領(lǐng)域的領(lǐng)先地位。但對(duì)于國內(nèi) AI 巨頭來說,在短時(shí)間內(nèi)跟進(jìn) LPU 架構(gòu)其實(shí)并不現(xiàn)實(shí)——LPU 核心的高速 SRAM 顆粒高度對(duì)封裝技術(shù)有較高的要求,在芯片行業(yè)產(chǎn)量朝著英偉達(dá)傾斜的背景下,國產(chǎn)芯片企業(yè)想建立自己的 SRAM 推理生態(tài),從成本的角度看并不簡單。

但這并不代表國產(chǎn)廠商在推理端無路可走。以阿里平頭哥在 2026 年初上線的真武 810E 為例,真武 810E 采用了阿里自研的并行計(jì)算架構(gòu)和 ICN 片間互聯(lián)技術(shù),將片間互聯(lián)帶寬提升至 700BG/s。



圖片來源:平頭哥

百度的昆侖芯則從 XPU 架構(gòu)上入手,將計(jì)算和通信并行處理,在上一組數(shù)據(jù)計(jì)算時(shí)就提前請(qǐng)求下一組數(shù)據(jù)。摩爾線程則選擇了全功能 GPU 的路線,用一站式方案降低企業(yè)部署成本,提高 AI 服務(wù)器的綜合性價(jià)比。

雖然在絕對(duì)吞吐量上,這些「曲線救國」的國產(chǎn)方案距離英偉達(dá)的 LPU 還有一定的差距,但憑借更好的 AI 用例適配,平頭哥和昆侖芯在國內(nèi)算力市場(chǎng)的影響力同樣不容忽視。

從行業(yè)發(fā)展的角度看,英偉達(dá) LPU 的面世,固然推動(dòng)了 AI 架構(gòu)優(yōu)化的進(jìn)程。但對(duì)于國產(chǎn)算力企業(yè)而言,憑借更低的網(wǎng)絡(luò)延遲和更好的本地化,依舊有超車的機(jī)會(huì)。畢竟對(duì) AI 這樣典型的「黑箱用例」來說,用戶其實(shí)并不關(guān)心 AI 背后的算力結(jié)構(gòu)和運(yùn)行邏輯。一個(gè)好用、易用、低成本的綜合體驗(yàn),才是國內(nèi) AI 市場(chǎng)真正看重的核心競(jìng)爭(zhēng)力。

3月12日-3月15日,AWE(中國家電及消費(fèi)電子博覽會(huì)) 2026 盛大開幕!
海信、海爾、美的、TCL、創(chuàng)維、華為、追覓、石頭、MOVA、雷鳥、韶音、小熊、九號(hào)等AI科技巨頭,將在上海灘圍繞“AI科技·慧享未來”主題,呈現(xiàn)AI與硬件特別是家電融合的新潮流。人人“養(yǎng)龍蝦”,家電如何融入Agent能力?機(jī)器人到家,家電無人化走到了哪一階段?全場(chǎng)景融合,“人車家”生態(tài)會(huì)碰撞出哪些火花?AI硬件大爆發(fā),硬件廠商又整出了哪些花活兒?
在雷科技MCN總編輯羅超、核心主播“阿雷”領(lǐng)銜下,雷科技AWE報(bào)道團(tuán)(10+人)奔赴上海展開現(xiàn)場(chǎng)報(bào)道,現(xiàn)已凱旋。歡迎在雷科技全平臺(tái)獲取相關(guān)內(nèi)容。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“‘梅姨’真實(shí)長相”引熱議!是否會(huì)被判死刑?多方回應(yīng)

“‘梅姨’真實(shí)長相”引熱議!是否會(huì)被判死刑?多方回應(yīng)

全國婦聯(lián)女性之聲
2026-03-21 19:15:04
回國之后才敢說:真實(shí)的越南,部分中國人去了簡直就是一個(gè)小白鼠

回國之后才敢說:真實(shí)的越南,部分中國人去了簡直就是一個(gè)小白鼠

番外行
2026-03-22 00:05:09
拒演?活該!他瞧不上的“男3號(hào)”被鄧凱演成了全劇王炸

拒演?活該!他瞧不上的“男3號(hào)”被鄧凱演成了全劇王炸

東方不敗然多多
2026-03-21 19:07:50
比馬奎爾更拉胯!13 次丟球 + 全場(chǎng)隱身,卡里克必須棄用曼聯(lián)水貨

比馬奎爾更拉胯!13 次丟球 + 全場(chǎng)隱身,卡里克必須棄用曼聯(lián)水貨

奶蓋熊本熊
2026-03-22 01:54:26
美以襲擊伊朗核設(shè)施!伊朗武裝部隊(duì):正在霍爾木茲海峽采取重大行動(dòng),如果打擊伊朗的基礎(chǔ)設(shè)施,伊朗將攻擊美以更重要、更關(guān)鍵的基礎(chǔ)設(shè)施

美以襲擊伊朗核設(shè)施!伊朗武裝部隊(duì):正在霍爾木茲海峽采取重大行動(dòng),如果打擊伊朗的基礎(chǔ)設(shè)施,伊朗將攻擊美以更重要、更關(guān)鍵的基礎(chǔ)設(shè)施

每日經(jīng)濟(jì)新聞
2026-03-21 20:59:09
釋永信被提起公訴:糜爛生活披露,女方口供流出,一畫面難以啟齒

釋永信被提起公訴:糜爛生活披露,女方口供流出,一畫面難以啟齒

博士觀察
2026-03-20 21:35:52
重大風(fēng)向!房地產(chǎn)稅從十五五規(guī)劃消失,樓市底層邏輯徹底轉(zhuǎn)變

重大風(fēng)向!房地產(chǎn)稅從十五五規(guī)劃消失,樓市底層邏輯徹底轉(zhuǎn)變

復(fù)轉(zhuǎn)這些年
2026-03-20 23:29:32
殲20總師被除名:長期領(lǐng)導(dǎo)軍工央企,最近照流出,事發(fā)全過程披露

殲20總師被除名:長期領(lǐng)導(dǎo)軍工央企,最近照流出,事發(fā)全過程披露

博士觀察
2026-03-20 21:41:54
不許美接管古巴,趕在美出兵前,中俄伸出援手,73萬桶石油將靠岸

不許美接管古巴,趕在美出兵前,中俄伸出援手,73萬桶石油將靠岸

軍機(jī)Talk
2026-03-21 12:26:28
上海德云社開業(yè)首日,楊議老毛病又犯,郭麒麟選擇明智

上海德云社開業(yè)首日,楊議老毛病又犯,郭麒麟選擇明智

老屬科普
2026-03-21 20:36:16
為什么WTO很少被提起了?中國入世談判花了15年,如今幾乎被架空

為什么WTO很少被提起了?中國入世談判花了15年,如今幾乎被架空

混沌錄
2026-03-21 15:31:24
教育大局已定:2026年初中考高中將迎來3大變化,家長要早作準(zhǔn)備

教育大局已定:2026年初中考高中將迎來3大變化,家長要早作準(zhǔn)備

夜深愛雜談
2026-03-18 21:58:01
戰(zhàn)爭(zhēng)第20天,終于打出了讓全世界屏住呼吸的一幕!

戰(zhàn)爭(zhēng)第20天,終于打出了讓全世界屏住呼吸的一幕!

浪子的煙火人間
2026-03-21 17:15:59
噩夢(mèng)! 航班剛起飛乘客去世 遺體竟在廚房加熱13小時(shí) 氣味彌漫!

噩夢(mèng)! 航班剛起飛乘客去世 遺體竟在廚房加熱13小時(shí) 氣味彌漫!

北國向錫安
2026-03-21 10:40:17
笑死我了!一位三年級(jí)小朋友趁媽媽洗澡的縫隙時(shí)間,和豆包的對(duì)話

笑死我了!一位三年級(jí)小朋友趁媽媽洗澡的縫隙時(shí)間,和豆包的對(duì)話

夜深愛雜談
2026-03-21 19:50:42
《蜘蛛俠4》破紀(jì)錄,票房劍指30億美元,《阿凡達(dá)》冠軍不保了

《蜘蛛俠4》破紀(jì)錄,票房劍指30億美元,《阿凡達(dá)》冠軍不保了

影視高原說
2026-03-21 07:50:06
等我老了,也學(xué)日本主婦:少穿衛(wèi)衣、毛衣,換成這樣穿更優(yōu)雅減齡

等我老了,也學(xué)日本主婦:少穿衛(wèi)衣、毛衣,換成這樣穿更優(yōu)雅減齡

冒泡泡的魚兒
2026-03-18 14:40:23
2-0到3-3,成都蓉城無緣3連勝,1人是罪魁,球迷:他咋進(jìn)的國家隊(duì)

2-0到3-3,成都蓉城無緣3連勝,1人是罪魁,球迷:他咋進(jìn)的國家隊(duì)

我就是一個(gè)說球的
2026-03-21 22:34:02
游資大佬集體發(fā)文投降!所有人都注意了,大盤下周或迎抄底良機(jī)!

游資大佬集體發(fā)文投降!所有人都注意了,大盤下周或迎抄底良機(jī)!

春江財(cái)富
2026-03-21 15:51:03
美媒:河村勇輝本賽季在公牛的薪水僅為效力日本聯(lián)賽時(shí)的1/7

美媒:河村勇輝本賽季在公牛的薪水僅為效力日本聯(lián)賽時(shí)的1/7

懂球帝
2026-03-21 19:30:06
2026-03-22 03:56:49
雷科技 incentive-icons
雷科技
專注AI硬科技
36529文章數(shù) 811938關(guān)注度
往期回顧 全部

科技要聞

宇樹招股書拆解,人形機(jī)器人出貨量第一!

頭條要聞

伊朗發(fā)射3800公里射程的導(dǎo)彈 最令美軍戰(zhàn)栗的細(xì)節(jié)披露

頭條要聞

伊朗發(fā)射3800公里射程的導(dǎo)彈 最令美軍戰(zhàn)栗的細(xì)節(jié)披露

體育要聞

誰在決定字母哥未來?

娛樂要聞

田栩?qū)幗K于涼了?出軌風(fēng)波影響惡劣

財(cái)經(jīng)要聞

通脹警報(bào)拉響,加息潮要來了?

汽車要聞

小鵬汽車2025年Q4盈利凈賺3.8億 全年?duì)I收767億

態(tài)度原創(chuàng)

教育
旅游
本地
房產(chǎn)
親子

教育要聞

南師附中舉行2026年31公里步行者行動(dòng)

旅游要聞

【花Young貴陽】春日限定!十里河灘海棠花盛開引客來

本地新聞

春色滿城關(guān)不住|紹興春日頂流,這片櫻花海藏不住了

房產(chǎn)要聞

全城狂送1000杯咖啡!網(wǎng)易房產(chǎn)【早C計(jì)劃】,即刻啟動(dòng)!

親子要聞

什么牌子駝奶粉好?2026中國駝奶品牌評(píng)測(cè),原生營養(yǎng)無可挑剔

無障礙瀏覽 進(jìn)入關(guān)懷版