国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌第八代TPU首推「訓推雙芯」:8t專攻訓練,8i「死磕」推理

0
分享至

機器之心編輯部


谷歌的 AI 芯片戰(zhàn)略路線迎來重大轉(zhuǎn)向!

在剛剛過去的 Google Cloud Next 2026 大會上,谷歌正式對外發(fā)布第八代張量處理器(TPU)。與以往不同的是,這次亮點之一在于,谷歌首次針對 AI 模型訓練與推理任務,分別推出 TPU 8t 與 TPU 8i 兩款獨立芯片產(chǎn)品。

其中,專注于 AI 模型訓練任務的 TPU 8t,在大規(guī)模、高計算需求的訓練工作負載中表現(xiàn)出色,設計上具備更大的計算吞吐量和更多的擴展帶寬。相較于去年 11 月發(fā)布的第七代 Ironwood TPU,性能提升 2.7 倍。

聚焦于推理 / 實時執(zhí)行任務的 TPU 8i,設計時更多考慮了內(nèi)存帶寬,以便處理最為延遲敏感的推理工作負載,因為智能體在大規(guī)模交互時即使是微小的效率問題也會被放大。

值得注意的是,與上一代相比,TPU 8i 單芯片集成了 384MB 的靜態(tài)隨機存取存儲器(SRAM),容量是其 3 倍,因此可以完全在硅片上容納更大的 KV 緩存,從而顯著減少長上下文解碼期間內(nèi)核的空閑時間。性能提升 80% ,尤其是在大規(guī)模 MoE 模型的低延遲目標下。

谷歌高級副總裁兼 AI 基礎設施首席技術專家 Amin Vahdat 在官方博客中稱,在智能體時代,模型必須解決問題,執(zhí)行多步工作流,并從自己的行為中不斷學習。這意味著對基礎設施提出了新的高要求,TPU 8t 和 TPU 8i 兩款芯片旨在應對最具挑戰(zhàn)性的 AI 工作負載,并適應不斷演化的大規(guī)模模型架構(gòu)。

目前,這兩款新品還沒有正式對外,官方宣稱,將在今年晚些時候開始向谷歌云客戶提供。

芯片一經(jīng)發(fā)布,谷歌 CEO 桑達爾?皮查伊(Sundar Pichai)也在 X 上發(fā)文宣傳自家新品:「TPU 8t,優(yōu)化訓練;TPU 8i,優(yōu)化推理??雌饋碚娌诲e!」



在帖文下,引來一眾網(wǎng)友熱議。

有網(wǎng)友認為,此次谷歌將TPU分為專門的訓練芯片和推理芯片,似乎是在承認當前AI算力基礎設施的瓶頸已經(jīng)轉(zhuǎn)移,從FLOPs轉(zhuǎn)移到了內(nèi)存帶寬和延遲上。

而考慮到推理任務的預期規(guī)模,如果工作負載有所差異,(為了優(yōu)化性能和成本),針對每個任務定制硬件,從成本上看也是合理的選擇。

「這可能類似于電視中的視頻解碼芯片,與能夠進行視頻編碼的芯片相比,解碼芯片通常不會非常便宜或高效?!?/p>



大多數(shù)網(wǎng)友則認為,谷歌的這款新芯片一出,意味著 AI 芯片市場競爭將愈加激烈,尤其是對英偉達的「沖擊」。

一位網(wǎng)友調(diào)侃道,「谷歌正在發(fā)布新的 TPU。英偉達,你得做更多的工作了?!?/p>



誠然,從 2015 年開始,谷歌就在使用自研處理器來運行 AI 模型,并在 2018 年開始向谷歌云客戶出租芯片,試圖通過構(gòu)建這種高度集成、針對特定任務優(yōu)化的自有芯片生態(tài),進一步減少對外部供應商,尤其英偉達的依賴,打造更具自主可控的 AI 基礎設施。

但不得不承認,谷歌的芯片并不能對英偉達構(gòu)成全面威脅,或者說,至少在當前階段還不是。與微軟、亞馬遜之類的云服務巨頭一樣,谷歌使用這些芯片是為了補充其基礎設施中基于英偉達的系統(tǒng),而不是徹底取代英偉達。

據(jù)了解,谷歌還承諾,其云服務將在今年晚些時候提供英偉達的最新芯片 ——Vera Rubin。

谷歌在官方博客中詳細介紹了兩款芯片的設計細節(jié),下面來了解一下。

TPU 8t:訓練動力引擎

谷歌稱,TPU 8t 是為將前沿模型的開發(fā)周期從幾個月縮短到幾周而設計的。通過平衡最高計算吞吐量、共享內(nèi)存和芯片間帶寬,同時保證最佳的功率效率和計算時間,谷歌打造了一個系統(tǒng),使得每個超級節(jié)點的計算性能比上一代提高近 3 倍,從而加速創(chuàng)新,確保客戶繼續(xù)引領行業(yè)步伐。

  • 大規(guī)模擴展:單個 TPU 8t 超級節(jié)點現(xiàn)在能夠擴展到 9600 個芯片和 2 個 PB 的共享高帶寬內(nèi)存,內(nèi)存帶寬是上一代的兩倍。這種架構(gòu)提供 121 ExaFlops 的計算能力,支持最復雜的模型使用單一的大規(guī)模內(nèi)存池;
  • 最大化利用率:通過集成 10 倍更快的存儲訪問,并結(jié)合 TPUDirect 將數(shù)據(jù)直接加載到 TPU,TPU 8t 有助于確保端到端系統(tǒng)的最大利用;
  • 近線性擴展:新 Virg 網(wǎng)絡與 JAX 和 Pathways 軟件結(jié)合,意味著 TPU 8t 可以提供高達百萬芯片的近線性擴展。

此外,除了原始性能,TPU 8t 還針對超過 97% 的「良好利用率」進行優(yōu)化,這是衡量有效計算時間的指標,涵蓋了實時遙測、自動故障檢測和重定向等多項可靠性功能。



具體來看,相較于上一代 TPU,TPU 8t 的關鍵提升主要包括以下幾個方面:

  • SparseCore 優(yōu)勢:TPU 8t 的核心是 SparseCore,這是一種專門的加速器,旨在處理嵌入查找的非規(guī)律內(nèi)存訪問模式。Matrix Multiply Unit(MXU)處理矩陣運算,而 SparseCore 則卸載了數(shù)據(jù)依賴的所有聚集操作,以及其他集體操作,防止了通常困擾通用芯片的零操作瓶頸。
  • VPU/MXU 重疊與平衡擴展:TPU 8t 旨在最大化已提供的 FLOP 使用率,通過實現(xiàn)更平衡的向量處理單元(VPU)擴展,架構(gòu)最小化了暴露的向量操作時間。這使得量化、softmax 和 layernorms 可以更好地與 MXU 中的矩陣乘法重疊,幫助芯片保持忙碌,而不是等待順序向量任務。
  • 原生 FP4:TPU 8t 引入了原生的 4 位浮點數(shù)(FP4)以克服內(nèi)存帶寬瓶頸,在保持大模型準確性的同時,提升了 MXU 的吞吐量,即使在較低精度量化下也能維持準確性。通過減少每個參數(shù)的位數(shù),該平臺最小化了數(shù)據(jù)傳輸?shù)哪芎模⒃试S更大的模型層在本地硬件緩存中適配,從而實現(xiàn)峰值計算利用率。



TPU 8t ASIC 框圖

TPU 8i:推理引擎

谷歌認為,在智能體時代,用戶希望能夠提出問題、委派任務并獲得結(jié)果,而TPU 8i 正是被設計來處理許多專業(yè)智能體的復雜協(xié)作和迭代工作,智能體往往在復雜的工作流中「群集」起來,以提供解決方案和洞察力。

谷歌通過四項關鍵創(chuàng)新,重新設計了堆棧,以消除「等待室」效應:

  • 突破「內(nèi)存墻」:為了防止處理器閑置,TPU 8i 配備了 288 GB 高帶寬內(nèi)存,并配有 384 MB 的片上 SRAM,比上一代多出 3 倍,確保模型的活躍工作集完全保存在芯片內(nèi);
  • Axion 動力高效性:將每個服務器的物理 CPU 主機數(shù)量翻倍,采用了基于 Axion Arm 的定制 CPU。通過使用非統(tǒng)一內(nèi)存體系結(jié)構(gòu)(NUMA)進行隔離,優(yōu)化了整個系統(tǒng)的性能;
  • 擴展 MoE 模型:對于 MoE 模型,將互聯(lián)帶寬提高至 19.2Tb/s。新的 Boardfly 架構(gòu)將最大網(wǎng)絡直徑縮短超過 50%,確保系統(tǒng)作為一個統(tǒng)一的低延遲單元運行;



TPU 8i 層次化的 Boardfly 拓撲結(jié)構(gòu),從四個完全連接的芯片構(gòu)建起一個基礎單元,逐步發(fā)展為一個完全連接的八塊板組成的集群,最終將 36 個這樣的集群完全連接成一個 TPU 8i 超級節(jié)點。

  • 消除延遲:新片上集體加速引擎(CAE)卸載全局操作,將片上延遲減少了最多 5 倍,最大限度地減少了延遲。每個集體操作的低延遲意味著等待時間更少,從而直接提高了吞吐量,滿足了同時運行數(shù)百萬個智能體所需的性能。

這些創(chuàng)新使得,在每美元的價位下,性能提升了 80%,也就是說,企業(yè)能夠以相同的成本為更多客戶提供服務。



TPU 8i ASIC 框圖

https://techcrunch.com/2026/04/22/google-cloud-next-new-tpu-ai-chips-compete-with-nvidia/

https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/

https://cloud.google.com/blog/products/compute/tpu-8t-and-tpu-8i-technical-deep-dive

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
為鼓勵大學畢業(yè)生回爐讀技校,北京推出全日制大學生技師班

為鼓勵大學畢業(yè)生回爐讀技校,北京推出全日制大學生技師班

映射生活的身影
2026-04-21 12:57:40
第4艘航母?海軍宣傳片主角名字亮了!到底是河北艦還是河南艦?

第4艘航母?海軍宣傳片主角名字亮了!到底是河北艦還是河南艦?

軍武咖
2026-04-22 23:57:55
云南一幼童十余天反復咳痰帶血,氣管內(nèi)取出8厘米活體蠕動螞蟥

云南一幼童十余天反復咳痰帶血,氣管內(nèi)取出8厘米活體蠕動螞蟥

澎湃新聞
2026-04-22 11:02:28
“醫(yī)院一主任巨額財產(chǎn)來源不明、非法侵占公有資金”新進展:葉某被作為違紀違法典型;知情人士:涉案金額超300萬

“醫(yī)院一主任巨額財產(chǎn)來源不明、非法侵占公有資金”新進展:葉某被作為違紀違法典型;知情人士:涉案金額超300萬

大風新聞
2026-04-22 21:31:01
豪賭!勇士曝光補強方案,庫里聯(lián)手兩大超巨,NBA恐迎來大結(jié)局?

豪賭!勇士曝光補強方案,庫里聯(lián)手兩大超巨,NBA恐迎來大結(jié)局?

體育大朋說
2026-04-23 10:24:27
112名“中國留學生”,被調(diào)查

112名“中國留學生”,被調(diào)查

中國新聞周刊
2026-04-22 07:35:10
華誼兄弟被申請破產(chǎn)

華誼兄弟被申請破產(chǎn)

雷達財經(jīng)
2026-04-23 15:51:26
炸裂!Q1 凈利潤 1864 億、收入 2429 億

炸裂!Q1 凈利潤 1864 億、收入 2429 億

云頭條
2026-04-23 09:26:50
歐洲芯片巨頭官宣:我已經(jīng)在中國大陸,制造40nm芯片了

歐洲芯片巨頭官宣:我已經(jīng)在中國大陸,制造40nm芯片了

混沌錄
2026-04-22 19:51:03
輸球又輸人!遼寧德比爆大爭議,李金羽拒握手,對手主帥霸氣表態(tài)

輸球又輸人!遼寧德比爆大爭議,李金羽拒握手,對手主帥霸氣表態(tài)

林子說事
2026-04-23 15:42:02
白人女性與黑人女性的體味差異,網(wǎng)友真實分享引發(fā)熱議

白人女性與黑人女性的體味差異,網(wǎng)友真實分享引發(fā)熱議

特約前排觀眾
2025-12-22 00:20:06
氣血不足!不妨多吃“天然造血庫”,倒頭就睡,臉色紅潤

氣血不足!不妨多吃“天然造血庫”,倒頭就睡,臉色紅潤

江江食研社
2026-04-23 03:30:03
一把輸?shù)羰畮變|,欠200億跑路,今在印尼發(fā)財,手下人個個不一般

一把輸?shù)羰畮變|,欠200億跑路,今在印尼發(fā)財,手下人個個不一般

瀲滟晴方DAY
2026-04-17 22:01:07
39萬億美債還不起,特朗普決定“干掉”大債主,為此不惜自曝家丑

39萬億美債還不起,特朗普決定“干掉”大債主,為此不惜自曝家丑

古史青云啊
2026-04-23 10:04:31
如今定居廣東的朱芳雨,大兒走籃球路,二兒優(yōu)秀低調(diào),三兒最瀟灑

如今定居廣東的朱芳雨,大兒走籃球路,二兒優(yōu)秀低調(diào),三兒最瀟灑

翰飛觀事
2026-04-22 14:42:17
67歲的遲志強現(xiàn)狀,出獄37年后,定居黑龍江,兒子工作令人淚目

67歲的遲志強現(xiàn)狀,出獄37年后,定居黑龍江,兒子工作令人淚目

瓜哥的動物日記
2026-04-22 16:20:45
重磅:烏克蘭“火烈鳥”導彈配備星鏈!5月將擴大縱深打擊

重磅:烏克蘭“火烈鳥”導彈配備星鏈!5月將擴大縱深打擊

項鵬飛
2026-04-22 18:46:44
就差1秒!特朗普欲發(fā)射核武器,軍方強行攔截,拒絕為總統(tǒng)扣扳機

就差1秒!特朗普欲發(fā)射核武器,軍方強行攔截,拒絕為總統(tǒng)扣扳機

面包夾知識
2026-04-23 17:09:14
匈牙利爆出戲劇性消息,毛焦爾提名安妮塔·歐爾班出任新政府外長

匈牙利爆出戲劇性消息,毛焦爾提名安妮塔·歐爾班出任新政府外長

混沌錄
2026-04-22 20:55:07
300067,連續(xù)3天20cm漲停!超160萬手買單封板!

300067,連續(xù)3天20cm漲停!超160萬手買單封板!

證券時報e公司
2026-04-23 10:34:09
2026-04-23 19:15:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12837文章數(shù) 142634關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產(chǎn)品",但量產(chǎn)難預測

頭條要聞

五角大樓"斬"海軍部長 知情人士:他沒認清誰是老大

頭條要聞

五角大樓"斬"海軍部長 知情人士:他沒認清誰是老大

體育要聞

萊斯特城降入英甲,一場虧麻了的豪賭

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經(jīng)要聞

關于AI算力鏈"瓶頸" 這是高盛的最新看法

汽車要聞

令人驚艷的奇瑞車 風云A9可不只是樣子貨

態(tài)度原創(chuàng)

時尚
家居
手機
本地
房產(chǎn)

這4件衣服,從春天穿到夏天都很好看

家居要聞

浪漫協(xié)奏 法式風格

手機要聞

三星研發(fā)新型顯示系統(tǒng),可實現(xiàn)手機平板2D/3D畫面自由切換

本地新聞

SAGA GIRLS 2026女團選秀

房產(chǎn)要聞

三亞安居房,突然官宣!

無障礙瀏覽 進入關懷版