国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

全球算力格局震蕩,“高階TPU”崛起!

0
分享至


芯東西(公眾號:aichip001)
作者 程茜
編輯 漠影

芯東西3月2日消息,近日,多家外媒報道,非GPU芯片應用迎來爆發(fā)期,前有Meta傳已與谷歌簽署數(shù)十億美元合作,大規(guī)模租用TPU訓練模型;后有OpenAI被曝計劃導入英偉達基于Groq技術的AI推理芯片。

這些重磅合作正是全球AI算力格局加速重構的縮影。2026年伊始,摩根大通的一份產(chǎn)能報告流出:谷歌計劃在2027年部署600-700萬顆TPU,大部分將供給Anthropic、OpenAI、Meta以及蘋果等外部客戶。

無獨有偶,2月13日,OpenAI上線GPT-5.3-Codex-Spark。這款模型選擇了一家特殊的芯片廠商來承接推理任務——Cerebras,一個以“晶圓級芯片”挑戰(zhàn)英偉達的“叛逆者”。這是OpenAI首次在主力模型上大規(guī)模采用非GPU芯片完成部署,背后原因在于Cerebras帶來的更低延遲與更低能耗,為實時編程帶來接近實時的響應體驗。

僅僅半年之前,全球AI產(chǎn)業(yè)的目光還牢牢鎖定在英偉達的財報和產(chǎn)能分配上,人們爭相與這家算力巨擘結成利益同盟。如今,全球頭號AI玩家們紛紛重新規(guī)劃未來幾年的芯片訂單。

IDC預測,到2028年,中國非GPU服務器市場規(guī)模占比將接近50%;高盛投資研究部的模型顯示,全球AI服務器中非GPU芯片出貨占比,將從2024年的36%增長至2027年的45%。


▲全球AI芯片中GPU架構和非GPU架構比例(數(shù)據(jù)來源:高盛全球投資研究部,芯東西制圖)

面對日益清晰的算力變局,一個更深層的轉(zhuǎn)折正在發(fā)生:AI的競爭焦點正從單純的算力規(guī)模,深刻轉(zhuǎn)向?qū)δ苄П扰c延遲的極致追求。

這一轉(zhuǎn)折,將GPU推向?qū)擂尉车兀河捎诿看斡嬎愣夹枰谕獠匡@存和計算單元之間頻繁往返搬運數(shù)據(jù),這種冗長的傳輸路徑讓GPU始終受困于高能耗和高延遲的先天缺陷。路透社爆料,OpenAI已多次表示對英偉達芯片的“不滿”——響應速度未達預期,在代碼生成產(chǎn)品Codex上感受尤為明顯。

壓力迫使英偉達這條“巨龍”尋求改變。2025年底,英偉達不惜以近三倍溢價拿下Groq核心技術與團隊。這家公司的創(chuàng)始人Jonathan Ross正是谷歌TPU核心設計者。被稱為“TPU之父”的他,創(chuàng)立Groq的初衷就是要打造一款超越谷歌TPU的AI芯片。最終,英偉達以200億美元的天價,買下了這把“高階TPU”之劍。

去GPU化的趨勢仍在繼續(xù)。沒有人愿意把未來十年的基礎設施押注在一個能耗大、延遲高、系統(tǒng)封閉的技術上。但這場算力變局的核心懸念尚未解開:TPU能否真正扛起對抗GPU的大旗?那個讓英偉達不惜押下重注的Groq,又藏著怎樣的技術底牌?


一、從自用到商用:谷歌TPU擾動全球算力格局

一直以來,谷歌TPU都作為其內(nèi)部的核心算力支撐,專供自家大模型訓練與推理使用。而去年至今,谷歌策略發(fā)生重大轉(zhuǎn)變,被曝要正式將TPU推向商用市場。

巨額訂單迅速涌向谷歌。

博通CEO透露,AI明星公司Anthropic下單了總額210億美元(約1486億元人民幣)的訂單,采購基于谷歌TPU構建的AI算力系統(tǒng);與此同時,Meta被曝已與谷歌達成數(shù)十億美元的AI芯片交易。此外,潛在客戶還包括蘋果,以及已與SpaceX合并的xAI等,TPU市場規(guī)模持續(xù)擴大。

這背后是雙重機遇的疊加。

一方面,大模型進入規(guī);涞仉A段,全球算力需求爆發(fā)、成本壓力加劇,單一依賴GPU的架構瓶頸日益凸顯。

另一方面,谷歌TPU的性能已具備與頂級GPU分庭抗禮的實力——2025年推出的第七代TPU,是谷歌迄今為止性能最高、可擴展性最強的AI芯片:單芯片峰值算力4614 TFLOPS(FP8精度),最大集群9216顆芯片、總算力達42.5 EFLOPS。

TPU v7在同等算力輸出下功耗僅為英偉達B200的40%至50%。更為關鍵的是,依托自研光電路交換機(OCS)技術,其萬卡級集群可實現(xiàn)近乎線性的加速比,顯著降低了傳統(tǒng)GPU集群在萬卡規(guī)模下的通信效率損耗。


▲Google TPU v5e、v5p、v6、v7 芯片關鍵性能對比(圖片來源:SemiAnalysis)

谷歌TPU崛起還有更為直接的例證:在TPU上訓練的Gemini 3,在多個權威基準測試中位居榜首,為業(yè)界頂尖模型之一。

此外,對于大模型公司而言,算力成本是繞不開的難題。“每美元產(chǎn)生的Token數(shù)”正取代峰值算力,成為衡量芯片商業(yè)價值的標尺。TPU憑借AI專用架構帶來的2-4倍能效優(yōu)勢,以及萬卡集群近乎線性的擴展能力,將大模型推理的綜合成本相比GPU拉低50%以上——這正是Anthropic、Meta們用訂單投票的根本邏輯。

因此,當下大多大模型企業(yè)會選擇采購TPU+GPU多元算力來緩解成本壓力。去年11月,半導體研究機構SemiAnalysis對比大模型公司的采購成本后發(fā)現(xiàn):與OpenAI相比,同時使用TPU與GPU的Anthropic,在與英偉達談判時擁有更強的議價權。這一事實表明:未來頭部AI公司,大概率都會轉(zhuǎn)向“多芯片并行”路線,以降低對單一架構的依賴、提升成本競爭力。


▲OpenAI與Anthropic購買算力的成本對比(圖片來源:SemiAnalysis)

綜上,谷歌TPU的性能跨越式提升、頂尖大模型的規(guī);炞C、頭部AI公司的主動布局,這三重因素共同印證,TPU已從過去的全球算力產(chǎn)業(yè)補充路線,正式升級為全球算力競爭中的主流路線。這不僅打破了長期由英偉達絕對主導的AI芯片格局,也為國內(nèi)外算力芯片打開了全新發(fā)展窗口。

二、不止于TPU:十年磨一劍,“TPU之父”探索更高階的可能

然而,谷歌TPU的成功并非終點。國內(nèi)外一批聚焦TPU芯片的創(chuàng)新企業(yè)快速崛起,它們擺脫復刻谷歌TPU的發(fā)展模式,逐步走出了一條差異化、多元化并行的發(fā)展之路。

這其中的代表玩家,就是被英偉達高價收購的AI芯片創(chuàng)企Groq。這家公司的創(chuàng)始人,被稱為“TPU之父”的Jonathan Ross,創(chuàng)立Groq的初衷就是要打造一款超越谷歌TPU的AI芯片。行業(yè)資深專家表示,二者的不同之處與芯片架構密切相關。

谷歌TPU采用“固定架構+集群擴展”的設計思路:其芯片內(nèi)部搭載相對固定的計算單元,依托二維數(shù)據(jù)流模式開展固定化的算力運算;在芯片間互聯(lián)層面,則通過構建3D Torus拓撲結構,實現(xiàn)多芯片間的高效數(shù)據(jù)流傳輸與協(xié)同計算。


▲谷歌TPU架構(圖片來源:谷歌官網(wǎng))

與谷歌TPU芯片的固定數(shù)據(jù)流不同,Groq的TSP(Tensor Streaming Processor)芯片是一種“軟件定義硬件”(Software Defined Hardware)的新型數(shù)據(jù)流處理器。

“通過構建可重構的軟硬件系統(tǒng),使其在保持可編程性的同時,達到接近ASIC的極致性能!泵绹鳧ARPA“電子復興計劃”(ERI)高度看好“軟件定義硬件”技術,并將其作為國家級戰(zhàn)略布局的核心方向之一。

這也是Groq被稱之為“高階TPU”的原因。通過芯片內(nèi)功能切片化微架構的底層設計,結合軟件層面的靈活配置能力,TSP可根據(jù)不同任務場景和計算需求實現(xiàn)計算邏輯與數(shù)據(jù)流路徑映射。同時,該芯片依托大容量片上SRAM及靜態(tài)調(diào)度機制,在顯著提升數(shù)據(jù)訪存效率的同時還能有效降低數(shù)據(jù)搬運能耗,實現(xiàn)計算效率的提升。

二者的性能表現(xiàn)對比,Groq的優(yōu)勢也已經(jīng)得到數(shù)據(jù)驗證。公開信息顯示,在相同推理任務中,Groq芯片的首token延遲比谷歌TPU v7芯片降低20%~50%,每token成本降低10%~30%

架構選擇的背后,折射出整個產(chǎn)業(yè)對計算效率瓶頸的重新審視。計算機體系結構泰斗、圖靈獎獲得者David Patterson教授在最新研究中指出,大模型每次生成都繞不開數(shù)據(jù)搬運,而搬運能耗遠高于計算本身,未來的核心命題是“讓數(shù)據(jù)離計算更近”。

為此,他提出了幾個AI芯片的演進方向:近內(nèi)存處理、3D堆疊、低延遲互連。這些均指向同一個目標——用架構創(chuàng)新降低數(shù)據(jù)移動的能耗與延遲。

David Patterson的洞察將AI規(guī);母偁幚刈顦闼氐奈锢韺用,誰能用更低的能耗、更低的延遲跑通下一代模型,誰就能在未來十年的算力牌桌上占得先機。

三、“高階TPU”含金量還在上升:三大創(chuàng)新將架構優(yōu)勢發(fā)揮至極

相比于Groq所強調(diào)的確定性數(shù)據(jù)流能力,國內(nèi)的清微智能、海外的Cerebras等芯片企業(yè)在高效的多維度數(shù)據(jù)流動態(tài)配置及先進集成方式上,還在持續(xù)提升“高階TPU”的含金量。

主要表現(xiàn)為如下幾個方面:

其一,通過3D Chiplet技術構建三維立體數(shù)據(jù)流架構。依托“計算核心+3D DRAM芯!钡慕M合,清微智能在“垂直+水平”兩個維度上形成高效數(shù)據(jù)流計算模式,核心目標是突破傳統(tǒng)二維數(shù)據(jù)流架構的效率局限。

具體而言,三維數(shù)據(jù)流計算架構可依據(jù)計算任務核心需求以及數(shù)據(jù)特性,在水平維度與垂直維度上實現(xiàn)數(shù)據(jù)流的靈活調(diào)度,最大化縮短數(shù)據(jù)傳輸路徑、提升數(shù)據(jù)流周轉(zhuǎn)效率,顯著降低數(shù)據(jù)搬運過程中的延遲與能耗,最終實現(xiàn)計算效率的進一步提升。

其二,是依托算力網(wǎng)格技術構建靈活數(shù)據(jù)流計算范式。該技術可突破傳統(tǒng)固定組網(wǎng)的擴展性與語義適配瓶頸,通過靈活組網(wǎng)及Scale up與Scale out協(xié)同,能根據(jù)AI任務特性,實時下發(fā)數(shù)據(jù)流的動態(tài)配置信息,實現(xiàn)在多種互聯(lián)拓撲結構間靈活切換和精準調(diào)度,降低互聯(lián)延遲,充分釋放數(shù)據(jù)流架構算力。

其三,通過前沿的晶圓級芯片技術,將數(shù)據(jù)流架構的優(yōu)勢發(fā)揮到極致。具體而言,晶圓級芯片技術將數(shù)據(jù)流架構思想從芯片內(nèi)部擴展至整片晶圓尺度,在整片晶圓高密度集成大量計算核心,極大縮短計算核心間的互聯(lián)距離,實現(xiàn)數(shù)量級的互聯(lián)帶寬提升與通信延遲的降低,從而將數(shù)據(jù)流架構的算力規(guī)模與計算效能發(fā)揮到極致,是數(shù)據(jù)流計算架構的理想物理載體。

以Cerebras晶圓級芯片為例。實測數(shù)據(jù)顯示,Cerebras CS 3系統(tǒng)在推理性能上較英偉達旗艦DGX B200 Blackwell GPU快21倍,成本與功耗均降低 1/3,在算力、成本、能效上展現(xiàn)出顯著的綜合優(yōu)勢。


▲Cerebras CS-3 vs英偉達GPU:大模型推理速度對比(圖片來源:Cerebras官網(wǎng))

結語:AI算力規(guī)則正在重構

當谷歌TPU走出圍墻、OpenAI擁抱晶圓級芯片、英偉達天價收編Groq,這些信號均指向同一個方向:TPU已變成巨頭們真金白銀押注的主戰(zhàn)場。

算力世界的單極時代,正在被多元架構終結。決定下一代AI天花板的,不再是算力堆砌的軍備競賽,而是能耗、延遲、確定性共同構成的AI能力新指標。

對于國產(chǎn)芯片而言,這場變局既是機遇也是挑戰(zhàn)。跟隨者只能瓜分殘羹,唯有走出自己的底層創(chuàng)新之路,才有資格參與下一輪全球算力洗牌。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
一旦戰(zhàn)爭爆發(fā)中國或?qū)⒈粐ィ瑢χ袊,最危險的不只戰(zhàn)爭

一旦戰(zhàn)爭爆發(fā)中國或?qū)⒈粐,對中國而言,最危險的不只戰(zhàn)爭

來科點譜
2026-01-23 11:04:18
孩子第一天就轟動學校是啥感覺?網(wǎng)友:這孩子以后能成大事

孩子第一天就轟動學校是啥感覺?網(wǎng)友:這孩子以后能成大事

解讀熱點事件
2026-02-25 15:32:21
“天眼”24小時掃描中東,美軍在中國衛(wèi)星面前,沒有任何秘密可言

“天眼”24小時掃描中東,美軍在中國衛(wèi)星面前,沒有任何秘密可言

我心縱橫天地間
2026-03-02 14:05:07
阿拉法特遺孀蘇哈:巴政府每月給3.5萬美元,當最富裕的風流寡婦

阿拉法特遺孀蘇哈:巴政府每月給3.5萬美元,當最富裕的風流寡婦

豐譚筆錄
2025-12-30 10:44:42
“不斷突破戰(zhàn)后和平發(fā)展體系,必將日本推向危險邊緣”(國際視點)

“不斷突破戰(zhàn)后和平發(fā)展體系,必將日本推向危險邊緣”(國際視點)

中國網(wǎng)
2026-03-03 07:48:04
醫(yī)生提醒:無論多壞的肺,只要常吃這5樣,肺一天比一天好

醫(yī)生提醒:無論多壞的肺,只要常吃這5樣,肺一天比一天好

路醫(yī)生健康科普
2026-02-28 23:20:03
中東戰(zhàn)火致霍爾木茲海峽近乎停擺,布油直逼80美元?!全球經(jīng)濟面臨新通脹沖擊

中東戰(zhàn)火致霍爾木茲海峽近乎停擺,布油直逼80美元?!全球經(jīng)濟面臨新通脹沖擊

智通財經(jīng)
2026-03-03 07:27:06
你聽過最勁爆的瓜是啥?網(wǎng)友:被大八歲的補習班老師表白了

你聽過最勁爆的瓜是啥?網(wǎng)友:被大八歲的補習班老師表白了

帶你感受人間冷暖
2025-11-26 00:10:06
段奕宏苦追九載娶妻,妻子怕疼丁克十三載,余生寵妻不渝

段奕宏苦追九載娶妻,妻子怕疼丁克十三載,余生寵妻不渝

日落于西
2026-03-03 09:36:26
韓國股市暴跌觸發(fā)熔斷機制

韓國股市暴跌觸發(fā)熔斷機制

環(huán)球網(wǎng)資訊
2026-03-03 12:33:10
全國政協(xié)委員劉永好:建議全民發(fā)放500元通用消費券 可拉動消費近2萬億元

全國政協(xié)委員劉永好:建議全民發(fā)放500元通用消費券 可拉動消費近2萬億元

財聯(lián)社
2026-03-02 10:57:04
剛剛發(fā)布的iPhone 17e,價格太良心了!

剛剛發(fā)布的iPhone 17e,價格太良心了!

機智貓
2026-03-02 23:46:07
讀懂今年全國兩會,就能讀懂中國下一個五年發(fā)展

讀懂今年全國兩會,就能讀懂中國下一個五年發(fā)展

時代周報
2026-03-02 11:46:24
伊朗導彈飽和打擊!特朗普致命誤判引爆中東,如今只剩兩條路...

伊朗導彈飽和打擊!特朗普致命誤判引爆中東,如今只剩兩條路...

華人書畫藝術
2026-03-03 11:38:24
600億抄底!美財長的學生竟然收購了中國萬達,難怪王健林會輸!

600億抄底!美財長的學生竟然收購了中國萬達,難怪王健林會輸!

蜉蝣說
2026-01-11 17:51:23
金色梅花5角簽字版報價23800元,誰家有?

金色梅花5角簽字版報價23800元,誰家有?

小陳收藏社
2026-03-03 11:54:30
來了!蘋果發(fā)布 iOS 26.4 系統(tǒng)更新

來了!蘋果發(fā)布 iOS 26.4 系統(tǒng)更新

XCiOS俱樂部
2026-03-03 06:23:32
交火超過60小時,伊朗將電話打往北京,許下一個關鍵承諾

交火超過60小時,伊朗將電話打往北京,許下一個關鍵承諾

起喜電影
2026-03-03 11:52:16
牢A遺漏了一個“三通一達”的典型樣本:鮑小姐。

牢A遺漏了一個“三通一達”的典型樣本:鮑小姐。

好賢觀史記
2026-01-29 09:51:02
2018年女足國腳張歐影病逝美國,臨終丈夫為其換7號球衣

2018年女足國腳張歐影病逝美國,臨終丈夫為其換7號球衣

王糬自駕
2026-02-27 12:37:13
2026-03-03 13:11:00
芯東西 incentive-icons
芯東西
專注AI芯片、半導體產(chǎn)業(yè)媒體
2217文章數(shù) 8151關注度
往期回顧 全部

科技要聞

手機AI在MWC上卷出了新高度

頭條要聞

美國三架F-15E被擊落 美軍聲明中有個非常奇怪的地方

頭條要聞

美國三架F-15E被擊落 美軍聲明中有個非常奇怪的地方

體育要聞

35輪后積分-7,他們遭遇史上最早的降級

娛樂要聞

謝娜霸氣護夫:喊話薛之謙給張杰道歉

財經(jīng)要聞

霍爾木茲海峽近乎停擺 布油直逼80美元

汽車要聞

長安汽車2月銷量151922輛 環(huán)比逆勢增長12.8%

態(tài)度原創(chuàng)

數(shù)碼
手機
房產(chǎn)
藝術
軍事航空

數(shù)碼要聞

NVIDIA新驅(qū)動解決風扇停轉(zhuǎn)問題:但悄悄限制RTX 50 GPU電壓!

手機要聞

一加15T新機正面形象公開,采用1.xx mm物理極窄四等邊設計

房產(chǎn)要聞

方案突然曝光!?诒睅煷蟾叫,又有書包大盤殺出!

藝術要聞

Nihad Aghazada:當代阿塞拜疆畫家

軍事要聞

美國中央司令部透露對伊朗動武全部武器裝備清單

無障礙瀏覽 進入關懷版