国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

TPU 的成功,是否正在宣告“GPU + CUDA 時代”的終結(jié)?

0
分享至

1) 先把兩種“范式”講清楚(用類比)

  • GPU + CUDA像“通用瑞士軍刀 + 統(tǒng)一工具箱”:硬件足夠通用,軟件生態(tài)(CUDA)極強(qiáng),適配面廣、迭代快、外部開發(fā)者多。

  • TPU(ASIC)+ 軟件棧(XLA/JAX/Pathways/Runtime)更像“深度定制的工業(yè)產(chǎn)線”:從芯片、板卡、互連網(wǎng)絡(luò)到編譯器、并行策略一起設(shè)計,目標(biāo)是把某類工作(大規(guī)模訓(xùn)練/推理)做到極致,強(qiáng)調(diào)端到端吞吐、能效、可擴(kuò)展性。TPU 的體系就是典型“芯片+網(wǎng)絡(luò)+軟件協(xié)同”的思路:XLA 編譯器把計算圖切分到多芯片,JAX/Pathways把單個模型鋪到成千上萬顆 TPU 上跑,并且軟硬件一起優(yōu)化效率。

目前來看:TPU 的成功證明“垂直整合”確實能打穿 GPU 的優(yōu)勢區(qū)間,但它更像“分層替代”,而不是“一刀切把 GPU 全部替掉”。

2) 為什么說 TPU 的成功“不是偶然”,它擊中了 GPU 的系統(tǒng)瓶頸

對大模型來說,真正決定“交付成本”的往往不是單卡峰值,而是系統(tǒng)級的有效吞吐(goodput)/擴(kuò)展效率/能耗。TPU v4 的論文直接給了系統(tǒng)級證據(jù):

  • TPU v4 在相近規(guī)模系統(tǒng)下,比 Nvidia A100 快 1.2×–1.7×,且功耗更低(用電少 1.3×–1.9×),并且在 Google Cloud 的能效型數(shù)據(jù)中心里還體現(xiàn)為更低能耗與更低碳排。
    這類“同規(guī)模系統(tǒng)、真實工作負(fù)載”的對比,比單芯片 spec 更能說明“范式差異”。

更關(guān)鍵的是 TPU v4 不是只改芯片,而是把“規(guī)模化訓(xùn)練最痛的地方”——互連和調(diào)度——也一起改了:

  • TPU v4 引入 OCS(光電路交換),其思想是:把拓?fù)渥龀煽芍貥?gòu),讓網(wǎng)絡(luò)能隨任務(wù)切換,更像“可插拔配線架”。論文描述 OCS 讓系統(tǒng)在規(guī)模、可用性、利用率、功耗、部署等方面顯著受益。

  • TPU v4 還明確對比了 NVLink/NVSwitch:NVSwitch 的電交換更像“固定結(jié)構(gòu)的交換機(jī)級聯(lián)”,而 OCS 是“光纖+鏡子”,可以在4096 芯片尺度上做 1:1 的電路級重連,并且?guī)砀邘挐摿εc更低功耗/成本壓力。

而在“大模型”訓(xùn)練里,通信很容易變成主瓶頸(尤其是 all-reduce / all-to-all / all-gather)。Google 的材料里也直說:巨型模型通信開銷顯著,擴(kuò)展需要一攬子優(yōu)化,并且要盡可能做計算與通信重疊。

這就是 TPU 的“勝點”:它不是只靠算力,而是靠**“系統(tǒng)工程 + 軟件棧”**把規(guī);(xùn)練/推理的瓶頸端到端優(yōu)化掉。

3) 那么:這會不會“系統(tǒng)性替代 GPU + CUDA”? 3.1 會替代的部分:在超大規(guī)模、成本敏感的“云側(cè)主戰(zhàn)場”,趨勢更偏長期結(jié)構(gòu)性

原因很直接:當(dāng)你的規(guī)模上升到“上萬/十萬顆加速器”時,決定勝負(fù)的是集群級擴(kuò)展。材料里提到 TPU 的網(wǎng)絡(luò)/系統(tǒng)可以連接到10 萬級芯片、~13Pbps 量級的雙向帶寬(Jupiter fabric)。
并且 TPU 還在往“多切片/多集群近線性擴(kuò)展”方向推進(jìn)(Multislice 連接多個 slice,把單任務(wù)擴(kuò)展到成千上萬乃至數(shù)萬顆 TPU)。

這意味著:對超大云廠商(或極少數(shù)具備同等級系統(tǒng)工程能力的玩家),“垂直整合”不是階段性策略,而是一種可持續(xù)的成本曲線優(yōu)勢——尤其在推理規(guī)模爆發(fā)后,能效和利用率會越來越硬核。

3.2 不會完全替代的部分:在通用市場(多樣化負(fù)載/開發(fā)者生態(tài))更像階段性與長期并存

GPU + CUDA 的強(qiáng)項仍然是:

  • 通用性:科研、圖形、仿真、視頻、各種不規(guī)則算子/新算子快速落地;

  • 生態(tài)慣性:大量現(xiàn)成庫、工程經(jīng)驗、人才供給。

而 TPU 體系的門檻在于:你需要把芯片 + 網(wǎng)絡(luò) + 編譯器/并行策略 + 調(diào)度系統(tǒng)整套吃下來,才能吃到主要紅利(這也是“產(chǎn)線式”方案的特征)。這就是為什么“垂直整合”更容易在大廠內(nèi)部閉環(huán)先跑通。

4) 最終判斷:它是“分層替代”,并且在云側(cè)是結(jié)構(gòu)性長期趨勢

  • 對超大規(guī)模云側(cè)訓(xùn)練/推理主戰(zhàn)場:垂直整合 ASIC + 軟件棧是更偏“結(jié)構(gòu)性長期趨勢”。因為 TPU 展示了在同等規(guī)模下“更快+更省電”的系統(tǒng)級優(yōu)勢,并通過 OCS/集群網(wǎng)絡(luò)/軟件棧把擴(kuò)展做到了 GPU 體系很難用同樣方式解決的尺度。

  • 對更廣泛的通用計算與多樣化 AI 負(fù)載:GPU + CUDA 仍將長期共存。GPU 像“通用平臺”,TPU 像“專用產(chǎn)線”。未來更可能是:一線云廠商內(nèi)部用垂直整合吃下成本曲線,而行業(yè)外部仍大量使用 GPU(以及把 TPU 當(dāng)作云上的一種選擇)。

5) 給半導(dǎo)體工程師的“看趨勢抓手”

如果你要判斷這是不是長期趨勢,不要只盯 TOPS/TFLOPS,建議盯三件事:

  1. 集群 goodput(有效吞吐):能不能把峰值算力“變現(xiàn)”為訓(xùn)練/推理速度?(大模型通信開銷是硬現(xiàn)實)

  2. 網(wǎng)絡(luò)/拓?fù)涞目伤苄?/strong>:固定拓?fù)?vs 可重構(gòu)拓?fù)洌∣CS 這類東西的系統(tǒng)價值會越來越大)

  3. 編譯器/并行系統(tǒng)能力:XLA/JAX/Pathways 這種軟件棧是不是能持續(xù)把新模型映射到硬件上并保持高效率?

歡迎加入行業(yè)交流群,備注崗位+公司,請聯(lián)系老虎說芯(加V:tigerchip)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
重磅!NBA官宣喬治違反禁藥政策禁賽25場 損失1174萬美元已道歉

重磅!NBA官宣喬治違反禁藥政策禁賽25場 損失1174萬美元已道歉

醉臥浮生
2026-02-01 01:26:16
她是正國級領(lǐng)導(dǎo)的女兒,投行界的拔尖人物,敢闖敢拼讓人打心底佩服

她是正國級領(lǐng)導(dǎo)的女兒,投行界的拔尖人物,敢闖敢拼讓人打心底佩服

老杉說歷史
2026-01-29 22:51:13
李湘也沒想到,11年前讓她懷二胎的人,如今竟成為她的“救贖”

李湘也沒想到,11年前讓她懷二胎的人,如今竟成為她的“救贖”

夢在深巷qw
2026-01-31 17:17:38
一個殘酷的真相:夜空中7000顆星星,全都位于銀河系范圍內(nèi)

一個殘酷的真相:夜空中7000顆星星,全都位于銀河系范圍內(nèi)

觀察宇宙
2026-01-31 20:29:00
委內(nèi)瑞拉代總統(tǒng):計劃對政治犯實行大赦!委軍方表態(tài):對她絕對忠誠與服從

委內(nèi)瑞拉代總統(tǒng):計劃對政治犯實行大赦!委軍方表態(tài):對她絕對忠誠與服從

每日經(jīng)濟(jì)新聞
2026-01-31 23:17:09
平均每人負(fù)債1300萬,書記吳仁寶去世10年后,華西村的現(xiàn)況如何?

平均每人負(fù)債1300萬,書記吳仁寶去世10年后,華西村的現(xiàn)況如何?

哄動一時啊
2026-01-24 21:29:54
去世9天才被發(fā)現(xiàn),惠天賜的離世,成為惠英紅無法原諒自己的痛

去世9天才被發(fā)現(xiàn),惠天賜的離世,成為惠英紅無法原諒自己的痛

以茶帶書
2026-01-31 23:33:15
小學(xué)階段,最沒用的事:家庭總收入連兩萬都沒有,卻拼命去雞娃

小學(xué)階段,最沒用的事:家庭總收入連兩萬都沒有,卻拼命去雞娃

好爸育兒
2026-02-01 17:44:08
佟麗婭為兒子朵朵慶祝10歲生日,前夫陳思誠罕見出席,朵朵好文雅

佟麗婭為兒子朵朵慶祝10歲生日,前夫陳思誠罕見出席,朵朵好文雅

科學(xué)發(fā)掘
2026-02-01 09:47:55
70歲后想多活30年,記住這5句話,活好余生每一日

70歲后想多活30年,記住這5句話,活好余生每一日

青蘋果sht
2026-01-31 05:27:33
1969年,蘇聯(lián)為何放棄用核武器轟炸中國?多年以后,叛逃的蘇方高層終于說出了緣由

1969年,蘇聯(lián)為何放棄用核武器轟炸中國?多年以后,叛逃的蘇方高層終于說出了緣由

史海孤雁
2026-01-23 15:26:12
注意!松江發(fā)布霜凍黃色預(yù)警

注意!松江發(fā)布霜凍黃色預(yù)警

上觀新聞
2026-02-01 19:39:15
“價格屠夫”:河北電商,正在“血洗”全國批發(fā)市場

“價格屠夫”:河北電商,正在“血洗”全國批發(fā)市場

蘇格拉高
2026-01-31 07:50:47
四國演練擊沉中國軍艦,中方輕飄飄回了句英文,傷害不大侮辱性強(qiáng)

四國演練擊沉中國軍艦,中方輕飄飄回了句英文,傷害不大侮辱性強(qiáng)

墨蘭史書
2026-01-30 17:25:04
張本美和成功奪冠!3:0擊敗世界冠軍,成為日本錦標(biāo)賽單屆4冠王

張本美和成功奪冠!3:0擊敗世界冠軍,成為日本錦標(biāo)賽單屆4冠王

國乒二三事
2026-02-01 14:41:15
突然大跌!比特幣,跌破79000美元關(guān)口!加密貨幣市值一夜蒸發(fā)1110億美元,超42萬人爆倉

突然大跌!比特幣,跌破79000美元關(guān)口!加密貨幣市值一夜蒸發(fā)1110億美元,超42萬人爆倉

每日經(jīng)濟(jì)新聞
2026-02-01 08:19:16
難以置信!鄭州網(wǎng)友哭訴公司年會抽中蘋果17,獎品被頂頭上司盯上

難以置信!鄭州網(wǎng)友哭訴公司年會抽中蘋果17,獎品被頂頭上司盯上

火山詩話
2026-02-01 10:26:39
75歲譚詠麟街頭買金魚!與老板老友式寒暄,無保鏢接地氣引狂贊

75歲譚詠麟街頭買金魚!與老板老友式寒暄,無保鏢接地氣引狂贊

丁睋解說
2026-02-01 19:16:53
納達(dá)爾見證!阿爾卡拉斯澳網(wǎng)奪冠解鎖十大成就 激動落淚開心捧杯

納達(dá)爾見證!阿爾卡拉斯澳網(wǎng)奪冠解鎖十大成就 激動落淚開心捧杯

醉臥浮生
2026-02-01 20:24:57
假山假景假臉,央視《生命樹》的爆火,打臉多少“流水線”年代劇

假山假景假臉,央視《生命樹》的爆火,打臉多少“流水線”年代劇

云舟史策
2026-01-30 23:05:34
2026-02-01 21:23:00
老虎說芯 incentive-icons
老虎說芯
資深半導(dǎo)體工程師的經(jīng)驗分享
701文章數(shù) 24關(guān)注度
往期回顧 全部

科技要聞

10億元寶紅包突襲 復(fù)刻微信支付還是微視?

頭條要聞

老人獄中離世14年后獲無罪 孫子專門就讀法律專業(yè)申訴

頭條要聞

老人獄中離世14年后獲無罪 孫子專門就讀法律專業(yè)申訴

體育要聞

鎖喉吃紅牌+扇耳光 英超15人打群架

娛樂要聞

春晚第三次聯(lián)排陣容曝光:全是實力派

財經(jīng)要聞

黃仁勛臺北"夜宴":匯聚近40位臺企高管

汽車要聞

嵐圖汽車1月交付10515輛 同比增長31%

態(tài)度原創(chuàng)

親子
健康
教育
家居
手機(jī)

親子要聞

這些動畫片,孩子越看越聰明!

耳石癥分類型,癥狀大不同

教育要聞

共122人獲獎!綿陽青少年在這項省級活動中喜獲佳績!

家居要聞

藍(lán)調(diào)空舍 自由與個性

手機(jī)要聞

iPhone Air 2傳出壞消息:年內(nèi)無望發(fā)布,只因一代并不成功!

無障礙瀏覽 進(jìn)入關(guān)懷版