国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

別卷GPU了!當(dāng)下真正卡脖子的,是CPU

0
分享至



圖片由AI生成

文|李海倫

編輯|徐青陽(yáng)

在AI狂飆的這些年里,行業(yè)幾乎被一條邏輯主導(dǎo):算力決定上限,而GPU就是算力的核心。

不過,進(jìn)入2026年,這套邏輯開始變動(dòng):模型推理不再是唯一瓶頸,系統(tǒng)性能越來越取決于執(zhí)行與調(diào)度能力。GPU依然重要,但決定AI“能不能跑起來”的關(guān)鍵,正逐漸轉(zhuǎn)向長(zhǎng)期被忽視的CPU。

美國(guó)當(dāng)?shù)貢r(shí)間4月9日,谷歌與英特爾達(dá)成多年協(xié)議,在全球AI數(shù)據(jù)中心規(guī)模部署英特爾的“Xeon至強(qiáng)處理器”,正是為了破解這個(gè)瓶頸。英特爾CEO陳立武直言,AI運(yùn)行在整個(gè)系統(tǒng)上,CPU和IPU才是性能、效率和靈活性的關(guān)鍵。換句話說,過去兩年被當(dāng)作“配角”的CPU,正在卡住AI擴(kuò)展的“脖子”。


英特爾CEO陳立武在社交媒體表示:英特爾正與谷歌深化合作,從傳統(tǒng)CPU擴(kuò)展到AI基礎(chǔ)設(shè)施(如IPU),共同推進(jìn)AI與云計(jì)算能力建設(shè)。

CPU不再只是一個(gè)被動(dòng)的配套組件,而正在成為AI基礎(chǔ)設(shè)施中的關(guān)鍵變量之一。

01
一場(chǎng)“悄無(wú)聲息”的供應(yīng)危機(jī)

當(dāng)大家都在盯著GPU的交貨周期時(shí),CPU市場(chǎng)的緊張氣氛已經(jīng)悄然拉滿。

根據(jù)多家IT分銷商的最新報(bào)告,2025年第四季度,服務(wù)器CPU的平均售價(jià)上漲了約30%。這種漲幅在相對(duì)成熟的CPU市場(chǎng)是非常罕見的。

AMD數(shù)據(jù)中心負(fù)責(zé)人福雷斯特·諾羅德(Forrest Norrod)透露,過去三個(gè)季度,CPU需求的增長(zhǎng)速度超乎想象。目前,AMD的交付周期已經(jīng)從原來的八周延長(zhǎng)到了十周以上,部分型號(hào)甚至面臨長(zhǎng)達(dá)六個(gè)月的延遲。

這種短缺主要由于“次級(jí)效應(yīng)”引發(fā)的資源擠兌。有業(yè)內(nèi)人士表示,由于臺(tái)積電的3nm生產(chǎn)線極其緊張,原本分配給CPU的晶圓產(chǎn)能,正不斷被利潤(rùn)更高的GPU訂單擠占。這導(dǎo)致了一個(gè)極具諷刺意味的局面:AI實(shí)驗(yàn)室擁有了足夠的GPU,卻發(fā)現(xiàn)市場(chǎng)上買不到足夠的頂級(jí)CPU來“帶”動(dòng)這些顯卡。

在這一輪CPU搶購(gòu)潮中,還有埃隆·馬斯克(Elon Musk)。

英特爾首席執(zhí)行官陳立武在社交平臺(tái)上證實(shí),馬斯克已委托英特爾為其在得克薩斯州的“Terafab”項(xiàng)目設(shè)計(jì)并制造定制芯片。這個(gè)龐大的項(xiàng)目旨在為xAI、SpaceX和特斯拉提供統(tǒng)一的計(jì)算底座。

馬斯克對(duì)英特爾的信任,在很大程度上是因?yàn)橛⑻貭栒噲D將自己嵌入到從地面數(shù)據(jù)中心到太空軌道計(jì)算的每一個(gè)層面。


對(duì)于英特爾來說,這無(wú)疑是一劑強(qiáng)心針。有行業(yè)分析師預(yù)測(cè)AMD在服務(wù)器CPU市場(chǎng)的收入份額將在2026年超過英特爾,但英特爾在x86生態(tài)系統(tǒng)中的深厚慣性和制造能力,依然是馬斯克這類大客戶無(wú)法忽視的籌碼。

這種跨行業(yè)的深度捆綁,正讓CPU市場(chǎng)的競(jìng)爭(zhēng)從單純的參數(shù)比拼,升級(jí)為生態(tài)系統(tǒng)和供應(yīng)鏈穩(wěn)定性的博弈。

02
為什么CPU會(huì)成為“短板”?

CPU突然成為瓶頸,核心是它需要承擔(dān)的工作,在智能體時(shí)代發(fā)生了根本性變化。

傳統(tǒng)聊天機(jī)器人模式中,CPU主要負(fù)責(zé)調(diào)度和數(shù)據(jù)處理,GPU承擔(dān)核心推理計(jì)算。由于計(jì)算密集型環(huán)節(jié)集中在GPU側(cè),整體延遲通常由GPU主導(dǎo),CPU很少成為性能瓶頸。

但智能體工作負(fù)載完全不同。一個(gè)智能體需要執(zhí)行多步推理、調(diào)用API、讀寫數(shù)據(jù)庫(kù)、編排復(fù)雜業(yè)務(wù)流,并將中間結(jié)果整合為最終輸出。搜索、API調(diào)用、代碼執(zhí)行、文件I/O和結(jié)果編排等任務(wù),大部分落在CPU和主機(jī)系統(tǒng)側(cè)。GPU負(fù)責(zé)token生成(即“思考”),而CPU負(fù)責(zé)將“思考”結(jié)果轉(zhuǎn)化為實(shí)際行動(dòng)。

佐治亞理工學(xué)院學(xué)者在2025年11月發(fā)表的論文《以CPU為中心的智能體型AI視角》(A CPU-Centric Perspective on Agentic AI)中,對(duì)智能體工作負(fù)載中的延遲分布進(jìn)行了量化分析。研究發(fā)現(xiàn),CPU端工具處理所占用的時(shí)間,占總延遲的50%至90.6%。在某些場(chǎng)景下,GPU已準(zhǔn)備好處理下一批任務(wù),而CPU仍在等待工具調(diào)用返回。

另一個(gè)關(guān)鍵因素是上下文窗口的快速擴(kuò)展。2024年,主流模型大多支持128K至200K token。進(jìn)入2025年,Gemini 2.5 Pro、GPT-4.1、Llama 4 Maverick等模型均開始支持100萬(wàn)token以上。KV緩存(Key-Value Cache,用于加速Transformers模型推理過程)隨token數(shù)量線性增長(zhǎng),在100萬(wàn)token時(shí)約為200GB,遠(yuǎn)超單塊H100的80GB顯存容量。

對(duì)于這類問題的解決方案之一是將KV緩存部分卸載至CPU內(nèi)存。這意味著CPU不僅要管理編排和工具調(diào)用,還要協(xié)助承載顯存放不下的數(shù)據(jù)。CPU內(nèi)存容量、內(nèi)存帶寬以及CPU與GPU之間的互連速度,由此成為系統(tǒng)性能的關(guān)鍵。

因此,適合智能體時(shí)代的CPU,更需要低延遲、一致的內(nèi)存訪問能力,以及更強(qiáng)的系統(tǒng)級(jí)協(xié)同能力,而不是單一的核心規(guī)模擴(kuò)張。

03
廠商們都在做什么?有人搶地盤,有人改設(shè)計(jì)

面對(duì)這場(chǎng)突然爆發(fā)的CPU需求,幾家大廠的打法完全不同。

英特爾是傳統(tǒng)服務(wù)器CPU的老大。Mercury Research的數(shù)據(jù)顯示,2025年第四季度,英特爾在服務(wù)器CPU市場(chǎng)仍占60%的份額,AMD占24.3%,英偉達(dá)占6.2%。但英特爾這些年一直在追趕新技術(shù),這次CPU需求的爆發(fā)對(duì)他們來說,既是機(jī)會(huì)也是考驗(yàn)。

英特爾現(xiàn)在的策略是兩條腿走路。一邊是繼續(xù)賣至強(qiáng)處理器,跟谷歌這樣的超大規(guī)??蛻羯疃冉壎?/strong>;另一邊跟SambaNova合作,推出基于至強(qiáng)處理器與其自研RDU加速器的組合方案,主打“不用GPU也能跑智能體推理”的賣點(diǎn)。至強(qiáng)6 Granite Rapids和18A工藝的路線圖,將是檢驗(yàn)英特爾能否翻盤的關(guān)鍵。

AMD則是這次CPU需求爆發(fā)中最大的受益者之一。2025年第四季度,AMD數(shù)據(jù)中心收入54億美元,同比增長(zhǎng)39%。第五代EPYC Turin占了服務(wù)器CPU收入的一半以上,運(yùn)行EPYC的云實(shí)例部署同比增長(zhǎng)超過50%。AMD的服務(wù)器CPU收入份額首次突破40%。

AMD CEO蘇姿豐(Lisa Su)把增長(zhǎng)原因直接歸到了“智能體”的發(fā)展——智能體工作負(fù)載把任務(wù)“推回”到了傳統(tǒng)CPU任務(wù)上。

2026年2月,AMD還宣布了一項(xiàng)與Meta的潛在交易,價(jià)值超過1000億美元,供應(yīng)MI450 GPU和Venice EPYC CPU。

不過,AMD在系統(tǒng)級(jí)協(xié)同方面仍有提升空間,缺乏類似NVLink C2C這樣成熟的高速CPU-GPU互連能力。隨著智能體(Agent)系統(tǒng)對(duì)數(shù)據(jù)交互與協(xié)同效率要求不斷提高,這一環(huán)節(jié)的重要性也在逐步上升。

英偉達(dá)設(shè)計(jì)CPU的思路,跟英特爾和AMD完全不一樣。

英偉達(dá)Grace CPU只有72個(gè)核心,而AMD EPYC和英特爾至強(qiáng)通常是128個(gè)。英偉達(dá)AI基礎(chǔ)設(shè)施負(fù)責(zé)人迪昂·哈里斯(Dion Harris)解釋稱:“如果你是超大規(guī)模企業(yè),你希望最大化每個(gè)CPU的核心數(shù)量,這基本上會(huì)降低成本,即每核心的美元成本。所以這是一種商業(yè)模式?!?/p>

換句話說,在AI算力體系里,CPU的角色不再是通用計(jì)算主力,而是為GPU服務(wù)的“調(diào)度中樞”。如果CPU跟不上,昂貴的GPU就會(huì)被迫等待,整體效率反而下降。

因此,英偉達(dá)在設(shè)計(jì)上優(yōu)先保證CPU與GPU之間的高效協(xié)同。例如通過NVLink C2C互連,將CPU與GPU之間的帶寬提升到約1.8TB/s,遠(yuǎn)高于傳統(tǒng)PCIe,CPU可以直接訪問GPU內(nèi)存,KV緩存管理一下子簡(jiǎn)單了很多。

目前,英偉達(dá)已將Vera CPU作為獨(dú)立產(chǎn)品銷售。CoreWeave是第一個(gè)客戶。與Meta的交易更夸張,這是其第一次大規(guī)?!凹僄race部署”,也就是CPU在沒有GPU配對(duì)的情況下大規(guī)模獨(dú)立部署。

研究機(jī)構(gòu)Creative Strategies首席分析師本·巴賈林(Ben Bajarin)指出,在高強(qiáng)度的系統(tǒng)協(xié)作中,CPU的處理能力必須能夠匹配加速器的迭代速度。如果數(shù)據(jù)通道出現(xiàn)哪怕百分之一的延遲,整個(gè)AI集群的經(jīng)濟(jì)效益就會(huì)大打折扣。這種對(duì)極致系統(tǒng)效率的追求,正迫使所有大廠重新審視CPU的性能指標(biāo)。

Constellation Research副總裁兼首席分析師霍爾格·穆勒(Holger Mueller)表示,隨著AI工作負(fù)載向智能體驅(qū)動(dòng)架構(gòu)轉(zhuǎn)變,CPU的地位正變得愈發(fā)核心。他指出:“在智能體世界中,智能體需要調(diào)用API和各類業(yè)務(wù)應(yīng)用程序,這些任務(wù)最適合由CPU來完成?!?/p>

他還補(bǔ)充道:“目前,關(guān)于GPU和CPU誰(shuí)更適合處理推理任務(wù),尚無(wú)定論。GPU在模型訓(xùn)練方面占據(jù)優(yōu)勢(shì),而像TPU這樣的定制ASIC也有其專長(zhǎng)。但有一點(diǎn)是明確的:谷歌需要采用混合處理器架構(gòu)。因此,谷歌選擇與英特爾展開合作是合理的”。

04
結(jié)語(yǔ):智能體時(shí)代,算力天平回?cái)[

在最新的產(chǎn)業(yè)觀察中,一個(gè)數(shù)據(jù)需要我們注意。在亞馬遜AWS與OpenAI高達(dá)380億美元的合作協(xié)議中,其官方也明確提到了“數(shù)千萬(wàn)個(gè)CPU”的擴(kuò)展規(guī)模。

在過去幾年,通常情況下,行業(yè)的關(guān)注焦點(diǎn)總是那“數(shù)十萬(wàn)個(gè)GPU”。然而,OpenAI等前沿實(shí)驗(yàn)室主動(dòng)將CPU規(guī)模作為一個(gè)重要的規(guī)劃變量,向外界傳遞了一個(gè)清晰的信號(hào):智能體工作負(fù)載的擴(kuò)展,必須建立在龐大的CPU基礎(chǔ)設(shè)施之上。

美國(guó)銀行預(yù)測(cè),到2030年,全球CPU市場(chǎng)規(guī)模有望從目前的270億美元翻倍至600億美元。這多出來的份額,幾乎全部將由AI驅(qū)動(dòng)。

我們正在見證一種全新的基礎(chǔ)設(shè)施開始擴(kuò)張:大廠不再只堆GPU,而是同步擴(kuò)張一整層“CPU調(diào)度基礎(chǔ)設(shè)施”,專門為AI智能體提供運(yùn)行支撐。

英特爾與谷歌的聯(lián)手,以及馬斯克對(duì)定制芯片的重金投入,都在證明一個(gè)事實(shí):AI競(jìng)賽的制勝點(diǎn)正在前移。當(dāng)算力不再稀缺,誰(shuí)能最先解決系統(tǒng)級(jí)的“瓶頸”,誰(shuí)才能在這場(chǎng)萬(wàn)億級(jí)的游戲中笑到最后。

*特約編譯金鹿對(duì)本文亦有貢獻(xiàn)。

—— 芯榜 ——

芯榜成立于 2015 年,是半導(dǎo)體垂直領(lǐng)域的產(chǎn)業(yè)媒體與數(shù)字化服務(wù)平臺(tái)。全網(wǎng)覆蓋超 100 萬(wàn)垂直行業(yè)用戶,核心提供專業(yè)榜單發(fā)布、原創(chuàng)訪談、產(chǎn)業(yè)報(bào)告、峰會(huì)活動(dòng)及研究咨詢等服務(wù)。已合作近千家半導(dǎo)體生態(tài)企業(yè),聯(lián)動(dòng)多家基金公司與產(chǎn)業(yè)媒體,助力硬科技產(chǎn)業(yè)發(fā)展。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
故宮每年用60噸豬血鎮(zhèn)邪?最新回應(yīng)來了

故宮每年用60噸豬血鎮(zhèn)邪?最新回應(yīng)來了

蓬勃新聞
2026-04-19 13:07:14
2026年電費(fèi)新規(guī)出爐,7月1日?qǐng)?zhí)行,6大調(diào)整,每家每戶都要了解

2026年電費(fèi)新規(guī)出爐,7月1日?qǐng)?zhí)行,6大調(diào)整,每家每戶都要了解

小談食刻美食
2026-04-19 08:31:32
女生主動(dòng)起來有多黏人?網(wǎng)友:這些女的太開放了

女生主動(dòng)起來有多黏人?網(wǎng)友:這些女的太開放了

帶你感受人間冷暖
2026-01-27 00:20:06
民進(jìn)黨,極有可能在下一屆臺(tái)灣地區(qū)選舉后,成為長(zhǎng)期一家獨(dú)大政黨

民進(jìn)黨,極有可能在下一屆臺(tái)灣地區(qū)選舉后,成為長(zhǎng)期一家獨(dú)大政黨

李橑在北漂
2026-04-02 10:22:26
誰(shuí)懂??!別克新款世紀(jì)CENTURY,把中式山水美學(xué)焊在MPV上

誰(shuí)懂??!別克新款世紀(jì)CENTURY,把中式山水美學(xué)焊在MPV上

沙雕小琳琳
2026-04-20 07:57:54
曼城2-1阿森納,賽后評(píng)分:不是哈蘭德第一,曼城10號(hào)第一

曼城2-1阿森納,賽后評(píng)分:不是哈蘭德第一,曼城10號(hào)第一

側(cè)身凌空斬
2026-04-20 01:26:44
廣東最新消息!徐杰深夜發(fā)聲,新大外參加婚禮,焦泊喬遭棄用

廣東最新消息!徐杰深夜發(fā)聲,新大外參加婚禮,焦泊喬遭棄用

多特體育說
2026-04-19 22:56:40
黃巖島已露出大片陸地,如填海將變成我國(guó)超級(jí)大島,可移民20萬(wàn)人

黃巖島已露出大片陸地,如填海將變成我國(guó)超級(jí)大島,可移民20萬(wàn)人

共工之錨
2026-04-19 22:07:48
遭公開控訴雙面人后,王陽(yáng)被曝大瓜,才發(fā)現(xiàn)蔣欣當(dāng)年決策有多高明

遭公開控訴雙面人后,王陽(yáng)被曝大瓜,才發(fā)現(xiàn)蔣欣當(dāng)年決策有多高明

阿褲趣聞君
2026-04-17 23:11:38
73場(chǎng)造13球 荷蘭新帶刀后衛(wèi)已成曼城今夏重點(diǎn)引援目標(biāo) 3豪門來?yè)?>
    </a>
        <h3>
      <a href=零度眼看球
2026-04-20 07:30:58
陳忠和:69歲不顯老,與女兒來往不多,他為大齡兒子的婚事操心

陳忠和:69歲不顯老,與女兒來往不多,他為大齡兒子的婚事操心

細(xì)品名人
2026-04-18 07:21:48
斯嘉麗·約翰遜:千禧年好萊塢的"合法羞辱"

斯嘉麗·約翰遜:千禧年好萊塢的"合法羞辱"

影視情報(bào)室
2026-04-19 03:11:14
笑麻!女子吐槽花1年裝修的新中式都說像法庭,我卻笑死在評(píng)論區(qū)

笑麻!女子吐槽花1年裝修的新中式都說像法庭,我卻笑死在評(píng)論區(qū)

另子維愛讀史
2026-04-17 17:36:52
徐明聯(lián)手本拉登家族,400億硬剛中石油,帝國(guó)崩塌

徐明聯(lián)手本拉登家族,400億硬剛中石油,帝國(guó)崩塌

圓夢(mèng)的小老頭
2026-04-17 23:52:41
黃國(guó)昌與鄭麗文談妥,新北大局已定;連勝文出手,挺藍(lán)最美發(fā)言人

黃國(guó)昌與鄭麗文談妥,新北大局已定;連勝文出手,挺藍(lán)最美發(fā)言人

娛樂圈的筆娛君
2026-04-19 15:59:07
遠(yuǎn)嫁中國(guó)8年回伊朗娘家,突然發(fā)現(xiàn)自己已經(jīng)成為了當(dāng)?shù)馗黄牛?>
    </a>
        <h3>
      <a href=老特有話說
2026-04-17 17:10:53
紅果 “拔管” 引爆短劇圈:90%公司將出局,遲到的行業(yè)大洗牌?

紅果 “拔管” 引爆短劇圈:90%公司將出局,遲到的行業(yè)大洗牌?

老特有話說
2026-03-09 15:16:53
哈里斯:美國(guó)人不想打伊朗,特朗普意圖“轉(zhuǎn)移焦點(diǎn)”

哈里斯:美國(guó)人不想打伊朗,特朗普意圖“轉(zhuǎn)移焦點(diǎn)”

界面新聞
2026-04-19 14:59:22
斯諾克世錦賽10強(qiáng)賽:5人晉級(jí),中國(guó)2人出局

斯諾克世錦賽10強(qiáng)賽:5人晉級(jí),中國(guó)2人出局

鏗鏘格斗
2026-04-20 06:00:53
黑粉攻擊何潤(rùn)東風(fēng)波升級(jí)!博主怒撕:蹭熱度該適可而止,又老又丑

黑粉攻擊何潤(rùn)東風(fēng)波升級(jí)!博主怒撕:蹭熱度該適可而止,又老又丑

小徐講八卦
2026-04-19 15:19:03
2026-04-20 08:27:00
芯榜 incentive-icons
芯榜
中國(guó)芯片排行榜
4489文章數(shù) 3247關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類紀(jì)錄!300臺(tái)機(jī)器人狂飆半馬

頭條要聞

特朗普:美伊20日將舉行談判 再不接受協(xié)議就轟炸伊朗

頭條要聞

特朗普:美伊20日將舉行談判 再不接受協(xié)議就轟炸伊朗

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

何潤(rùn)東漲粉百萬(wàn)!內(nèi)娛隔空掀桌第一人

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬(wàn) 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

家居
手機(jī)
教育
健康
公開課

家居要聞

法式線條 時(shí)光靜淌

手機(jī)要聞

紅米K100系列再次曝光:BOSE揚(yáng)聲器+超強(qiáng)馬達(dá),沖高不靠風(fēng)扇!

教育要聞

孩子走到學(xué)校門口死活不進(jìn)去,媽媽硬把他推進(jìn)去

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版