国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

GPU神話松動(dòng),AI真正的戰(zhàn)場變了

0
分享至


出品 | 妙投APP

作者 | 張博

編輯 | 丁萍

頭圖 | AI生圖


過去兩年,AI產(chǎn)業(yè)最強(qiáng)的敘事幾乎都圍繞GPU展開。

從OpenAI掀起大模型浪潮,到英偉達(dá)市值飆升,再到云廠商、互聯(lián)網(wǎng)平臺(tái)和創(chuàng)業(yè)公司爭搶高端算力,GPU被塑造成AI時(shí)代最稀缺的“硬通貨”。誰擁有更多GPU,誰就更接近模型能力上限,誰能搭起更大訓(xùn)練集群,誰就更像拿到了下一代AI的門票。

在這套敘事中,CPU沒有消失,但明顯退居幕后。它仍然是服務(wù)器的基礎(chǔ)部件,是操作系統(tǒng)、數(shù)據(jù)庫、網(wǎng)絡(luò)和應(yīng)用運(yùn)行的底座,卻不再是AI故事里的主角。市場甚至形成了一種近乎默認(rèn)的判斷:AI時(shí)代,GPU吃肉,CPU喝湯。

但到2026年,這個(gè)判斷已經(jīng)不夠用了。因?yàn)锳I產(chǎn)業(yè)正在發(fā)生一個(gè)更深層的變化:主戰(zhàn)場正從訓(xùn)練競賽,轉(zhuǎn)向部署競賽;價(jià)值重心正從峰值算力,轉(zhuǎn)向系統(tǒng)效率。

這意味著,真正決定AI商業(yè)化速度的,不再只是GPU能把模型訓(xùn)得多大、多快,而是整套系統(tǒng)能否以可控成本、穩(wěn)定吞吐和高利用率,把模型真正跑起來、用起來、賺到錢。

一旦競爭從“單卡性能”轉(zhuǎn)向“端到端效率”,CPU就不再只是配角,而是AI基礎(chǔ)設(shè)施里那個(gè)被長期低估的系統(tǒng)變量。

市場為何重新看英特爾?

不只是因?yàn)樨?cái)報(bào),而是因?yàn)樾枨蠼Y(jié)構(gòu)變了。

最近一個(gè)值得注意的信號(hào),是英特爾重新獲得資本市場關(guān)注。2026年第一季度,英特爾營收約為136億美元,同比增長7%,連續(xù)第六個(gè)季度超預(yù)期;凈利潤同比增長156%。其中,數(shù)據(jù)中心與AI相關(guān)業(yè)務(wù)(DCAI)收入達(dá)到約51億美元,同比增長22%,成為增長最快的板塊。財(cái)報(bào)發(fā)布后,英特爾股價(jià)盤后最高上漲超40%(截至4月30日)。

如果只看公司層面,這當(dāng)然不足以說明英特爾已經(jīng)徹底翻身。它仍面臨制程追趕、服務(wù)器CPU份額承壓、Arm滲透、云廠商自研芯片推進(jìn)等問題。但市場還是給了它新的想象空間,原因不在于英特爾突然變成AI明星,而在于投資人開始意識(shí)到:AI基礎(chǔ)設(shè)施的需求結(jié)構(gòu),已經(jīng)不再只是“多買GPU”。

英特爾管理層在財(cái)報(bào)會(huì)上透露,數(shù)據(jù)中心中CPU與GPU的部署比例,正從傳統(tǒng)的1:8收緊到1:4,在智能體場景中甚至可能進(jìn)一步向1:1靠近。

這背后的含義非常明確:過去兩年AI行業(yè)最核心的矛盾是訓(xùn)練能力不足,而今天越來越多企業(yè)開始面對(duì)另一組問題,模型訓(xùn)練完之后,如何推理、如何部署、如何擴(kuò)展、如何控制成本。

也就是說,資本市場重新定價(jià)的,不只是英特爾,而是一個(gè)更深層的事實(shí):AI開始進(jìn)入系統(tǒng)競爭階段。

CPU的重要性從何而來?

先要回答另一個(gè)問題:為什么AI今天的核心矛盾,已經(jīng)不再只是訓(xùn)練。因?yàn)橛?xùn)練雖然貴,但對(duì)大多數(shù)企業(yè)來說,它更多是階段性的資本開支;而推理、部署和調(diào)用,才是持續(xù)性的運(yùn)營開支。

訓(xùn)練決定模型能不能做出來,推理決定模型能不能活下去。這一變化已經(jīng)有明確的數(shù)據(jù)支撐。

Deloitte估算,推理工作負(fù)載占AI總算力的比例在2023年約為1/3,2025年接近1/2,到2026年預(yù)計(jì)達(dá)到2/3。IDC預(yù)測,到2027年中國推理算力占整體算力比例將突破70%。另有研究預(yù)計(jì),到2026年推理帶來的市場規(guī)模將是訓(xùn)練硬件市場的2到3倍。這些數(shù)字共同說明一件事:AI的成本中心和價(jià)值中心,正在從“訓(xùn)練一次”轉(zhuǎn)向“運(yùn)行無數(shù)次”。

鄭緯民院士給過一個(gè)更直白的拆分:在大模型推理成本中,人力僅占3%,數(shù)據(jù)占2%,算力占到95%。他舉例稱,ChatGPT的推理開銷每天約70萬美元,DeepSeek V3每天約8.7萬美元(按各自披露口徑)。

這組數(shù)據(jù)真正說明的,不是“推理也很貴”,而是一旦AI進(jìn)入大規(guī)模使用階段,真正吞噬利潤的不是訓(xùn)練賬,而是推理賬。國家數(shù)據(jù)局的數(shù)據(jù)進(jìn)一步放大了這種壓力:中國日均Token調(diào)用量從2024年初約1000億,躍升至2026年3月的140萬億,兩年增長超千倍。

如果說訓(xùn)練是一次性把錢砸進(jìn)去,那么推理就是每天都在把錢燒出去。訓(xùn)練貴,是研發(fā)問題;推理貴,是利潤問題。而一旦問題變成利潤問題,企業(yè)就不可能再只盯著模型參數(shù)和GPU數(shù)量,而必須開始追問:

GPU是不是被充分利用了?哪些任務(wù)必須用GPU?哪些其實(shí)應(yīng)該交給CPU?整套系統(tǒng)的吞吐率和資源利用率到底高不高?

這正是CPU重新變重要的起點(diǎn)。

很多人理解AI基礎(chǔ)設(shè)施,還停留在“GPU越多越好”的階段。但現(xiàn)實(shí)是,今天大量AI系統(tǒng)面臨的核心問題,不是GPU不夠強(qiáng),而是系統(tǒng)喂不飽GPU。

MLPerf行業(yè)基準(zhǔn)測試顯示,在大模型訓(xùn)練場景中,數(shù)據(jù)加載、預(yù)處理、參數(shù)同步等環(huán)節(jié)帶來的延遲,可占總訓(xùn)練時(shí)間的35%到60%。IDC調(diào)研則顯示,即使是頭部互聯(lián)網(wǎng)企業(yè)的AI推理集群,GPU平均利用率也長期低于40%;大量中小企業(yè)的GPU集群利用率甚至不足15%。

這意味著什么?

意味著今天最昂貴的AI資源,正在被大規(guī)模浪費(fèi)。不是因?yàn)镚PU性能不行,而是因?yàn)閿?shù)據(jù)流動(dòng)、任務(wù)調(diào)度、內(nèi)存管理、I/O協(xié)同、網(wǎng)絡(luò)處理這些系統(tǒng)環(huán)節(jié)跟不上。換句話說,GPU算得很快,但系統(tǒng)供給不上,結(jié)果就是一邊拼命買卡,一邊大面積閑置。

這也是為什么CPU的重要性,不是“多賣一點(diǎn)服務(wù)器芯片”那么簡單,而是它直接決定AI系統(tǒng)的資源利用率和ROI。

因?yàn)樵谡鎸?shí)工作流里,GPU從來不是單獨(dú)工作的。它前面有數(shù)據(jù)準(zhǔn)備,后面有結(jié)果處理,中間有任務(wù)調(diào)度、緩存維護(hù)、上下文切換、網(wǎng)絡(luò)通信、容器管理、數(shù)據(jù)庫交互。這些環(huán)節(jié)里,真正承擔(dān)控制流和系統(tǒng)協(xié)同的,主要是CPU。

所以問題的本質(zhì)不是“CPU能不能替代GPU”,而是如果CPU和系統(tǒng)層能力跟不上,再強(qiáng)的GPU也只是昂貴的閑置資產(chǎn)。


智能體興起,讓CPU從“底座”變成“中樞”

如果說推理階段讓CPU重新重要,那么智能體(Agent)的興起,則把這種重要性進(jìn)一步放大。

因?yàn)橹悄荏w不是一個(gè)“更會(huì)聊天”的模型,而是一套真正要執(zhí)行任務(wù)的系統(tǒng)。它要理解目標(biāo)、拆解步驟、調(diào)用工具、訪問數(shù)據(jù)庫、連接API、執(zhí)行代碼、維護(hù)狀態(tài)、判斷結(jié)果,必要時(shí)還要調(diào)用其他模型或子Agent協(xié)同。

在這條鏈路中,模型推理只是其中一環(huán)。大量工作并不是“算”,而是“調(diào)度”“編排”“切換”“訪問”“管理”。這些工作本質(zhì)上都屬于控制流和系統(tǒng)協(xié)同,而這正是CPU最擅長的領(lǐng)域。

康奈爾大學(xué)的研究顯示,在五類代表性Agent工作負(fù)載中,CPU端的工具處理、邏輯調(diào)度和數(shù)據(jù)預(yù)處理,占總端到端延遲的比例高達(dá)43.8%到90.6%。在典型的RAG場景中,CPU處理甚至可能占到總延遲的90%以上,GPU推理反而不到10%。

這組數(shù)據(jù)的意義非常明確:在智能體時(shí)代,很多真實(shí)任務(wù)的瓶頸已經(jīng)不是GPU算得夠不夠快,而是CPU能不能把整條任務(wù)鏈順暢地跑完。

這也解釋了為什么CPU/GPU配比正在變化。TrendForce指出,當(dāng)前AI數(shù)據(jù)中心中CPU與GPU的配比大約是1:4到1:8,而在智能體AI時(shí)代,這一比例預(yù)計(jì)將逐步演變?yōu)?:1到1:2。當(dāng)配比從1:8向1:1收斂,本質(zhì)上不是CPU多賣了幾顆,而是AI基礎(chǔ)設(shè)施從“計(jì)算中心化”轉(zhuǎn)向“系統(tǒng)中心化”。

產(chǎn)業(yè)反饋已經(jīng)開始出現(xiàn)。2026年第一季度末,Intel和AMD都對(duì)部分CPU產(chǎn)品線提價(jià),服務(wù)器CPU交期拉長至約6個(gè)月。與此同時(shí),英偉達(dá)和Arm也在同一時(shí)期宣布進(jìn)軍服務(wù)器CPU市場。

一個(gè)是GPU巨頭,一個(gè)是IP授權(quán)商,卻在同一時(shí)間加碼CPU,這說明他們看到的是同一個(gè)趨勢:未來AI的關(guān)鍵戰(zhàn)場,不只是模型推理本身,而是圍繞推理和智能體展開的整機(jī)系統(tǒng)能力。

當(dāng)所有頭部玩家都在補(bǔ)CPU,說明競爭已經(jīng)從“單芯片”變成“系統(tǒng)工程”。過去兩年,AI行業(yè)有一種很強(qiáng)的“單點(diǎn)崇拜”:比誰的芯片更強(qiáng),比誰的參數(shù)更多,比誰的集群更大。這種競爭方式在產(chǎn)業(yè)早期成立,因?yàn)榧夹g(shù)突破往往首先來自少數(shù)明星環(huán)節(jié)。

但產(chǎn)業(yè)一旦進(jìn)入落地階段,決定勝負(fù)的邏輯就會(huì)改變。真正拉開差距的,不再只是某個(gè)單點(diǎn)性能,而是整套系統(tǒng)能否以可控成本、可復(fù)制方式持續(xù)運(yùn)行。

所以今天我們看到的,不只是英特爾受益,而是所有重要玩家都在重新補(bǔ)CPU、補(bǔ)系統(tǒng)、補(bǔ)整機(jī)能力。英特爾希望依托數(shù)據(jù)中心生態(tài)和軟件兼容,重新鞏固系統(tǒng)層話語權(quán);AMD則在服務(wù)器CPU市場持續(xù)擴(kuò)大份額,Mercury Research數(shù)據(jù)顯示,AMD EPYC服務(wù)器CPU在2025年Q4營收份額已達(dá)到41.3%,首次突破40%。

Arm和云廠商自研CPU,則試圖從高能效和定制化切入系統(tǒng)入口;甚至連英偉達(dá)自己,也在通過Grace CPU強(qiáng)化對(duì)整機(jī)架構(gòu)的控制力。所有頂級(jí)玩家都在補(bǔ)CPU,不是因?yàn)镃PU突然變得性感,而是因?yàn)锳I開始從芯片問題,變成系統(tǒng)問題。

如果把視角拉回中國,這輪變化的現(xiàn)實(shí)意義更大。中國是全球AI應(yīng)用落地最快的市場之一。截至2026年3月,我國日均Token調(diào)用量已突破140萬億;IDC數(shù)據(jù)顯示,2025年中國AI加速卡總出貨約400萬張,其中國產(chǎn)廠商出貨165萬張,占比41%。

這說明,中國AI已經(jīng)不再只是“模型熱”“算力熱”,而是進(jìn)入了真正的“調(diào)用熱”和“部署熱”。這會(huì)把中國企業(yè)推向一個(gè)更現(xiàn)實(shí)的問題:AI不是能不能做,而是做了之后能不能長期跑、能不能算得過來。

第一,是成本壓力。

某制造企業(yè)在將智能體接入生產(chǎn)線時(shí)發(fā)現(xiàn),每個(gè)決策步驟的推理成本高達(dá)0.3美元,是傳統(tǒng)規(guī)則系統(tǒng)的20倍。這類案例真正說明的,不是智能體太貴,而是:如果系統(tǒng)架構(gòu)不優(yōu)化,AI很容易從生產(chǎn)力工具變成成本黑洞。

第二,是兼容壓力。

中國企業(yè)現(xiàn)有IT系統(tǒng)復(fù)雜,數(shù)據(jù)庫、ERP、CRM、OA、工業(yè)系統(tǒng)長期并存。AI如果要真正進(jìn)入業(yè)務(wù)流程,必須與這些存量系統(tǒng)深度融合。這意味著企業(yè)需要的不是單一“最強(qiáng)模型”,而是一套能把模型、數(shù)據(jù)庫、API和業(yè)務(wù)系統(tǒng)串起來的基礎(chǔ)設(shè)施,而CPU承擔(dān)的正是兼容、調(diào)度和運(yùn)行時(shí)支撐角色。

第三,是自主可控。

隨著AI部署深化,國產(chǎn)CPU、服務(wù)器、操作系統(tǒng)、數(shù)據(jù)庫、中間件和調(diào)度軟件,都會(huì)被重新放到更靠前的位置。也就是說,CPU重新重要,不只是國際巨頭的機(jī)會(huì),也可能成為中國基礎(chǔ)設(shè)施產(chǎn)業(yè)鏈的一次再估值窗口。

所以,如果把視角再拉長一點(diǎn),就會(huì)發(fā)現(xiàn),CPU在AI中的重新重要,其實(shí)只是表象。更深層被重新定價(jià)的,是系統(tǒng)能力。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4855067.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
「深度」阿聯(lián)酋退群,全球石油治理體系面臨重構(gòu)

「深度」阿聯(lián)酋退群,全球石油治理體系面臨重構(gòu)

界面新聞
2026-04-30 08:31:06
剛辦完離婚手續(xù),火速出售公婆住我的陪嫁房,旅游回來的婆婆家沒了

剛辦完離婚手續(xù),火速出售公婆住我的陪嫁房,旅游回來的婆婆家沒了

麥子情感故事
2026-04-30 00:28:15
吳宜澤與馬克·艾倫的首階段比賽將在5月1日凌晨2點(diǎn)進(jìn)行

吳宜澤與馬克·艾倫的首階段比賽將在5月1日凌晨2點(diǎn)進(jìn)行

環(huán)球體壇啄木鳥
2026-04-30 17:17:44
嫁富二代明星后,她住進(jìn)北京豪宅,開勞斯萊斯,如今40歲又懷3胎

嫁富二代明星后,她住進(jìn)北京豪宅,開勞斯萊斯,如今40歲又懷3胎

不似少年游
2026-04-10 22:23:54
才陷性交爭議!9頭身女神遭傳「已婚生子」真實(shí)近況曝光

才陷性交爭議!9頭身女神遭傳「已婚生子」真實(shí)近況曝光

ETtoday星光云
2026-04-29 17:28:09
這才是真正的高人(非常經(jīng)典)

這才是真正的高人(非常經(jīng)典)

尚曦讀史
2026-04-13 08:30:06
2000億公司史詩級(jí)大跌,咋解釋?

2000億公司史詩級(jí)大跌,咋解釋?

大貓財(cái)經(jīng)Pro
2026-04-30 15:43:49
別再傻扔過期藥了!這6種常備藥養(yǎng)花堪比神藥,植物吃了狂長爆盆

別再傻扔過期藥了!這6種常備藥養(yǎng)花堪比神藥,植物吃了狂長爆盆

復(fù)轉(zhuǎn)這些年
2026-03-23 20:20:36
華野最“特殊”縱隊(duì),粟裕僅用一次就上癮,劉鄧借走后更愛不釋手

華野最“特殊”縱隊(duì),粟裕僅用一次就上癮,劉鄧借走后更愛不釋手

浩渺青史
2026-05-01 01:07:38
“老師最煩這種現(xiàn)眼包家長”,寶媽穿緊身裙參加運(yùn)動(dòng)會(huì),被嘲

“老師最煩這種現(xiàn)眼包家長”,寶媽穿緊身裙參加運(yùn)動(dòng)會(huì),被嘲

蝴蝶花雨話教育
2026-04-02 10:30:13
國米右翼衛(wèi)三選二留隊(duì)?迪烏夫改踢邊路,與留下何馬邏輯一致!

國米右翼衛(wèi)三選二留隊(duì)?迪烏夫改踢邊路,與留下何馬邏輯一致!

肥強(qiáng)侃球
2026-04-30 23:34:25
國臺(tái)辦回應(yīng)鄭麗文訪美,“尊重,但不理解”

國臺(tái)辦回應(yīng)鄭麗文訪美,“尊重,但不理解”

簡單的視角
2026-04-29 15:25:37
媽媽穿秀禾出席兒子婚禮,前后換了3套禮服,網(wǎng)友:新娘要吃苦了

媽媽穿秀禾出席兒子婚禮,前后換了3套禮服,網(wǎng)友:新娘要吃苦了

觀察鑒娛
2026-04-28 10:00:37
北京上空出現(xiàn)七彩祥云,專家:建議戴墨鏡觀察,或與火箭導(dǎo)彈發(fā)射時(shí)的尾跡有關(guān)

北京上空出現(xiàn)七彩祥云,專家:建議戴墨鏡觀察,或與火箭導(dǎo)彈發(fā)射時(shí)的尾跡有關(guān)

極目新聞
2026-04-28 20:29:16
1980年,一位開國上將病逝后無人吊唁,戰(zhàn)友們透露:這是他應(yīng)得的

1980年,一位開國上將病逝后無人吊唁,戰(zhàn)友們透露:這是他應(yīng)得的

興趣知識(shí)
2026-05-01 00:52:07
陳鳳馨質(zhì)疑一語成讖?馬英九再表態(tài),邱毅蔡正元密集發(fā)聲

陳鳳馨質(zhì)疑一語成讖?馬英九再表態(tài),邱毅蔡正元密集發(fā)聲

大統(tǒng)一
2026-04-29 20:51:37
我國首位女航天員劉洋,結(jié)婚8年未生子,臨行前給丈夫留下2條遺言

我國首位女航天員劉洋,結(jié)婚8年未生子,臨行前給丈夫留下2條遺言

霽寒飄雪
2026-04-01 07:40:42
勞動(dòng)性所得統(tǒng)一征稅!國家新明確:未來五年,稅收將迎來8大變化

勞動(dòng)性所得統(tǒng)一征稅!國家新明確:未來五年,稅收將迎來8大變化

學(xué)稅
2024-07-23 15:25:30
從20萬到16億,一個(gè)普通散戶的“笨辦法”投資傳奇

從20萬到16億,一個(gè)普通散戶的“笨辦法”投資傳奇

流蘇晚晴
2026-04-20 20:13:29
武漢司門口黃鶴樓地鐵站“新紅墻”來了:抬升7米,拉長至40米,優(yōu)化同框視角

武漢司門口黃鶴樓地鐵站“新紅墻”來了:抬升7米,拉長至40米,優(yōu)化同框視角

極目新聞
2026-04-30 19:25:18
2026-05-01 03:16:49
虎嗅APP incentive-icons
虎嗅APP
個(gè)性化商業(yè)資訊與觀點(diǎn)交流平臺(tái)
26233文章數(shù) 687703關(guān)注度
往期回顧 全部

科技要聞

9000億美元估值,Anthropic即將反超OpenAI

頭條要聞

英國國王給特朗普送了口鐘 還貼臉開大"有需要盡管敲"

頭條要聞

英國國王給特朗普送了口鐘 還貼臉開大"有需要盡管敲"

體育要聞

季后賽場均5.4分,他憑啥在騎士打首發(fā)?

娛樂要聞

孫楊博士學(xué)歷有問題?官方含糊其辭

財(cái)經(jīng)要聞

易會(huì)滿被“雙開”!

汽車要聞

專訪捷途汪如生:捷途雙線作戰(zhàn) 全球化全面落地

態(tài)度原創(chuàng)

藝術(shù)
教育
健康
本地
手機(jī)

藝術(shù)要聞

耗資21億的故宮北院,網(wǎng)友看后直搖頭:怎么撞臉高鐵站了?

教育要聞

高考地理中的數(shù)字文旅

干細(xì)胞治燒燙傷面臨這些“瓶頸”

本地新聞

用青花瓷的方式,打開西溪濕地

手機(jī)要聞

華碩創(chuàng)X 2026驍龍X2 Elite二合一創(chuàng)作本上架,12999元

無障礙瀏覽 進(jìn)入關(guān)懷版