国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

GPU神話松動(dòng),AI真正的戰(zhàn)場變了

0
分享至


出品 | 妙投APP

作者 | 張博

編輯 | 丁萍

頭圖 | AI生圖


過去兩年,AI產(chǎn)業(yè)最強(qiáng)的敘事幾乎都圍繞GPU展開。

從OpenAI掀起大模型浪潮,到英偉達(dá)市值飆升,再到云廠商、互聯(lián)網(wǎng)平臺(tái)和創(chuàng)業(yè)公司爭搶高端算力,GPU被塑造成AI時(shí)代最稀缺的“硬通貨”。誰擁有更多GPU,誰就更接近模型能力上限,誰能搭起更大訓(xùn)練集群,誰就更像拿到了下一代AI的門票。

在這套敘事中,CPU沒有消失,但明顯退居幕后。它仍然是服務(wù)器的基礎(chǔ)部件,是操作系統(tǒng)、數(shù)據(jù)庫、網(wǎng)絡(luò)和應(yīng)用運(yùn)行的底座,卻不再是AI故事里的主角。市場甚至形成了一種近乎默認(rèn)的判斷:AI時(shí)代,GPU吃肉,CPU喝湯。

但到2026年,這個(gè)判斷已經(jīng)不夠用了。因?yàn)锳I產(chǎn)業(yè)正在發(fā)生一個(gè)更深層的變化:主戰(zhàn)場正從訓(xùn)練競賽,轉(zhuǎn)向部署競賽;價(jià)值重心正從峰值算力,轉(zhuǎn)向系統(tǒng)效率。

這意味著,真正決定AI商業(yè)化速度的,不再只是GPU能把模型訓(xùn)得多大、多快,而是整套系統(tǒng)能否以可控成本、穩(wěn)定吞吐和高利用率,把模型真正跑起來、用起來、賺到錢。

一旦競爭從“單卡性能”轉(zhuǎn)向“端到端效率”,CPU就不再只是配角,而是AI基礎(chǔ)設(shè)施里那個(gè)被長期低估的系統(tǒng)變量。

市場為何重新看英特爾?

不只是因?yàn)樨?cái)報(bào),而是因?yàn)樾枨蠼Y(jié)構(gòu)變了。

最近一個(gè)值得注意的信號(hào),是英特爾重新獲得資本市場關(guān)注。2026年第一季度,英特爾營收約為136億美元,同比增長7%,連續(xù)第六個(gè)季度超預(yù)期;凈利潤同比增長156%。其中,數(shù)據(jù)中心與AI相關(guān)業(yè)務(wù)(DCAI)收入達(dá)到約51億美元,同比增長22%,成為增長最快的板塊。財(cái)報(bào)發(fā)布后,英特爾股價(jià)盤后最高上漲超40%(截至4月30日)。

如果只看公司層面,這當(dāng)然不足以說明英特爾已經(jīng)徹底翻身。它仍面臨制程追趕、服務(wù)器CPU份額承壓、Arm滲透、云廠商自研芯片推進(jìn)等問題。但市場還是給了它新的想象空間,原因不在于英特爾突然變成AI明星,而在于投資人開始意識(shí)到:AI基礎(chǔ)設(shè)施的需求結(jié)構(gòu),已經(jīng)不再只是“多買GPU”。

英特爾管理層在財(cái)報(bào)會(huì)上透露,數(shù)據(jù)中心中CPU與GPU的部署比例,正從傳統(tǒng)的1:8收緊到1:4,在智能體場景中甚至可能進(jìn)一步向1:1靠近。

這背后的含義非常明確:過去兩年AI行業(yè)最核心的矛盾是訓(xùn)練能力不足,而今天越來越多企業(yè)開始面對另一組問題,模型訓(xùn)練完之后,如何推理、如何部署、如何擴(kuò)展、如何控制成本。

也就是說,資本市場重新定價(jià)的,不只是英特爾,而是一個(gè)更深層的事實(shí):AI開始進(jìn)入系統(tǒng)競爭階段。

CPU的重要性從何而來?

先要回答另一個(gè)問題:為什么AI今天的核心矛盾,已經(jīng)不再只是訓(xùn)練。因?yàn)橛?xùn)練雖然貴,但對大多數(shù)企業(yè)來說,它更多是階段性的資本開支;而推理、部署和調(diào)用,才是持續(xù)性的運(yùn)營開支。

訓(xùn)練決定模型能不能做出來,推理決定模型能不能活下去。這一變化已經(jīng)有明確的數(shù)據(jù)支撐。

Deloitte估算,推理工作負(fù)載占AI總算力的比例在2023年約為1/3,2025年接近1/2,到2026年預(yù)計(jì)達(dá)到2/3。IDC預(yù)測,到2027年中國推理算力占整體算力比例將突破70%。另有研究預(yù)計(jì),到2026年推理帶來的市場規(guī)模將是訓(xùn)練硬件市場的2到3倍。這些數(shù)字共同說明一件事:AI的成本中心和價(jià)值中心,正在從“訓(xùn)練一次”轉(zhuǎn)向“運(yùn)行無數(shù)次”。

鄭緯民院士給過一個(gè)更直白的拆分:在大模型推理成本中,人力僅占3%,數(shù)據(jù)占2%,算力占到95%。他舉例稱,ChatGPT的推理開銷每天約70萬美元,DeepSeek V3每天約8.7萬美元(按各自披露口徑)。

這組數(shù)據(jù)真正說明的,不是“推理也很貴”,而是一旦AI進(jìn)入大規(guī)模使用階段,真正吞噬利潤的不是訓(xùn)練賬,而是推理賬。國家數(shù)據(jù)局的數(shù)據(jù)進(jìn)一步放大了這種壓力:中國日均Token調(diào)用量從2024年初約1000億,躍升至2026年3月的140萬億,兩年增長超千倍。

如果說訓(xùn)練是一次性把錢砸進(jìn)去,那么推理就是每天都在把錢燒出去。訓(xùn)練貴,是研發(fā)問題;推理貴,是利潤問題。而一旦問題變成利潤問題,企業(yè)就不可能再只盯著模型參數(shù)和GPU數(shù)量,而必須開始追問:

GPU是不是被充分利用了?哪些任務(wù)必須用GPU?哪些其實(shí)應(yīng)該交給CPU?整套系統(tǒng)的吞吐率和資源利用率到底高不高?

這正是CPU重新變重要的起點(diǎn)。

很多人理解AI基礎(chǔ)設(shè)施,還停留在“GPU越多越好”的階段。但現(xiàn)實(shí)是,今天大量AI系統(tǒng)面臨的核心問題,不是GPU不夠強(qiáng),而是系統(tǒng)喂不飽GPU。

MLPerf行業(yè)基準(zhǔn)測試顯示,在大模型訓(xùn)練場景中,數(shù)據(jù)加載、預(yù)處理、參數(shù)同步等環(huán)節(jié)帶來的延遲,可占總訓(xùn)練時(shí)間的35%到60%。IDC調(diào)研則顯示,即使是頭部互聯(lián)網(wǎng)企業(yè)的AI推理集群,GPU平均利用率也長期低于40%;大量中小企業(yè)的GPU集群利用率甚至不足15%。

這意味著什么?

意味著今天最昂貴的AI資源,正在被大規(guī)模浪費(fèi)。不是因?yàn)镚PU性能不行,而是因?yàn)閿?shù)據(jù)流動(dòng)、任務(wù)調(diào)度、內(nèi)存管理、I/O協(xié)同、網(wǎng)絡(luò)處理這些系統(tǒng)環(huán)節(jié)跟不上。換句話說,GPU算得很快,但系統(tǒng)供給不上,結(jié)果就是一邊拼命買卡,一邊大面積閑置。

這也是為什么CPU的重要性,不是“多賣一點(diǎn)服務(wù)器芯片”那么簡單,而是它直接決定AI系統(tǒng)的資源利用率和ROI。

因?yàn)樵谡鎸?shí)工作流里,GPU從來不是單獨(dú)工作的。它前面有數(shù)據(jù)準(zhǔn)備,后面有結(jié)果處理,中間有任務(wù)調(diào)度、緩存維護(hù)、上下文切換、網(wǎng)絡(luò)通信、容器管理、數(shù)據(jù)庫交互。這些環(huán)節(jié)里,真正承擔(dān)控制流和系統(tǒng)協(xié)同的,主要是CPU。

所以問題的本質(zhì)不是“CPU能不能替代GPU”,而是如果CPU和系統(tǒng)層能力跟不上,再強(qiáng)的GPU也只是昂貴的閑置資產(chǎn)。


智能體興起,讓CPU從“底座”變成“中樞”

如果說推理階段讓CPU重新重要,那么智能體(Agent)的興起,則把這種重要性進(jìn)一步放大。

因?yàn)橹悄荏w不是一個(gè)“更會(huì)聊天”的模型,而是一套真正要執(zhí)行任務(wù)的系統(tǒng)。它要理解目標(biāo)、拆解步驟、調(diào)用工具、訪問數(shù)據(jù)庫、連接API、執(zhí)行代碼、維護(hù)狀態(tài)、判斷結(jié)果,必要時(shí)還要調(diào)用其他模型或子Agent協(xié)同。

在這條鏈路中,模型推理只是其中一環(huán)。大量工作并不是“算”,而是“調(diào)度”“編排”“切換”“訪問”“管理”。這些工作本質(zhì)上都屬于控制流和系統(tǒng)協(xié)同,而這正是CPU最擅長的領(lǐng)域。

康奈爾大學(xué)的研究顯示,在五類代表性Agent工作負(fù)載中,CPU端的工具處理、邏輯調(diào)度和數(shù)據(jù)預(yù)處理,占總端到端延遲的比例高達(dá)43.8%到90.6%。在典型的RAG場景中,CPU處理甚至可能占到總延遲的90%以上,GPU推理反而不到10%。

這組數(shù)據(jù)的意義非常明確:在智能體時(shí)代,很多真實(shí)任務(wù)的瓶頸已經(jīng)不是GPU算得夠不夠快,而是CPU能不能把整條任務(wù)鏈順暢地跑完。

這也解釋了為什么CPU/GPU配比正在變化。TrendForce指出,當(dāng)前AI數(shù)據(jù)中心中CPU與GPU的配比大約是1:4到1:8,而在智能體AI時(shí)代,這一比例預(yù)計(jì)將逐步演變?yōu)?:1到1:2。當(dāng)配比從1:8向1:1收斂,本質(zhì)上不是CPU多賣了幾顆,而是AI基礎(chǔ)設(shè)施從“計(jì)算中心化”轉(zhuǎn)向“系統(tǒng)中心化”。

產(chǎn)業(yè)反饋已經(jīng)開始出現(xiàn)。2026年第一季度末,Intel和AMD都對部分CPU產(chǎn)品線提價(jià),服務(wù)器CPU交期拉長至約6個(gè)月。與此同時(shí),英偉達(dá)和Arm也在同一時(shí)期宣布進(jìn)軍服務(wù)器CPU市場。

一個(gè)是GPU巨頭,一個(gè)是IP授權(quán)商,卻在同一時(shí)間加碼CPU,這說明他們看到的是同一個(gè)趨勢:未來AI的關(guān)鍵戰(zhàn)場,不只是模型推理本身,而是圍繞推理和智能體展開的整機(jī)系統(tǒng)能力。

當(dāng)所有頭部玩家都在補(bǔ)CPU,說明競爭已經(jīng)從“單芯片”變成“系統(tǒng)工程”。過去兩年,AI行業(yè)有一種很強(qiáng)的“單點(diǎn)崇拜”:比誰的芯片更強(qiáng),比誰的參數(shù)更多,比誰的集群更大。這種競爭方式在產(chǎn)業(yè)早期成立,因?yàn)榧夹g(shù)突破往往首先來自少數(shù)明星環(huán)節(jié)。

但產(chǎn)業(yè)一旦進(jìn)入落地階段,決定勝負(fù)的邏輯就會(huì)改變。真正拉開差距的,不再只是某個(gè)單點(diǎn)性能,而是整套系統(tǒng)能否以可控成本、可復(fù)制方式持續(xù)運(yùn)行。

所以今天我們看到的,不只是英特爾受益,而是所有重要玩家都在重新補(bǔ)CPU、補(bǔ)系統(tǒng)、補(bǔ)整機(jī)能力。英特爾希望依托數(shù)據(jù)中心生態(tài)和軟件兼容,重新鞏固系統(tǒng)層話語權(quán);AMD則在服務(wù)器CPU市場持續(xù)擴(kuò)大份額,Mercury Research數(shù)據(jù)顯示,AMD EPYC服務(wù)器CPU在2025年Q4營收份額已達(dá)到41.3%,首次突破40%。

Arm和云廠商自研CPU,則試圖從高能效和定制化切入系統(tǒng)入口;甚至連英偉達(dá)自己,也在通過Grace CPU強(qiáng)化對整機(jī)架構(gòu)的控制力。所有頂級(jí)玩家都在補(bǔ)CPU,不是因?yàn)镃PU突然變得性感,而是因?yàn)锳I開始從芯片問題,變成系統(tǒng)問題。

如果把視角拉回中國,這輪變化的現(xiàn)實(shí)意義更大。中國是全球AI應(yīng)用落地最快的市場之一。截至2026年3月,我國日均Token調(diào)用量已突破140萬億;IDC數(shù)據(jù)顯示,2025年中國AI加速卡總出貨約400萬張,其中國產(chǎn)廠商出貨165萬張,占比41%。

這說明,中國AI已經(jīng)不再只是“模型熱”“算力熱”,而是進(jìn)入了真正的“調(diào)用熱”和“部署熱”。這會(huì)把中國企業(yè)推向一個(gè)更現(xiàn)實(shí)的問題:AI不是能不能做,而是做了之后能不能長期跑、能不能算得過來。

第一,是成本壓力。

某制造企業(yè)在將智能體接入生產(chǎn)線時(shí)發(fā)現(xiàn),每個(gè)決策步驟的推理成本高達(dá)0.3美元,是傳統(tǒng)規(guī)則系統(tǒng)的20倍。這類案例真正說明的,不是智能體太貴,而是:如果系統(tǒng)架構(gòu)不優(yōu)化,AI很容易從生產(chǎn)力工具變成成本黑洞。

第二,是兼容壓力。

中國企業(yè)現(xiàn)有IT系統(tǒng)復(fù)雜,數(shù)據(jù)庫、ERP、CRM、OA、工業(yè)系統(tǒng)長期并存。AI如果要真正進(jìn)入業(yè)務(wù)流程,必須與這些存量系統(tǒng)深度融合。這意味著企業(yè)需要的不是單一“最強(qiáng)模型”,而是一套能把模型、數(shù)據(jù)庫、API和業(yè)務(wù)系統(tǒng)串起來的基礎(chǔ)設(shè)施,而CPU承擔(dān)的正是兼容、調(diào)度和運(yùn)行時(shí)支撐角色。

第三,是自主可控。

隨著AI部署深化,國產(chǎn)CPU、服務(wù)器、操作系統(tǒng)、數(shù)據(jù)庫、中間件和調(diào)度軟件,都會(huì)被重新放到更靠前的位置。也就是說,CPU重新重要,不只是國際巨頭的機(jī)會(huì),也可能成為中國基礎(chǔ)設(shè)施產(chǎn)業(yè)鏈的一次再估值窗口。

所以,如果把視角再拉長一點(diǎn),就會(huì)發(fā)現(xiàn),CPU在AI中的重新重要,其實(shí)只是表象。更深層被重新定價(jià)的,是系統(tǒng)能力。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4855067.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
消息人士:如果西蒙尼本賽季帶隊(duì)贏下歐冠,他可能會(huì)離開馬競

消息人士:如果西蒙尼本賽季帶隊(duì)贏下歐冠,他可能會(huì)離開馬競

懂球帝
2026-04-30 21:40:21
毛主席警衛(wèi)員講述:想進(jìn)中南海見毛主席,只有3個(gè)人可以自由通行

毛主席警衛(wèi)員講述:想進(jìn)中南海見毛主席,只有3個(gè)人可以自由通行

曉張說
2026-04-30 22:00:04
外交部:昂山素季女士是中國的老朋友,我們一直關(guān)心她的情況

外交部:昂山素季女士是中國的老朋友,我們一直關(guān)心她的情況

新京報(bào)
2026-04-30 16:42:11
男人到了中年,只對性感興趣嗎?

男人到了中年,只對性感興趣嗎?

那年秋天
2026-04-24 17:40:03
“手術(shù)必須100%成功,不接受任何意外”這句話說完,三甲醫(yī)院主任霸氣回懟:不擔(dān)風(fēng)險(xiǎn),手術(shù)暫停!

“手術(shù)必須100%成功,不接受任何意外”這句話說完,三甲醫(yī)院主任霸氣回懟:不擔(dān)風(fēng)險(xiǎn),手術(shù)暫停!

醫(yī)護(hù)健康科普
2026-04-29 17:16:58
統(tǒng)一大局已定,臺(tái)灣回歸后,馬英九與洪秀柱誰更適合當(dāng)臺(tái)灣省長?

統(tǒng)一大局已定,臺(tái)灣回歸后,馬英九與洪秀柱誰更適合當(dāng)臺(tái)灣省長?

三石記
2026-04-30 09:20:18
iPhone系統(tǒng)垃圾一鍵清理,26G變8G,告別卡頓超耐用

iPhone系統(tǒng)垃圾一鍵清理,26G變8G,告別卡頓超耐用

小柱解說游戲
2026-04-28 16:31:31
云南一方丈意外身亡,整理遺物銀行卡有498萬,方丈女兒提出繼承,寺廟拒絕:出家人,這筆錢屬于寺廟!

云南一方丈意外身亡,整理遺物銀行卡有498萬,方丈女兒提出繼承,寺廟拒絕:出家人,這筆錢屬于寺廟!

大愛三湘
2026-04-28 19:39:12
96年女生在遠(yuǎn)洋貨輪當(dāng)大副月入6.8萬元:最長出海18個(gè)月,即便生理期也要做好自己的工作,需要面對生理和心理的雙重挑戰(zhàn)

96年女生在遠(yuǎn)洋貨輪當(dāng)大副月入6.8萬元:最長出海18個(gè)月,即便生理期也要做好自己的工作,需要面對生理和心理的雙重挑戰(zhàn)

大風(fēng)新聞
2026-04-30 09:40:04
霍啟山捧場楊受成長子夜店,倆闊少把酒言歡,58歲楊其龍樣子滄桑

霍啟山捧場楊受成長子夜店,倆闊少把酒言歡,58歲楊其龍樣子滄桑

樹娃
2026-04-30 14:14:16
美國防部稱伊朗戰(zhàn)事已耗資250億美元,美防長赫格塞思自這場戰(zhàn)事開始以來首次接受國會(huì)質(zhì)詢

美國防部稱伊朗戰(zhàn)事已耗資250億美元,美防長赫格塞思自這場戰(zhàn)事開始以來首次接受國會(huì)質(zhì)詢

每日經(jīng)濟(jì)新聞
2026-04-30 10:11:22
跟車媒一個(gè)級(jí)別了,爆料:特斯拉員工試用 FSD v14.2 版,違法保密政策要 500 萬!

跟車媒一個(gè)級(jí)別了,爆料:特斯拉員工試用 FSD v14.2 版,違法保密政策要 500 萬!

新浪財(cái)經(jīng)
2026-04-30 10:28:49
央八40集《奉陪到底》炸裂預(yù)告:好兄弟變死對頭,比《狂飆》還狂

央八40集《奉陪到底》炸裂預(yù)告:好兄弟變死對頭,比《狂飆》還狂

情感大頭說說
2026-04-30 17:20:13
21萬億!全球最大芯片公司誕生,實(shí)力堪比三倍臺(tái)積電

21萬億!全球最大芯片公司誕生,實(shí)力堪比三倍臺(tái)積電

你是我心中最美星空
2026-03-13 21:00:36
CBA男籃最新動(dòng)態(tài)!遼寧男籃vs山東男籃,賽前帶來遼寧男籃趙繼偉、付豪、莫蘭德以及山東男籃高詩巖最新消息

CBA男籃最新動(dòng)態(tài)!遼寧男籃vs山東男籃,賽前帶來遼寧男籃趙繼偉、付豪、莫蘭德以及山東男籃高詩巖最新消息

凱豐侃球
2026-05-01 00:12:04
俄媒曾放言:中國海軍最多10年,最快7年,等美軍自己讓出制海權(quán)

俄媒曾放言:中國海軍最多10年,最快7年,等美軍自己讓出制海權(quán)

春序娛樂
2026-04-28 01:20:30
克羅斯:不認(rèn)為巴黎拜仁次回合會(huì)有戰(zhàn)術(shù)調(diào)整,雙方防線并不差

克羅斯:不認(rèn)為巴黎拜仁次回合會(huì)有戰(zhàn)術(shù)調(diào)整,雙方防線并不差

懂球帝
2026-05-01 00:19:24
特朗普曝光伊朗?;饤l件,伊朗60億美元原油遭美軍封鎖,數(shù)據(jù)顯示:收益比戰(zhàn)前多四成

特朗普曝光伊朗?;饤l件,伊朗60億美元原油遭美軍封鎖,數(shù)據(jù)顯示:收益比戰(zhàn)前多四成

紅星新聞
2026-04-30 14:10:10
A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

夜深愛雜談
2026-04-30 21:22:37
國鐵集團(tuán)發(fā)布火車票候補(bǔ)購票十問十答

國鐵集團(tuán)發(fā)布火車票候補(bǔ)購票十問十答

界面新聞
2026-04-29 21:26:54
2026-05-01 03:08:49
虎嗅APP incentive-icons
虎嗅APP
個(gè)性化商業(yè)資訊與觀點(diǎn)交流平臺(tái)
26233文章數(shù) 687703關(guān)注度
往期回顧 全部

科技要聞

9000億美元估值,Anthropic即將反超OpenAI

頭條要聞

英國國王給特朗普送了口鐘 還貼臉開大"有需要盡管敲"

頭條要聞

英國國王給特朗普送了口鐘 還貼臉開大"有需要盡管敲"

體育要聞

季后賽場均5.4分,他憑啥在騎士打首發(fā)?

娛樂要聞

孫楊博士學(xué)歷有問題?官方含糊其辭

財(cái)經(jīng)要聞

易會(huì)滿被“雙開”!

汽車要聞

專訪捷途汪如生:捷途雙線作戰(zhàn) 全球化全面落地

態(tài)度原創(chuàng)

手機(jī)
教育
數(shù)碼
旅游
軍事航空

手機(jī)要聞

華碩創(chuàng)X 2026驍龍X2 Elite二合一創(chuàng)作本上架,12999元

教育要聞

高考地理中的數(shù)字文旅

數(shù)碼要聞

機(jī)械革命耀世18 Pro游戲本270HX Plus + 5070 12GB,10499元

旅游要聞

上海旅游業(yè)者“踩線團(tuán)”赴金門交流,金門考察團(tuán)同日抵廈

軍事要聞

意大利議會(huì)批準(zhǔn):捐贈(zèng)航母給印度尼西亞

無障礙瀏覽 進(jìn)入關(guān)懷版