国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPU神話松動,AI真正的戰(zhàn)場變了

0
分享至


出品 | 妙投APP

作者 | 張博

編輯 | 丁萍

頭圖 | AI生圖


過去兩年,AI產(chǎn)業(yè)最強的敘事幾乎都圍繞GPU展開。

從OpenAI掀起大模型浪潮,到英偉達市值飆升,再到云廠商、互聯(lián)網(wǎng)平臺和創(chuàng)業(yè)公司爭搶高端算力,GPU被塑造成AI時代最稀缺的“硬通貨”。誰擁有更多GPU,誰就更接近模型能力上限,誰能搭起更大訓練集群,誰就更像拿到了下一代AI的門票。

在這套敘事中,CPU沒有消失,但明顯退居幕后。它仍然是服務器的基礎部件,是操作系統(tǒng)、數(shù)據(jù)庫、網(wǎng)絡和應用運行的底座,卻不再是AI故事里的主角。市場甚至形成了一種近乎默認的判斷:AI時代,GPU吃肉,CPU喝湯。

但到2026年,這個判斷已經(jīng)不夠用了。因為AI產(chǎn)業(yè)正在發(fā)生一個更深層的變化:主戰(zhàn)場正從訓練競賽,轉(zhuǎn)向部署競賽;價值重心正從峰值算力,轉(zhuǎn)向系統(tǒng)效率。

這意味著,真正決定AI商業(yè)化速度的,不再只是GPU能把模型訓得多大、多快,而是整套系統(tǒng)能否以可控成本、穩(wěn)定吞吐和高利用率,把模型真正跑起來、用起來、賺到錢。

一旦競爭從“單卡性能”轉(zhuǎn)向“端到端效率”,CPU就不再只是配角,而是AI基礎設施里那個被長期低估的系統(tǒng)變量。

市場為何重新看英特爾?

不只是因為財報,而是因為需求結(jié)構(gòu)變了。

最近一個值得注意的信號,是英特爾重新獲得資本市場關(guān)注。2026年第一季度,英特爾營收約為136億美元,同比增長7%,連續(xù)第六個季度超預期;凈利潤同比增長156%。其中,數(shù)據(jù)中心與AI相關(guān)業(yè)務(DCAI)收入達到約51億美元,同比增長22%,成為增長最快的板塊。財報發(fā)布后,英特爾股價盤后最高上漲超40%(截至4月30日)。

如果只看公司層面,這當然不足以說明英特爾已經(jīng)徹底翻身。它仍面臨制程追趕、服務器CPU份額承壓、Arm滲透、云廠商自研芯片推進等問題。但市場還是給了它新的想象空間,原因不在于英特爾突然變成AI明星,而在于投資人開始意識到:AI基礎設施的需求結(jié)構(gòu),已經(jīng)不再只是“多買GPU”。

英特爾管理層在財報會上透露,數(shù)據(jù)中心中CPU與GPU的部署比例,正從傳統(tǒng)的1:8收緊到1:4,在智能體場景中甚至可能進一步向1:1靠近。

這背后的含義非常明確:過去兩年AI行業(yè)最核心的矛盾是訓練能力不足,而今天越來越多企業(yè)開始面對另一組問題,模型訓練完之后,如何推理、如何部署、如何擴展、如何控制成本。

也就是說,資本市場重新定價的,不只是英特爾,而是一個更深層的事實:AI開始進入系統(tǒng)競爭階段。

CPU的重要性從何而來?

先要回答另一個問題:為什么AI今天的核心矛盾,已經(jīng)不再只是訓練。因為訓練雖然貴,但對大多數(shù)企業(yè)來說,它更多是階段性的資本開支;而推理、部署和調(diào)用,才是持續(xù)性的運營開支。

訓練決定模型能不能做出來,推理決定模型能不能活下去。這一變化已經(jīng)有明確的數(shù)據(jù)支撐。

Deloitte估算,推理工作負載占AI總算力的比例在2023年約為1/3,2025年接近1/2,到2026年預計達到2/3。IDC預測,到2027年中國推理算力占整體算力比例將突破70%。另有研究預計,到2026年推理帶來的市場規(guī)模將是訓練硬件市場的2到3倍。這些數(shù)字共同說明一件事:AI的成本中心和價值中心,正在從“訓練一次”轉(zhuǎn)向“運行無數(shù)次”。

鄭緯民院士給過一個更直白的拆分:在大模型推理成本中,人力僅占3%,數(shù)據(jù)占2%,算力占到95%。他舉例稱,ChatGPT的推理開銷每天約70萬美元,DeepSeek V3每天約8.7萬美元(按各自披露口徑)。

這組數(shù)據(jù)真正說明的,不是“推理也很貴”,而是一旦AI進入大規(guī)模使用階段,真正吞噬利潤的不是訓練賬,而是推理賬。國家數(shù)據(jù)局的數(shù)據(jù)進一步放大了這種壓力:中國日均Token調(diào)用量從2024年初約1000億,躍升至2026年3月的140萬億,兩年增長超千倍。

如果說訓練是一次性把錢砸進去,那么推理就是每天都在把錢燒出去。訓練貴,是研發(fā)問題;推理貴,是利潤問題。而一旦問題變成利潤問題,企業(yè)就不可能再只盯著模型參數(shù)和GPU數(shù)量,而必須開始追問:

GPU是不是被充分利用了?哪些任務必須用GPU?哪些其實應該交給CPU?整套系統(tǒng)的吞吐率和資源利用率到底高不高?

這正是CPU重新變重要的起點。

很多人理解AI基礎設施,還停留在“GPU越多越好”的階段。但現(xiàn)實是,今天大量AI系統(tǒng)面臨的核心問題,不是GPU不夠強,而是系統(tǒng)喂不飽GPU。

MLPerf行業(yè)基準測試顯示,在大模型訓練場景中,數(shù)據(jù)加載、預處理、參數(shù)同步等環(huán)節(jié)帶來的延遲,可占總訓練時間的35%到60%。IDC調(diào)研則顯示,即使是頭部互聯(lián)網(wǎng)企業(yè)的AI推理集群,GPU平均利用率也長期低于40%;大量中小企業(yè)的GPU集群利用率甚至不足15%。

這意味著什么?

意味著今天最昂貴的AI資源,正在被大規(guī)模浪費。不是因為GPU性能不行,而是因為數(shù)據(jù)流動、任務調(diào)度、內(nèi)存管理、I/O協(xié)同、網(wǎng)絡處理這些系統(tǒng)環(huán)節(jié)跟不上。換句話說,GPU算得很快,但系統(tǒng)供給不上,結(jié)果就是一邊拼命買卡,一邊大面積閑置。

這也是為什么CPU的重要性,不是“多賣一點服務器芯片”那么簡單,而是它直接決定AI系統(tǒng)的資源利用率和ROI。

因為在真實工作流里,GPU從來不是單獨工作的。它前面有數(shù)據(jù)準備,后面有結(jié)果處理,中間有任務調(diào)度、緩存維護、上下文切換、網(wǎng)絡通信、容器管理、數(shù)據(jù)庫交互。這些環(huán)節(jié)里,真正承擔控制流和系統(tǒng)協(xié)同的,主要是CPU。

所以問題的本質(zhì)不是“CPU能不能替代GPU”,而是如果CPU和系統(tǒng)層能力跟不上,再強的GPU也只是昂貴的閑置資產(chǎn)。


智能體興起,讓CPU從“底座”變成“中樞”

如果說推理階段讓CPU重新重要,那么智能體(Agent)的興起,則把這種重要性進一步放大。

因為智能體不是一個“更會聊天”的模型,而是一套真正要執(zhí)行任務的系統(tǒng)。它要理解目標、拆解步驟、調(diào)用工具、訪問數(shù)據(jù)庫、連接API、執(zhí)行代碼、維護狀態(tài)、判斷結(jié)果,必要時還要調(diào)用其他模型或子Agent協(xié)同。

在這條鏈路中,模型推理只是其中一環(huán)。大量工作并不是“算”,而是“調(diào)度”“編排”“切換”“訪問”“管理”。這些工作本質(zhì)上都屬于控制流和系統(tǒng)協(xié)同,而這正是CPU最擅長的領域。

康奈爾大學的研究顯示,在五類代表性Agent工作負載中,CPU端的工具處理、邏輯調(diào)度和數(shù)據(jù)預處理,占總端到端延遲的比例高達43.8%到90.6%。在典型的RAG場景中,CPU處理甚至可能占到總延遲的90%以上,GPU推理反而不到10%。

這組數(shù)據(jù)的意義非常明確:在智能體時代,很多真實任務的瓶頸已經(jīng)不是GPU算得夠不夠快,而是CPU能不能把整條任務鏈順暢地跑完。

這也解釋了為什么CPU/GPU配比正在變化。TrendForce指出,當前AI數(shù)據(jù)中心中CPU與GPU的配比大約是1:4到1:8,而在智能體AI時代,這一比例預計將逐步演變?yōu)?:1到1:2。當配比從1:8向1:1收斂,本質(zhì)上不是CPU多賣了幾顆,而是AI基礎設施從“計算中心化”轉(zhuǎn)向“系統(tǒng)中心化”。

產(chǎn)業(yè)反饋已經(jīng)開始出現(xiàn)。2026年第一季度末,Intel和AMD都對部分CPU產(chǎn)品線提價,服務器CPU交期拉長至約6個月。與此同時,英偉達和Arm也在同一時期宣布進軍服務器CPU市場。

一個是GPU巨頭,一個是IP授權(quán)商,卻在同一時間加碼CPU,這說明他們看到的是同一個趨勢:未來AI的關(guān)鍵戰(zhàn)場,不只是模型推理本身,而是圍繞推理和智能體展開的整機系統(tǒng)能力。

當所有頭部玩家都在補CPU,說明競爭已經(jīng)從“單芯片”變成“系統(tǒng)工程”。過去兩年,AI行業(yè)有一種很強的“單點崇拜”:比誰的芯片更強,比誰的參數(shù)更多,比誰的集群更大。這種競爭方式在產(chǎn)業(yè)早期成立,因為技術(shù)突破往往首先來自少數(shù)明星環(huán)節(jié)。

但產(chǎn)業(yè)一旦進入落地階段,決定勝負的邏輯就會改變。真正拉開差距的,不再只是某個單點性能,而是整套系統(tǒng)能否以可控成本、可復制方式持續(xù)運行。

所以今天我們看到的,不只是英特爾受益,而是所有重要玩家都在重新補CPU、補系統(tǒng)、補整機能力。英特爾希望依托數(shù)據(jù)中心生態(tài)和軟件兼容,重新鞏固系統(tǒng)層話語權(quán);AMD則在服務器CPU市場持續(xù)擴大份額,Mercury Research數(shù)據(jù)顯示,AMD EPYC服務器CPU在2025年Q4營收份額已達到41.3%,首次突破40%。

Arm和云廠商自研CPU,則試圖從高能效和定制化切入系統(tǒng)入口;甚至連英偉達自己,也在通過Grace CPU強化對整機架構(gòu)的控制力。所有頂級玩家都在補CPU,不是因為CPU突然變得性感,而是因為AI開始從芯片問題,變成系統(tǒng)問題。

如果把視角拉回中國,這輪變化的現(xiàn)實意義更大。中國是全球AI應用落地最快的市場之一。截至2026年3月,我國日均Token調(diào)用量已突破140萬億;IDC數(shù)據(jù)顯示,2025年中國AI加速卡總出貨約400萬張,其中國產(chǎn)廠商出貨165萬張,占比41%。

這說明,中國AI已經(jīng)不再只是“模型熱”“算力熱”,而是進入了真正的“調(diào)用熱”和“部署熱”。這會把中國企業(yè)推向一個更現(xiàn)實的問題:AI不是能不能做,而是做了之后能不能長期跑、能不能算得過來。

第一,是成本壓力。

某制造企業(yè)在將智能體接入生產(chǎn)線時發(fā)現(xiàn),每個決策步驟的推理成本高達0.3美元,是傳統(tǒng)規(guī)則系統(tǒng)的20倍。這類案例真正說明的,不是智能體太貴,而是:如果系統(tǒng)架構(gòu)不優(yōu)化,AI很容易從生產(chǎn)力工具變成成本黑洞。

第二,是兼容壓力。

中國企業(yè)現(xiàn)有IT系統(tǒng)復雜,數(shù)據(jù)庫、ERP、CRM、OA、工業(yè)系統(tǒng)長期并存。AI如果要真正進入業(yè)務流程,必須與這些存量系統(tǒng)深度融合。這意味著企業(yè)需要的不是單一“最強模型”,而是一套能把模型、數(shù)據(jù)庫、API和業(yè)務系統(tǒng)串起來的基礎設施,而CPU承擔的正是兼容、調(diào)度和運行時支撐角色。

第三,是自主可控。

隨著AI部署深化,國產(chǎn)CPU、服務器、操作系統(tǒng)、數(shù)據(jù)庫、中間件和調(diào)度軟件,都會被重新放到更靠前的位置。也就是說,CPU重新重要,不只是國際巨頭的機會,也可能成為中國基礎設施產(chǎn)業(yè)鏈的一次再估值窗口。

所以,如果把視角再拉長一點,就會發(fā)現(xiàn),CPU在AI中的重新重要,其實只是表象。更深層被重新定價的,是系統(tǒng)能力。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4855067.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
糾結(jié)?。?7歲深圳離異男存款170萬、社保滿20年,想辭職有出路嗎

糾結(jié)??!47歲深圳離異男存款170萬、社保滿20年,想辭職有出路嗎

火山詩話
2026-04-30 06:23:09
不出 5 年,中國貶值最快的不是房子和現(xiàn)金,而是這 3 樣東西

不出 5 年,中國貶值最快的不是房子和現(xiàn)金,而是這 3 樣東西

細說職場
2026-04-26 21:04:20
提前鎖定2026!A股八大核心賽道曝光,這些細分龍頭必須拿穩(wěn)

提前鎖定2026!A股八大核心賽道曝光,這些細分龍頭必須拿穩(wěn)

慧眼看世界哈哈
2026-05-01 06:07:10
湖南中醫(yī)附一院職工陳女士為何如此“抗上”?

湖南中醫(yī)附一院職工陳女士為何如此“抗上”?

方清云
2026-04-30 20:49:50
中國或?qū)⒂瓉砬八从械乃劳龈叻??專家:是這些關(guān)鍵因素導致的

中國或?qū)⒂瓉砬八从械乃劳龈叻??專家:是這些關(guān)鍵因素導致的

聚焦科技與創(chuàng)新
2026-05-01 02:55:13
悲催!丈夫降薪被迫離婚,女子分40萬后,得知前夫失業(yè)慶幸跑得早

悲催!丈夫降薪被迫離婚,女子分40萬后,得知前夫失業(yè)慶幸跑得早

火山詩話
2026-04-28 11:02:31
千萬企退人員多年合理訴求遲遲未落地!真實現(xiàn)狀深度解析

千萬企退人員多年合理訴求遲遲未落地!真實現(xiàn)狀深度解析

匹夫來搞笑
2026-04-25 15:26:44
反轉(zhuǎn)!前德外長貝爾伯克放下身段,訪華只為聯(lián)合國續(xù)命

反轉(zhuǎn)!前德外長貝爾伯克放下身段,訪華只為聯(lián)合國續(xù)命

萬物知識圈
2026-05-01 09:44:28
反轉(zhuǎn)!美軍航母狼狽離場,伊朗殺器硬剛到底,拼盡全力往中送油!

反轉(zhuǎn)!美軍航母狼狽離場,伊朗殺器硬剛到底,拼盡全力往中送油!

鄉(xiāng)土舒四
2026-05-01 09:32:57
日子好起來了!李亞鵬坐商務艙飛香港,帽子擋臉一身素衣低調(diào)愜意

日子好起來了!李亞鵬坐商務艙飛香港,帽子擋臉一身素衣低調(diào)愜意

小瘋子耶
2026-05-01 08:13:28
常州一組織頭目名下資產(chǎn)拍賣!曾非法獲利上千萬,判刑19年

常州一組織頭目名下資產(chǎn)拍賣!曾非法獲利上千萬,判刑19年

常州大喇叭
2026-04-30 10:25:13
我去!哈登演了3個月好父親!多1個私生子!網(wǎng)友:這品味登哥…

我去!哈登演了3個月好父親!多1個私生子!網(wǎng)友:這品味登哥…

羅氏八卦
2026-04-30 18:30:03
趙薇:2026年4月30號在京參加《北電表演系96班同學30周年聚會》

趙薇:2026年4月30號在京參加《北電表演系96班同學30周年聚會》

曉今娛
2026-05-01 01:00:04
央八新劇被要求下架:全是算計、演技稀爛、劇情懸浮、三觀盡毀!

央八新劇被要求下架:全是算計、演技稀爛、劇情懸浮、三觀盡毀!

科學發(fā)掘
2026-05-01 00:34:21
突發(fā)!綠軍暗藏大動作,32歲懷特恐被交易,三大伏筆早已暗示結(jié)局

突發(fā)!綠軍暗藏大動作,32歲懷特恐被交易,三大伏筆早已暗示結(jié)局

體育大朋說
2026-05-01 10:29:36
勝戰(zhàn)紅利!晚了4年的麒麟級潛艇,巴鐵沒毀約,總統(tǒng)親赴三亞接收

勝戰(zhàn)紅利!晚了4年的麒麟級潛艇,巴鐵沒毀約,總統(tǒng)親赴三亞接收

共工之錨
2026-05-01 00:02:23
非洲足聯(lián):54個成員協(xié)會一致支持因凡蒂諾連任國際足聯(lián)主席

非洲足聯(lián):54個成員協(xié)會一致支持因凡蒂諾連任國際足聯(lián)主席

懂球帝
2026-05-01 09:20:08
北京車展那盆寶馬冷水,提醒我們比亞迪在歐洲被潑臟水

北京車展那盆寶馬冷水,提醒我們比亞迪在歐洲被潑臟水

觀察者網(wǎng)
2026-05-01 08:49:19
我在中東教漢語,娶了三個本地女孩,雖然年入百萬,卻并不幸福

我在中東教漢語,娶了三個本地女孩,雖然年入百萬,卻并不幸福

千秋文化
2026-04-20 19:55:30
只要有陌生電話問你“您是不是本人”,這樣反問一句,防騙超實用

只要有陌生電話問你“您是不是本人”,這樣反問一句,防騙超實用

今日搞笑分享
2026-04-23 18:21:05
2026-05-01 10:59:00
虎嗅APP incentive-icons
虎嗅APP
個性化商業(yè)資訊與觀點交流平臺
26234文章數(shù) 687705關(guān)注度
往期回顧 全部

科技要聞

蘋果上季在華收入繼續(xù)大增 iPhone收入新高

頭條要聞

牛彈琴:特朗普還是沒抵住誘惑 誘惑中果然有陷阱

頭條要聞

牛彈琴:特朗普還是沒抵住誘惑 誘惑中果然有陷阱

體育要聞

季后賽場均5.4分,他憑啥在騎士打首發(fā)?

娛樂要聞

鄧超在景德鎮(zhèn)被偶遇,穿黑外套逛茶園

財經(jīng)要聞

GPU神話松動,AI真正的戰(zhàn)場變了

汽車要聞

專訪捷途汪如生:捷途雙線作戰(zhàn) 全球化全面落地

態(tài)度原創(chuàng)

數(shù)碼
家居
親子
健康
公開課

數(shù)碼要聞

飛利浦5K雙模顯示器Evnia 27M2G5800發(fā)售,4499元

家居要聞

靈動實用 生活藝術(shù)場

親子要聞

為什么要把兩個孩子接到非洲上學?

干細胞治燒燙傷面臨這些“瓶頸”

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版