国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

復(fù)雜計算的CPU和并行計算的GPU,究竟誰是未來?

0
分享至

在計算世界的賽道上,NVIDIA 靠著 GPU 海量并行能力幾乎席卷了 AI 訓(xùn)練、推理、圖形渲染等所有高吞吐場景,而 Intel 和 AMD 則把重心放在CPU單核性能、分支預(yù)測、亂序執(zhí)行和大緩存的極致打磨上。很多人會問:這兩條路到底誰更接近未來?答案其實沒有那么非黑即白,因為它們本質(zhì)上解決的是完全不同的問題。


并行計算為什么這么猛?

過去十年深度學(xué)習(xí)把計算需求徹底重塑,矩陣乘法、注意力機(jī)制、Transformer 這些核心操作天生就能拆成無數(shù)小塊同時計算,GPU 正好為此而生。幾千上萬的核心一起干活,再配上 HBM 高帶寬內(nèi)存,形成了碾壓級的吞吐能力——相比于延遲問題,并行計算更重視帶寬。大模型動輒幾萬張卡的訓(xùn)練規(guī)模,讓很多人覺得未來就是并行計算的天下。


CPU與GPU的本質(zhì)差異

GPU 的并行算力強(qiáng)大,還體現(xiàn)在對不同精度的靈活支持上。傳統(tǒng) FP32(單精度)適合通用計算,但 AI 訓(xùn)練和推理越來越依賴低精度格式來換取速度和能效?,F(xiàn)代 GPU 通過專用矩陣加速單元(如 NVIDIA 的 Tensor Cores 或 AMD 的 AI 加速器 / Matrix Cores / WMMA 單元)來高效處理這些操作,能支持 FP16、BF16(腦浮點)、INT8,甚至 FP8 等更低精度格式。低精度讓計算密度大幅提升——在同樣的硅片面積(晶體管數(shù)量/芯片面積)下,低精度格式(如 FP8)允許 GPU 執(zhí)行遠(yuǎn)更多的浮點運算,同時大幅降低內(nèi)存占用和帶寬壓力。這直接推動了大模型的規(guī)模爆炸:訓(xùn)練速度更快、推理更省電、部署成本更低。簡單說,并行計算的“猛”不只靠核心數(shù)量,還靠精度降維打擊,讓海量數(shù)據(jù)以更高效的方式被“嚼碎”處理。


復(fù)雜計算始終位于舞臺中央!

但是,這不代表世界全部都是并行計算的,現(xiàn)實里還有大量場景根本跑不出高并行度。數(shù)據(jù)庫的事務(wù)處理、游戲里單線程的 AI 決策和物理模擬、傳統(tǒng)高性能計算里的稀疏矩陣和圖計算、瀏覽器渲染、編譯器、Java/Go 后端服務(wù)等等,這些地方真正吃的是“每一條指令要多快到達(dá)、多快執(zhí)行完”,而不是“同時干多少條”。它們更依賴單核 IPC、極低的緩存延遲、聰明的分支預(yù)測和足夠大的亂序窗口。這正是 AMD Zen 系列(尤其是3D V-Cache系列)和 Intel 最新架構(gòu)拼命優(yōu)化的方向。


比如AMD當(dāng)下的Zen 5架構(gòu)(銳龍9000系列及線程撕裂者 9000系列)帶來了顯著升級,核心數(shù)量最大可達(dá) 96 個,并引入兩步前瞻分支預(yù)測、ALU從4 個增到 6 個提升整數(shù)吞吐 50%、向量引擎浮點管道從 3 增到 4、AVX-512 增強(qiáng)支持、更大的 L3 緩存,IPC 平均提升 16%,同時支持更高的內(nèi)存速率。這些優(yōu)化讓 Zen 5 在單線程延遲敏感任務(wù)和游戲中繼續(xù)強(qiáng)勢,尤其3D V-Cache的大緩存是游戲玩家最好的選擇。


Intel 最新一代則以 Arrow Lake(酷睿Ultra 200 系列)和Panther Lake(酷睿Ultra 300)為主。Arrow Lake 采用 Chiplet 設(shè)計、Lion Cove P 核 + Skymont E 核混合、TSMC N3B 工藝 compute tile、獨占 DDR5 支持、集成 Xe2/Xe3 圖形;Panther Lake 進(jìn)一步統(tǒng)一 Lunar Lake 的超低功耗效率與 Arrow Lake 的性能,基于 Intel 18A 工藝、可擴(kuò)展 8/16 核配置、Xe3 圖形最高 12 核(接近 RTX 4050 獨顯)、NPU 優(yōu)化保持高能效、多線程性能提升 60%、游戲提升 77%。并且,這兩代CPU都非常強(qiáng)調(diào)混合核心效率、AI 加速和圖形集成,在低延遲、企業(yè)服務(wù)和移動場景中保持著強(qiáng)大的競爭力。


如果非要對比,那就是并行計算追求最大吞吐,復(fù)雜計算追求最低延遲——兩條路很難完全互相取代,就像高速公路上的貨車和跑車,誰也替代不了誰。

緩存戰(zhàn)爭:瓶頸永遠(yuǎn)都在

另外,真正決定算力天花板的,其實一直是數(shù)據(jù)能不能及時送到計算單元面前——緩存與內(nèi)存的永恒拉鋸戰(zhàn)。

在芯片內(nèi)部,L1 緩存最快但容量極小,只有幾十 KB,基本只夠緩存正在運行的指令和數(shù)據(jù);L2 緩存容量大一些,每個核心獨享,延遲控制在十幾個周期;L3 緩存則是所有核心共享的“大水池”,AMD 把 3D V-Cache 做到上百 MB,讓游戲和很多緩存敏感負(fù)載直接起飛。


在芯片外部,為高帶寬而生的HBM,最新的HBM4 預(yù)期單棧 2.2 TB/s 左右?guī)?,聽起來很夸張,但放在幾千上萬核心同時“餓肚子”的場景下,仍然遠(yuǎn)遠(yuǎn)不夠。至于普通的 DDR5 帶寬就更有限,只有幾百 GB/s,延遲還高得多。


不管工藝怎么縮小,馮·諾依曼瓶頸(計算和存儲分離)始終橫在那里。計算單元越并行,對“數(shù)據(jù)即時送達(dá)”的渴求就越極端。所以你可以看到GPU 拼命堆 HBM 層數(shù)和 NVLink 互聯(lián),CPU 則瘋狂堆 L3 容量,甚至愿意犧牲一點頻率也要換來更大的本地數(shù)據(jù)池。這場緩存戰(zhàn)爭還會持續(xù)很多年,因為“讓正確的數(shù)據(jù)在正確的時間出現(xiàn)在正確的地方”永遠(yuǎn)是計算的終極難題,目前誰都沒能徹底解決。

未來不是你死我活,而是兩條腿走路

未來的圖景大概率不是一方徹底取代另一方,而是高度分工又緊密協(xié)同。吞吐怪獸的任務(wù)交給 GPU 和專用加速器,延遲敏感、分支密集、難以并行的活兒還是交給復(fù)雜 CPU。大部分真實世界應(yīng)用都會是 CPU + GPU + NPU 的異構(gòu)組合,長期共存——兩條腿走路,才是計算真正的未來。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
蔣介石私生活有多混亂?貼身秘書晚年才敢說破,宋美齡的做法絕了

蔣介石私生活有多混亂?貼身秘書晚年才敢說破,宋美齡的做法絕了

芊芊子吟
2026-04-12 21:20:03
特朗普在伊朗戰(zhàn)爭中犯下的7個致命錯誤

特朗普在伊朗戰(zhàn)爭中犯下的7個致命錯誤

史政先鋒
2026-04-12 18:27:18
為啥全世界都容不下猶太人?黑格爾一針見血:猶太教與世界對立

為啥全世界都容不下猶太人?黑格爾一針見血:猶太教與世界對立

瞻史
2026-04-15 18:31:26
北京街頭現(xiàn)“減震神器”!10萬輛新款美團(tuán)單車煥新升級

北京街頭現(xiàn)“減震神器”!10萬輛新款美團(tuán)單車煥新升級

西莫的藝術(shù)宮殿
2026-04-17 04:02:06
38人遇難客機(jī)確系被俄擊落,中國巨額損失,普京大帝公開低頭

38人遇難客機(jī)確系被俄擊落,中國巨額損失,普京大帝公開低頭

音樂時光的娛樂
2026-04-17 11:26:23
李小冉哽咽回應(yīng)《乘風(fēng)2026》一公個人乘風(fēng)值第一:我們的起跑線很低,希望以后可以向唱功好、跳得好的姐姐看齊,第一意味著將來要承受更多

李小冉哽咽回應(yīng)《乘風(fēng)2026》一公個人乘風(fēng)值第一:我們的起跑線很低,希望以后可以向唱功好、跳得好的姐姐看齊,第一意味著將來要承受更多

魯中晨報
2026-04-17 13:24:08
現(xiàn)場簽約!越南對華作出保證,蘇林坐上離京高鐵,臨走前獻(xiàn)出重禮

現(xiàn)場簽約!越南對華作出保證,蘇林坐上離京高鐵,臨走前獻(xiàn)出重禮

孤單是寂寞的毒
2026-04-16 22:21:07
這場中東沖突的最大意外:一直上躥下跳的印度,已是徹底涼涼了

這場中東沖突的最大意外:一直上躥下跳的印度,已是徹底涼涼了

風(fēng)笛悠揚(yáng)聲
2026-04-17 10:41:58
比炮彈還便宜的導(dǎo)彈!中國“借”來的導(dǎo)彈,為什么賣爆了全球?

比炮彈還便宜的導(dǎo)彈!中國“借”來的導(dǎo)彈,為什么賣爆了全球?

馬鞄戶外釣魚哥
2026-03-23 11:06:18
Claude Opus 4.7發(fā)布!這是你在別的公眾號看不到的五個發(fā)現(xiàn)

Claude Opus 4.7發(fā)布!這是你在別的公眾號看不到的五個發(fā)現(xiàn)

AI進(jìn)化論花生
2026-04-17 00:25:26
新買凱迪拉克“爬滿白斑”?相關(guān)部門介入調(diào)查,滬上4S店又被質(zhì)疑“簽名造假”

新買凱迪拉克“爬滿白斑”?相關(guān)部門介入調(diào)查,滬上4S店又被質(zhì)疑“簽名造假”

山西經(jīng)濟(jì)日報
2026-04-17 10:16:30
王競疑似“停哨”!1戰(zhàn)3爭議,足協(xié)“力挺”后慫了,11人已遭處罰

王競疑似“停哨”!1戰(zhàn)3爭議,足協(xié)“力挺”后慫了,11人已遭處罰

奧拜爾
2026-04-17 12:40:01
北京牡丹文化節(jié)啟幕,13個展區(qū)匯集超1300個牡丹品種

北京牡丹文化節(jié)啟幕,13個展區(qū)匯集超1300個牡丹品種

新浪財經(jīng)
2026-04-16 22:41:35
超2400萬伊朗人注冊“為伊朗捐軀”網(wǎng)站

超2400萬伊朗人注冊“為伊朗捐軀”網(wǎng)站

看看新聞Knews
2026-04-15 23:00:11
華國鋒題字震驚眾人!沒練書法的人寫得竟比高手還好!

華國鋒題字震驚眾人!沒練書法的人寫得竟比高手還好!

書畫相約
2026-04-10 08:19:50
蘇林坐高鐵到廣西,全程2400多公里約10小時。南寧有火車直達(dá)河內(nèi)

蘇林坐高鐵到廣西,全程2400多公里約10小時。南寧有火車直達(dá)河內(nèi)

三農(nóng)老歷
2026-04-17 01:51:46
新援到位杜鋒回歸!徐昕遭打爆,廣東死磕第三名

新援到位杜鋒回歸!徐昕遭打爆,廣東死磕第三名

云隱南山
2026-04-17 12:51:25
凱恩引爆輿論:我知道他們對紅牌很生氣,但皇馬的特權(quán),該還了

凱恩引爆輿論:我知道他們對紅牌很生氣,但皇馬的特權(quán),該還了

林子說事
2026-04-17 06:09:06
向太勸醒年輕人:沒200萬存款別買車!自己只開二手車錢全投房產(chǎn)

向太勸醒年輕人:沒200萬存款別買車!自己只開二手車錢全投房產(chǎn)

觀魚聽雨
2026-04-11 20:38:34
女生長的太漂亮是什么體驗?網(wǎng)友:母以子貴,父以女榮

女生長的太漂亮是什么體驗?網(wǎng)友:母以子貴,父以女榮

另子維愛讀史
2026-03-10 22:56:08
2026-04-17 14:07:00
智趣東西 incentive-icons
智趣東西
分享IT科技咨訊,趣玩IT產(chǎn)品
798文章數(shù) 56關(guān)注度
往期回顧 全部

科技要聞

Anthropic推出Opus 4.7,坦言依不及Mythos

頭條要聞

特朗普強(qiáng)推后被迫對黎巴嫩?;?以色列被指成"犧牲品"

頭條要聞

特朗普強(qiáng)推后被迫對黎巴嫩停火 以色列被指成"犧牲品"

體育要聞

贏下快船,這場很庫里,很格林,很科爾

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

又快又穩(wěn)的開掛動力! 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

親子
時尚
藝術(shù)
數(shù)碼
本地

親子要聞

美國婆婆發(fā)消息,杰森的叔叔去世了,我聽后很惋惜,對他也是解脫

假期,怎么拍照最出片?

藝術(shù)要聞

26幅 中國當(dāng)代名家風(fēng)景畫

數(shù)碼要聞

佳翼推出M.2平裝版ArcherX PCIe擴(kuò)展卡,利用顯卡陰影下插槽

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

無障礙瀏覽 進(jìn)入關(guān)懷版