国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

“買顯存送核心”,AI芯片競(jìng)賽進(jìn)入“內(nèi)存為王”!智能體大時(shí)代,中國(guó)AI芯片有何機(jī)會(huì)?

0
分享至

曾經(jīng),云服務(wù)廠商買AI芯片,關(guān)注GPU(圖形處理器)算力大小,而如今,可能更多的是看重顯存大小,比如是40GB還是80GB。

甚至有人調(diào)侃“買顯存送核心”,即買一張GPU算力卡,更看重的是顯存帶寬和容量,而不是GPU算力大小。

如今,內(nèi)存芯片一兩個(gè)月價(jià)格翻倍的大漲潮,正是對(duì)AI芯片進(jìn)入“內(nèi)存為王”的集中體現(xiàn)。

AI云基礎(chǔ)設(shè)施廠商PPIO相關(guān)專家告訴每經(jīng)記者:“HBM(高帶寬內(nèi)存)及CoWoS(基板上晶圓、芯片)封裝產(chǎn)生的成本已經(jīng)超過(guò)純GPU芯片,HBM成本已經(jīng)‘碾壓’核心,‘買顯存送核心’已成為現(xiàn)實(shí)!

某GPU芯片企業(yè)技術(shù)負(fù)責(zé)人李明(化名)對(duì)每經(jīng)記者表示:“結(jié)合我們硬件設(shè)計(jì)與供應(yīng)鏈經(jīng)驗(yàn),CoWoS封裝GPU中,當(dāng)前HBM顯存成本已接近甚至超過(guò)GPU核心,是整卡成本最高的單一組件。”

懂芯創(chuàng)始人張慧娟告訴每經(jīng)記者:“AI芯片的競(jìng)爭(zhēng)已從單純的算力競(jìng)賽,轉(zhuǎn)向了內(nèi)存帶寬和內(nèi)存容量的雙重競(jìng)賽。HBM通過(guò)先進(jìn)封裝技術(shù)與GPU裸片集成在同一封裝內(nèi),實(shí)現(xiàn)了計(jì)算與存儲(chǔ)的緊耦合,極大地緩解了內(nèi)存難題,越來(lái)越成為業(yè)界追捧的主要方向!


圖片來(lái)源:每經(jīng)媒資庫(kù)

智能體大時(shí)代:內(nèi)存需求強(qiáng)勁

2025年下半年以來(lái),存儲(chǔ)芯片持續(xù)漲價(jià)成了半導(dǎo)體行業(yè)最熱門(mén)的話題。進(jìn)入2026年,存儲(chǔ)芯片仍保持上漲趨勢(shì),且漲幅驚人。

而這背后,是AI芯片已進(jìn)入“內(nèi)存為王”的時(shí)代。

2023年,ChatGPT石破天驚,人類社會(huì)進(jìn)入大模型時(shí)代。進(jìn)入2026年,大模型已然從思考轉(zhuǎn)向應(yīng)用,智能體、Skill以及“養(yǎng)蝦”成了熱門(mén)話題。

人工智能的發(fā)展,也對(duì)AI芯片有了新的要求。隨著大模型參數(shù)的增加,訓(xùn)練和推理對(duì)顯存(內(nèi)存的一種)的需求也與日俱增。

張慧娟表示:“我們已經(jīng)見(jiàn)證了模型參數(shù)量的指數(shù)級(jí)增長(zhǎng),從GPT-3的1750億到萬(wàn)億級(jí)MoE(混合專家模型),直接推動(dòng)了HBM需求的爆發(fā)。這也逐步造成,制約算力的瓶頸往往不是芯片算力本身,而是數(shù)據(jù)從內(nèi)存?zhèn)鬏數(shù)接?jì)算核心的速度,因?yàn)閰?shù)必須被加載到計(jì)算單元附近的高速存儲(chǔ)介質(zhì)中,計(jì)算單元才能以極低的延遲調(diào)用它們進(jìn)行運(yùn)算!

李明認(rèn)為:“大模型的參數(shù)量與內(nèi)存需求之間存在著直接的正向關(guān)系。在2026年的技術(shù)背景下,雖然模型架構(gòu)(如MoE混合專家模型)和量化技術(shù)(Quantization)在不斷優(yōu)化,但‘參數(shù)量越大,內(nèi)存需求越高’依然是AI領(lǐng)域的基本物理定律。除了模型權(quán)重需要的靜態(tài)顯存占用以外,大模型運(yùn)行時(shí)需要的KV Cache和激活值等都會(huì)額外占用顯存。在訓(xùn)練任務(wù)中,還需要額外顯存來(lái)保存梯度和優(yōu)化器狀態(tài)等信息!

但大模型對(duì)內(nèi)存的強(qiáng)勁“渴望”,不僅僅局限于參數(shù)的增長(zhǎng)。

智能體的快速發(fā)展,令A(yù)I推理對(duì)AI芯片的需求大增。業(yè)界普遍認(rèn)為,未來(lái)AI推理對(duì)AI芯片的需求將大幅超越AI訓(xùn)練。

PPIO專家表示:“大模型推理場(chǎng)景中,GPU內(nèi)存主要用于兩個(gè)方面,一是保存大模型的權(quán)重,另一個(gè)是推理過(guò)程中用于存儲(chǔ)中間狀態(tài),也就是KV Cache緩存。前者由大模型參數(shù)量決定,后者取決于會(huì)話的上下文長(zhǎng)度。大模型發(fā)展至今,參數(shù)量已經(jīng)趨于穩(wěn)定,不會(huì)大幅增加。而會(huì)話的上下文長(zhǎng)度還在持續(xù)增加,特別是Agent(智能體)場(chǎng)景下,1百萬(wàn)Token的上下文長(zhǎng)度已成為主流。這樣進(jìn)一步增加對(duì)內(nèi)存的開(kāi)銷,長(zhǎng)上下文成為內(nèi)存需求的主要因素!

參數(shù)、長(zhǎng)上下文,這兩大因素的作用下,內(nèi)存的重要性已然超越GPU計(jì)算核心。

成本結(jié)構(gòu):內(nèi)存>算力

不僅僅客戶需求側(cè)更加看重內(nèi)存。在成本結(jié)構(gòu)中,內(nèi)存的成本也大幅高于純粹的GPU核心。

PPIO專家稱:“一張GPU的成本構(gòu)成主要分成三部分,一是HBM內(nèi)存,容量越大成本越高;二是GPU核心(邏輯計(jì)算芯片);三是先進(jìn)封裝工藝(CoWoS)。高端GPU,由于HBM內(nèi)存容量更大,其HBM的成本更高,以B200(英偉達(dá)GPU)為例,其總生產(chǎn)成本的構(gòu)成中,HBM內(nèi)存占比約45%,CoWoS封裝及良率損失占比約34%,GPU核心芯片占比只有14%左右!

即英偉達(dá)B200的成本結(jié)構(gòu)中,45%源自向SK海力士、三星、美光等廠商購(gòu)買HBM,14%源自臺(tái)積電代工的GPU裸芯,34%源自臺(tái)積電代工的CoWoS封裝及良率損失。

而HBM由多層DRAM(動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)堆疊而成。HBM需求大增,意味著SK海力士這類廠商將越來(lái)越多的DRAM產(chǎn)能用于制造HBM,相應(yīng)用于消費(fèi)級(jí)的DRAM產(chǎn)能便少了。

PPIO專家表示:“三大存儲(chǔ)巨頭(三星、SK海力士、美光)已經(jīng)將70%的產(chǎn)能轉(zhuǎn)移到HBM上,用于消費(fèi)電子的GDDR產(chǎn)能反而會(huì)下降。因此我們首先看到消費(fèi)領(lǐng)域的GeForce GPU的價(jià)格普遍上漲,大內(nèi)存GPU減產(chǎn)甚至停產(chǎn),這是由于GDDR內(nèi)存減產(chǎn)以優(yōu)先保障HBM內(nèi)存導(dǎo)致的。”

那么,若未來(lái)存儲(chǔ)行業(yè)產(chǎn)能提升,消費(fèi)電子領(lǐng)域存儲(chǔ)價(jià)格是否也將率先受到?jīng)_擊?

張慧娟認(rèn)為:“消費(fèi)電子往往是最先感知到波動(dòng)的領(lǐng)域。特別是對(duì)于存儲(chǔ)來(lái)說(shuō),比如手機(jī)、PC(個(gè)人電腦)用的LPDDR(低功耗內(nèi)存)、SSD(固態(tài)硬盤(pán))等接近于標(biāo)準(zhǔn)品,價(jià)格彈性大。一旦上游晶圓產(chǎn)能提升,最先反映在現(xiàn)貨價(jià)上的是這些產(chǎn)品!

李明認(rèn)為:“未來(lái)存儲(chǔ)產(chǎn)能提升后,最先受到影響的是消費(fèi)電子用存儲(chǔ)。消費(fèi)級(jí)存儲(chǔ)認(rèn)證周期短、需求彈性大、替換靈活,新產(chǎn)能可快速導(dǎo)入消費(fèi)端,價(jià)格波動(dòng)也最為明顯。而數(shù)據(jù)中心用存儲(chǔ)認(rèn)證流程通常需要6—18個(gè)月,新產(chǎn)能導(dǎo)入速度較慢,且存儲(chǔ)廠商會(huì)優(yōu)先保障數(shù)據(jù)中心的產(chǎn)能供給,因此它受產(chǎn)能提升的影響最晚、幅度最小?傮w而言,產(chǎn)能提升的影響會(huì)先平抑消費(fèi)端價(jià)格,再逐步傳導(dǎo)至企業(yè)級(jí)市場(chǎng)。”

簡(jiǎn)而言之,存儲(chǔ)產(chǎn)能提升后,將率先平抑消費(fèi)端存儲(chǔ)芯片價(jià)格。

HBM需求強(qiáng)勁,產(chǎn)能嚴(yán)重不足

值得一提的是,三星、SK海力士未來(lái)將有兩座晶圓廠陸續(xù)投產(chǎn),這將緩解內(nèi)存“缺貨漲價(jià)”嗎?若P4L(三星電子)和M15x(SK海力士)提前投入運(yùn)營(yíng),是否將對(duì)存儲(chǔ)芯片價(jià)格帶來(lái)沖擊?

張慧娟認(rèn)為:“P4L和M15x新增產(chǎn)能,很大程度上是為HBM和高性能DDR5(第五代計(jì)算機(jī)內(nèi)存規(guī)格)準(zhǔn)備的,而不是傳統(tǒng)的DDR4(第四代計(jì)算機(jī)內(nèi)存規(guī)格)或NAND(閃存)。這些屬于高端產(chǎn)能!

其補(bǔ)充表示:“對(duì)HBM的價(jià)格沖擊可能不大,甚至不會(huì)降價(jià)。因?yàn)锳I芯片開(kāi)發(fā)周期長(zhǎng),且市場(chǎng)處于供不應(yīng)求的局面。新增產(chǎn)能是為了填平供需缺口,有望抑制價(jià)格進(jìn)一步大漲,但難以帶來(lái)大幅降價(jià)。對(duì)普通DRAM而言,假設(shè)HBM需求不及預(yù)期,或者廠商將部分產(chǎn)線切換回通用DRAM,那么會(huì)對(duì)消費(fèi)電子內(nèi)存價(jià)格帶來(lái)壓力。但目前看,晶圓廠更傾向于優(yōu)先保證高利潤(rùn)的HBM生產(chǎn)。”

李明對(duì)每經(jīng)記者表示:“從存儲(chǔ)芯片供應(yīng)鏈與GPU硬件配套的角度分析,三星P4L與SK海力士M15x即便提前投產(chǎn),短期內(nèi)對(duì)存儲(chǔ)芯片價(jià)格的沖擊也較為有限。核心原因在于,這兩座工廠的新產(chǎn)能主要聚焦于HBM、先進(jìn)制程DDR等高端存儲(chǔ)產(chǎn)品,并未直接擴(kuò)產(chǎn)消費(fèi)級(jí)存儲(chǔ)!

李明補(bǔ)充表示:“當(dāng)前AI需求呈爆發(fā)式增長(zhǎng),高端存儲(chǔ)仍處于供需緊張狀態(tài),因此短期價(jià)格將維持高位。中長(zhǎng)期來(lái)看,隨著產(chǎn)能逐步釋放,高端存儲(chǔ)的供給壓力會(huì)有所緩解,但新產(chǎn)能將優(yōu)先配套AI與數(shù)據(jù)中心需求,普通消費(fèi)級(jí)存儲(chǔ)不會(huì)出現(xiàn)大幅降價(jià),整體呈現(xiàn)結(jié)構(gòu)性緩和態(tài)勢(shì)。此外,各大廠商的存儲(chǔ)優(yōu)化技術(shù),也能進(jìn)一步平衡供需,避免全品類存儲(chǔ)價(jià)格出現(xiàn)大幅波動(dòng)。”

PPIO認(rèn)為:“HBM的產(chǎn)能嚴(yán)重不足以及AI數(shù)據(jù)中心對(duì)GPU的旺盛需求是造成HBM內(nèi)存成本遠(yuǎn)高于GPU核心的主要因素。市場(chǎng)的供需不平衡會(huì)促使更多內(nèi)存廠商擴(kuò)大生產(chǎn),尤其是增加HBM的生產(chǎn)和供給,不過(guò)短期很難改變供需失衡的現(xiàn)狀,未來(lái)HBM內(nèi)存價(jià)格還將繼續(xù)上漲,但趨勢(shì)會(huì)放緩!

在AI算力相對(duì)不稀缺而HBM短缺的背景下,中國(guó)AI芯片廠商有何機(jī)會(huì)?

據(jù)記者了解,國(guó)內(nèi)AI芯片廠商除了自身產(chǎn)品和技術(shù)解決方案,還在基礎(chǔ)軟件層面聯(lián)合各大人工智能基礎(chǔ)設(shè)施公司、大模型廠商和互聯(lián)網(wǎng)等生態(tài)伙伴一同研究例如低精度量化、專家預(yù)測(cè)加載等工程優(yōu)化技術(shù),來(lái)系統(tǒng)性地降低實(shí)際大模型部署和應(yīng)用過(guò)程中對(duì)內(nèi)存的需求。

即在工程化領(lǐng)域,中國(guó)工程師紅利或?qū)⑼癸@。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
高志凱:未來(lái)1-1.5年內(nèi),美國(guó)將爆發(fā)世界上規(guī)模最大的金融危機(jī)

高志凱:未來(lái)1-1.5年內(nèi),美國(guó)將爆發(fā)世界上規(guī)模最大的金融危機(jī)

boss外傳
2026-03-04 17:00:03
5天滅一國(guó)海軍!17艘艦艇沉沒(méi),指揮中樞癱瘓,伊朗海軍灰飛煙滅

5天滅一國(guó)海軍!17艘艦艇沉沒(méi),指揮中樞癱瘓,伊朗海軍灰飛煙滅

荷蘭豆愛(ài)健康
2026-03-05 03:31:43
母親“去世后再婚”?當(dāng)?shù)赝▓?bào):已成立聯(lián)合調(diào)查組,律師:親屬或涉嫌詐騙

母親“去世后再婚”?當(dāng)?shù)赝▓?bào):已成立聯(lián)合調(diào)查組,律師:親屬或涉嫌詐騙

新民周刊
2026-03-03 19:26:52
伊朗已徹底認(rèn)慫

伊朗已徹底認(rèn)慫

仰望星空的一粒沙子
2026-03-02 09:55:15
西貝員工在線討薪:裁員拒一次性賠付,賈國(guó)龍?jiān)Q不虧待離職人員

西貝員工在線討薪:裁員拒一次性賠付,賈國(guó)龍?jiān)Q不虧待離職人員

識(shí)礁Farsight
2026-03-04 14:20:34
重大突破!華為發(fā)布顛覆性技術(shù),解決行業(yè)重大難題

重大突破!華為發(fā)布顛覆性技術(shù),解決行業(yè)重大難題

Thurman在昆明
2026-03-05 04:07:46
中國(guó)男籃亞洲第二,兩戰(zhàn)攀升九個(gè)名次,國(guó)際籃聯(lián)也是個(gè)草臺(tái)班子!

中國(guó)男籃亞洲第二,兩戰(zhàn)攀升九個(gè)名次,國(guó)際籃聯(lián)也是個(gè)草臺(tái)班子!

郭夷包工頭
2026-03-05 04:13:41
中國(guó)腦梗發(fā)病率世界第一!醫(yī)生:罪魁禍?zhǔn)滓丫境,這4物最好少吃

中國(guó)腦梗發(fā)病率世界第一!醫(yī)生:罪魁禍?zhǔn)滓丫境,這4物最好少吃

讀懂世界歷史
2026-03-04 10:04:24
13999元iPhone17大面積褪色遭集體投訴 客服最新回應(yīng):需由售后判定 具體需到店檢測(cè)

13999元iPhone17大面積褪色遭集體投訴 客服最新回應(yīng):需由售后判定 具體需到店檢測(cè)

快科技
2026-03-04 10:32:10
瞞不下去了,打伊朗是幌子,美國(guó)真正目的是隔山打牛,拖垮中國(guó)?

瞞不下去了,打伊朗是幌子,美國(guó)真正目的是隔山打牛,拖垮中國(guó)?

最美的巧合
2026-03-05 01:00:32
紀(jì)實(shí):浙江幼師幼兒園潛伏22年,警察曝光真實(shí)身份,家長(zhǎng)很后怕

紀(jì)實(shí):浙江幼師幼兒園潛伏22年,警察曝光真實(shí)身份,家長(zhǎng)很后怕

談史論天地
2026-03-01 09:49:38
中國(guó)女排出現(xiàn)老將回歸潮,沖擊金牌三員大將已做好準(zhǔn)備

中國(guó)女排出現(xiàn)老將回歸潮,沖擊金牌三員大將已做好準(zhǔn)備

體育快遞小哥哥
2026-03-04 18:29:04
出席十四屆全國(guó)人大四次會(huì)議的黑龍江省代表團(tuán)召開(kāi)第一次全體會(huì)議

出席十四屆全國(guó)人大四次會(huì)議的黑龍江省代表團(tuán)召開(kāi)第一次全體會(huì)議

哈爾濱新聞網(wǎng)
2026-03-04 19:23:18
元宵佳節(jié)寇振海攜一家五口祝大家:闔家團(tuán)圓,喜樂(lè)平安!

元宵佳節(jié)寇振海攜一家五口祝大家:闔家團(tuán)圓,喜樂(lè)平安!

閱識(shí)
2026-03-04 19:01:29
三桶油大跌,中石化、中海油觸及跌停

三桶油大跌,中石化、中海油觸及跌停

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-03-04 10:24:22
CBA熱身賽:遼寧101-94北控 哈維首秀15分 里勒空砍29分

CBA熱身賽:遼寧101-94北控 哈維首秀15分 里勒空砍29分

狼叔評(píng)論
2026-03-04 18:07:04
韓國(guó)21歲“蛇蝎美人”確認(rèn)為反社會(huì)人格!AI策劃殺人致2死1傷

韓國(guó)21歲“蛇蝎美人”確認(rèn)為反社會(huì)人格!AI策劃殺人致2死1傷

紅星新聞
2026-03-04 11:46:40
蘇聯(lián)“人猿雜交”實(shí)驗(yàn):5名女孩與11只猩猩參與,結(jié)局如何?

蘇聯(lián)“人猿雜交”實(shí)驗(yàn):5名女孩與11只猩猩參與,結(jié)局如何?

談史論天地
2026-02-28 13:35:18
毛曉彤跳舞沖熱搜第一!生圖五官精致身材曼妙,陳翔又被罵了

毛曉彤跳舞沖熱搜第一!生圖五官精致身材曼妙,陳翔又被罵了

青橘罐頭
2026-03-04 19:32:40
迪拜機(jī)場(chǎng)復(fù)航后首個(gè)國(guó)內(nèi)航班,剛剛降落廣州!“買機(jī)票的時(shí)候也沒(méi)想到,實(shí)在是運(yùn)氣好”

迪拜機(jī)場(chǎng)復(fù)航后首個(gè)國(guó)內(nèi)航班,剛剛降落廣州!“買機(jī)票的時(shí)候也沒(méi)想到,實(shí)在是運(yùn)氣好”

都市快報(bào)橙柿互動(dòng)
2026-03-04 22:37:05
2026-03-05 04:51:00
每日經(jīng)濟(jì)新聞 incentive-icons
每日經(jīng)濟(jì)新聞
中國(guó)主流財(cái)經(jīng)全媒體平臺(tái)。
1498251文章數(shù) 2723632關(guān)注度
往期回顧 全部

科技要聞

多位核心離職,阿里親手廢掉最強(qiáng)AI天團(tuán)?

頭條要聞

外媒稱伊朗封鎖霍爾木茲海峽只讓中俄船通行 中方回應(yīng)

頭條要聞

外媒稱伊朗封鎖霍爾木茲海峽只讓中俄船通行 中方回應(yīng)

體育要聞

2026年中超,為什么值得你多看一眼?

娛樂(lè)要聞

謝謝謝娜 貢獻(xiàn)出26年內(nèi)娛的第一個(gè)笑話

財(cái)經(jīng)要聞

人大代表建議:將農(nóng)民養(yǎng)老金提到500元

汽車要聞

鴻蒙智行首款獵裝車 尚界Z7/Z7T首發(fā)

態(tài)度原創(chuàng)

藝術(shù)
本地
數(shù)碼
公開(kāi)課
軍事航空

藝術(shù)要聞

驚艷!她的雙眸與微笑讓人無(wú)法移開(kāi)視線!

本地新聞

食味印象|一口入魂!康樂(lè)烤肉串起千年絲路香

數(shù)碼要聞

蘋(píng)果發(fā)布新款MacBook Pro:首發(fā)M5 Pro/Max芯片 17999元起

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗為遭到美以空襲小學(xué)遇難者舉行葬禮

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版