国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeek V4支持華為昇騰,AI底座重構(gòu)引發(fā)熱議。

0
分享至


圖1:DeepSeek V4成為近期國產(chǎn)AI算力討論的核心事件

DeepSeek V4適配華為昇騰,表面上看是一條模型發(fā)布新聞,實(shí)質(zhì)上是中國AI產(chǎn)業(yè)鏈的一次壓力測(cè)試:頂級(jí)開源模型能不能不只停留在論文、榜單和發(fā)布頁,而是真正跑在國產(chǎn)算力底座上,支撐高并發(fā)、長(zhǎng)上下文和智能體應(yīng)用。

這件事不能簡(jiǎn)單理解為“國產(chǎn)芯片已經(jīng)全面替代英偉達(dá)”。更準(zhǔn)確的說法是:在大模型推理側(cè),國產(chǎn)算力開始從“能跑”進(jìn)入“可交付、可優(yōu)化、可規(guī)模化驗(yàn)證”的階段。這個(gè)變化比單一模型分?jǐn)?shù)更重要。

一、這次適配為什么重要不是

過去很多大模型發(fā)布時(shí),默認(rèn)優(yōu)先適配的是英偉達(dá)GPU和CUDA生態(tài)。開發(fā)者、云廠商和企業(yè)客戶也習(xí)慣把訓(xùn)練、推理、部署工具都圍繞這一套體系來做。DeepSeek V4把華為昇騰NPU寫入適配路徑,意味著國產(chǎn)AI芯片開始進(jìn)入前沿模型的正式驗(yàn)證清單。

這背后的價(jià)值不在“宣傳口徑”,而在工程閉環(huán)。大模型不是安裝一個(gè)軟件就能跑得好,尤其是萬億參數(shù)MoE模型,還要面對(duì)專家并行、KV Cache、長(zhǎng)上下文、顯存調(diào)度、算子融合、服務(wù)調(diào)度等一整套難題。模型側(cè)和芯片側(cè)能夠同步推進(jìn),說明國產(chǎn)算力已經(jīng)不只是備選項(xiàng),而是進(jìn)入了模型設(shè)計(jì)、推理優(yōu)化和部署決策的前臺(tái)。

二、DeepSeek V4真正帶來的壓力

DeepSeek V4最顯眼的升級(jí),是上下文長(zhǎng)度從上一代的128K擴(kuò)展到1M級(jí)別。對(duì)普通讀者來說,可以把它理解為:模型一次能讀、能記、能處理的材料大幅增加,長(zhǎng)文檔、長(zhǎng)代碼庫、多輪工具調(diào)用和復(fù)雜Agent任務(wù)都能被放進(jìn)同一個(gè)任務(wù)窗口里。

但長(zhǎng)上下文不是免費(fèi)能力。上下文越長(zhǎng),推理時(shí)要保存和讀取的KV Cache越大,注意力計(jì)算和訪存壓力也越高。V4之所以被關(guān)注,是因?yàn)樗ㄟ^滑窗、壓縮和混合注意力機(jī)制,試圖把長(zhǎng)上下文的成本降下來。也就是說,它不只是“能讀更多字”,而是希望在讀更多內(nèi)容時(shí)仍然有可接受的速度和成本。


圖2:DeepSeek V4技術(shù)報(bào)告中的性能、FLOPs與KV Cache對(duì)比

三、昇騰接住的是推理側(cè)商業(yè)負(fù)載

大模型上線后,最直接的成本來自推理。用戶每問一次,系統(tǒng)都要完成輸入處理、模型計(jì)算、Token生成和結(jié)果返回。企業(yè)真正關(guān)心的不是單卡紙面峰值,而是三個(gè)問題:同一時(shí)間能服務(wù)多少請(qǐng)求?每個(gè)Token返回要等多久?單位Token成本能不能降下來?

華為昇騰在這次適配中的重點(diǎn),正是圍繞低時(shí)延和高吞吐做工程優(yōu)化。公開信息中提到,昇騰950通過融合Kernel、多流并行、量化算法等方式降低Attention計(jì)算和訪存開銷;A3超節(jié)點(diǎn)則面向規(guī)?;渴穑瑥?qiáng)調(diào)大EP模式、vLLM推理引擎和多卡協(xié)同。

這里需要分清兩件事:適配推理,不等于所有訓(xùn)練都已經(jīng)完全遷移到國產(chǎn)芯片;提供訓(xùn)練參考實(shí)現(xiàn),也不等于立刻替代所有現(xiàn)有訓(xùn)練集群。當(dāng)前更現(xiàn)實(shí)的突破口,是先把高頻、持續(xù)、成本敏感的推理服務(wù)做穩(wěn),再逐步擴(kuò)大訓(xùn)練和微調(diào)場(chǎng)景。


圖3:華為發(fā)布超節(jié)點(diǎn)互聯(lián)技術(shù),強(qiáng)調(diào)以系統(tǒng)工程承接AI算力需求

四、為什么是“超節(jié)點(diǎn)”

國產(chǎn)AI芯片短期內(nèi)最大的挑戰(zhàn),是單顆芯片在制程、HBM、生態(tài)成熟度上仍要追趕國際最高端GPU。華為選擇的工程路線,是用超節(jié)點(diǎn)和高速互聯(lián)把多顆NPU組織成一個(gè)更大的邏輯計(jì)算單元。

這條路線的關(guān)鍵,是減少多卡之間“等數(shù)據(jù)”的時(shí)間。MoE模型尤其依賴專家路由,不同Token會(huì)被分配到不同專家網(wǎng)絡(luò),卡與卡之間通信頻繁。如果互聯(lián)帶寬低、延遲高,算力就會(huì)被通信拖住。超節(jié)點(diǎn)的價(jià)值,就是讓多卡協(xié)同更像一臺(tái)機(jī)器,而不是一堆松散服務(wù)器。

因此,DeepSeek V4適配昇騰的意義不只是“芯片能跑模型”,而是“模型結(jié)構(gòu)、推理引擎、算子優(yōu)化和集群互聯(lián)能不能形成組合優(yōu)勢(shì)”。AI時(shí)代的硬件競(jìng)爭(zhēng),已經(jīng)從單卡參數(shù)競(jìng)爭(zhēng),變成系統(tǒng)工程競(jìng)爭(zhēng)。



圖4:DeepSeek V4的壓縮稀疏注意力結(jié)構(gòu),直接關(guān)系到長(zhǎng)上下文推理成本

五、生態(tài)才是下一場(chǎng)硬仗

真正決定國產(chǎn)算力能走多遠(yuǎn)的,不是一次適配,而是開發(fā)者遷移成本。企業(yè)不可能為了換芯片,把模型服務(wù)、推理框架、監(jiān)控運(yùn)維和業(yè)務(wù)系統(tǒng)全部重寫一遍。國產(chǎn)算力要被大規(guī)模采用,必須讓常見工具鏈盡量保持熟悉:PyTorch、vLLM、SGLang、Triton、TileLang、MindSpore、CANN,都要在實(shí)際項(xiàng)目里被反復(fù)打磨。

這也是這次新聞最值得跟進(jìn)的部分。DeepSeek V4如果能在昇騰生態(tài)中持續(xù)優(yōu)化,后續(xù)其他開源模型、行業(yè)模型、企業(yè)私有模型也會(huì)更容易遷移。對(duì)云廠商來說,這是服務(wù)成本問題;對(duì)政企客戶來說,這是供應(yīng)連續(xù)性和數(shù)據(jù)本地化問題;對(duì)開發(fā)者來說,這是能不能少踩坑、少改代碼、少等適配的問題。


圖5:MWC 2026上華為展示面向AI基礎(chǔ)設(shè)施的SuperPoD產(chǎn)品路線

六、熱度會(huì)落到哪里

第一,云服務(wù)價(jià)格會(huì)被重新計(jì)算。如果國產(chǎn)算力能夠穩(wěn)定承接長(zhǎng)上下文推理,API價(jià)格就有繼續(xù)下降空間,更多企業(yè)會(huì)把內(nèi)部知識(shí)庫、代碼助手、客服、研報(bào)生成、數(shù)據(jù)分析等高頻任務(wù)遷到大模型上。

第二,智算中心建設(shè)會(huì)更重視“模型適配能力”。過去建算力中心容易只看卡的數(shù)量,現(xiàn)在還要看能不能穩(wěn)定跑主流模型,能不能支持MoE、長(zhǎng)上下文、Agent框架和多租戶調(diào)度。算力中心不再只是機(jī)房項(xiàng)目,而是模型服務(wù)能力項(xiàng)目。

第三,國產(chǎn)芯片產(chǎn)業(yè)鏈會(huì)被推到更前面。服務(wù)器整機(jī)、交換設(shè)備、液冷、光模塊、連接器、運(yùn)維軟件都會(huì)受益,但真正能留下來的,仍然是能夠把穩(wěn)定性、能耗、成本和交付周期做平衡的公司。

我的判斷是,DeepSeek V4適配昇騰不會(huì)馬上改寫全球AI芯片格局,卻會(huì)改變國內(nèi)AI企業(yè)的選型心態(tài):以前國產(chǎn)算力更多是政策選項(xiàng)和備份選項(xiàng),現(xiàn)在開始成為部分真實(shí)業(yè)務(wù)可以認(rèn)真評(píng)估的主選項(xiàng)。接下來最值得看三件事:V4在昇騰上的真實(shí)線上吞吐能否持續(xù)優(yōu)化;更多開源模型是否會(huì)跟進(jìn)適配;云廠商和政企客戶是否愿意把核心推理負(fù)載長(zhǎng)期放到國產(chǎn)算力上。答案如果逐步變成“是”,國產(chǎn)AI的底座就會(huì)真正熱起來。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
這幅畫把中國美協(xié)釘在恥辱柱上

這幅畫把中國美協(xié)釘在恥辱柱上

深度報(bào)
2026-05-02 21:50:49
黑八!黑八沒了!末節(jié)8分!史上最荒唐季后賽

黑八!黑八沒了!末節(jié)8分!史上最荒唐季后賽

籃球?qū)崙?zhàn)寶典
2026-05-02 10:04:33
“張雪機(jī)車”再奪冠,車手德比斯回應(yīng):比賽中我告訴自己要保持節(jié)奏,后來果然我的輪胎狀態(tài)更好,感謝張雪機(jī)車提供了一輛非常好的賽車

“張雪機(jī)車”再奪冠,車手德比斯回應(yīng):比賽中我告訴自己要保持節(jié)奏,后來果然我的輪胎狀態(tài)更好,感謝張雪機(jī)車提供了一輛非常好的賽車

瀟湘晨報(bào)
2026-05-03 08:16:17
隨著艾倫16-17出局,斯諾克世錦賽決賽對(duì)陣出爐:吳宜澤PK世界第5

隨著艾倫16-17出局,斯諾克世錦賽決賽對(duì)陣出爐:吳宜澤PK世界第5

側(cè)身凌空斬
2026-05-03 06:29:18
瓦倫丁賽后采訪炸了!早上還說車不行,晚上就拿了冠軍

瓦倫丁賽后采訪炸了!早上還說車不行,晚上就拿了冠軍

小娛樂悠悠
2026-05-03 06:28:48
不打了!塔圖姆退出G7!東部季后賽徹底亂套

不打了!塔圖姆退出G7!東部季后賽徹底亂套

籃球?qū)崙?zhàn)寶典
2026-05-03 07:15:51
境外勢(shì)力被披露,知名躺平網(wǎng)紅180度改變,馬上打扮干凈開車?yán)?>
    </a>
        <h3>
      <a href=新游戲大妹子
2026-05-02 12:44:44
史詩失誤!艾倫不敢信:打丟99%網(wǎng)友都能打進(jìn)的賽點(diǎn)球 放生吳宜澤

史詩失誤!艾倫不敢信:打丟99%網(wǎng)友都能打進(jìn)的賽點(diǎn)球 放生吳宜澤

風(fēng)過鄉(xiāng)
2026-05-03 07:08:57
大特務(wù)毛人鳳子女現(xiàn)狀:長(zhǎng)子是富士康董事長(zhǎng),三子是著名愛國華僑

大特務(wù)毛人鳳子女現(xiàn)狀:長(zhǎng)子是富士康董事長(zhǎng),三子是著名愛國華僑

史之銘
2026-05-02 22:37:25
澤連斯基亮出絕密證據(jù):俄內(nèi)部文件泄露,俄軍60%精銳已打殘

澤連斯基亮出絕密證據(jù):俄內(nèi)部文件泄露,俄軍60%精銳已打殘

矚望云霄
2026-05-02 21:15:38
最后一圈連超兩臺(tái)雅馬哈,張雪回應(yīng)“張雪機(jī)車”第3冠:我說牛,誰不服;車手德比斯:感謝車隊(duì)打造了一臺(tái)極具競(jìng)爭(zhēng)力的好車

最后一圈連超兩臺(tái)雅馬哈,張雪回應(yīng)“張雪機(jī)車”第3冠:我說牛,誰不服;車手德比斯:感謝車隊(duì)打造了一臺(tái)極具競(jìng)爭(zhēng)力的好車

極目新聞
2026-05-02 22:56:32
世乒賽出現(xiàn)安檢襲胸丑聞!組委會(huì)初步回應(yīng),中國臺(tái)北教練發(fā)文控訴

世乒賽出現(xiàn)安檢襲胸丑聞!組委會(huì)初步回應(yīng),中國臺(tái)北教練發(fā)文控訴

排球黃金眼
2026-05-03 00:39:21
全民83%反對(duì)!瑞典一場(chǎng)逆天變革,揭開人性最大陷阱

全民83%反對(duì)!瑞典一場(chǎng)逆天變革,揭開人性最大陷阱

爆角追蹤
2026-05-02 21:25:36
“司機(jī)到河南被塞30斤蒜薹”背后:有蒜農(nóng)稱請(qǐng)人抽一斤倒貼幾毛錢,增種、氣溫偏高致供大于求

“司機(jī)到河南被塞30斤蒜薹”背后:有蒜農(nóng)稱請(qǐng)人抽一斤倒貼幾毛錢,增種、氣溫偏高致供大于求

紅星新聞
2026-05-02 21:40:16
足壇瘋狂一夜:阿森納橫掃富勒姆,大巴黎爆冷丟分,巴薩2-1險(xiǎn)勝

足壇瘋狂一夜:阿森納橫掃富勒姆,大巴黎爆冷丟分,巴薩2-1險(xiǎn)勝

足球狗說
2026-05-03 05:19:37
網(wǎng)友爆料:蔣圣龍因?yàn)閮?nèi)臟問題,可能會(huì)選擇退役

網(wǎng)友爆料:蔣圣龍因?yàn)閮?nèi)臟問題,可能會(huì)選擇退役

懂球帝
2026-05-03 08:27:30
強(qiáng)火力覆蓋:車臣網(wǎng)紅軍遭最嚴(yán)重傷亡!伯力爆炸為布查受難者復(fù)仇

強(qiáng)火力覆蓋:車臣網(wǎng)紅軍遭最嚴(yán)重傷亡!伯力爆炸為布查受難者復(fù)仇

鷹眼Defence
2026-05-02 18:14:04
88%中國博士留下建設(shè)美國,550萬在美華人數(shù)據(jù)全公開...

88%中國博士留下建設(shè)美國,550萬在美華人數(shù)據(jù)全公開...

深度報(bào)
2026-05-02 22:15:49
連扳3局逆轉(zhuǎn)!吳宜澤17比16擊敗馬克·艾倫,首次晉級(jí)斯諾克世錦賽決賽,將與肖恩·墨菲爭(zhēng)冠

連扳3局逆轉(zhuǎn)!吳宜澤17比16擊敗馬克·艾倫,首次晉級(jí)斯諾克世錦賽決賽,將與肖恩·墨菲爭(zhēng)冠

環(huán)球網(wǎng)資訊
2026-05-03 06:37:20
李亞鵬香港慈善晚會(huì)請(qǐng)了30家公司,只獲得336萬元善款,王菲力挺

李亞鵬香港慈善晚會(huì)請(qǐng)了30家公司,只獲得336萬元善款,王菲力挺

椰黃娛樂
2026-05-02 12:22:54
2026-05-03 09:56:49
科技見聞Techknow
科技見聞Techknow
追蹤全球科技資訊
117文章數(shù) 73關(guān)注度
往期回顧 全部

科技要聞

庫克罕見"拒答"!蘋果正被AI供應(yīng)鏈卡脖子

頭條要聞

父母正相互拍照6歲孩子墜崖 掉進(jìn)離江面僅50公分夾縫

頭條要聞

父母正相互拍照6歲孩子墜崖 掉進(jìn)離江面僅50公分夾縫

體育要聞

休賽期總冠軍,輪到休斯頓火箭

娛樂要聞

高圓圓趙又廷游三亞 牽手逛街好甜蜜

財(cái)經(jīng)要聞

后巴菲特時(shí)代,首場(chǎng)股東會(huì)透露了啥

汽車要聞

同比大漲190% 方程豹4月銷量29138臺(tái)

態(tài)度原創(chuàng)

數(shù)碼
時(shí)尚
親子
藝術(shù)
軍事航空

數(shù)碼要聞

蘋果Mac mini最低配置調(diào)整為16GB+512GB,起售價(jià)上調(diào)至5999元

春天別總傻傻穿一身黑,看看這些日常穿搭,高級(jí)舒適又優(yōu)雅

親子要聞

被困在陽臺(tái)上的小嬰兒

藝術(shù)要聞

李克強(qiáng)致宋健信儒雅率意,中年鋼筆字果敢,江湖體為何越罵越火

軍事要聞

伊朗公布伊方最新談判方案

無障礙瀏覽 進(jìn)入關(guān)懷版