国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

寒武紀(jì)Day 0適配DeepSeek V4意味著什么

0
分享至


經(jīng)濟(jì)觀察報(bào) 記者 錢玉娟 任曉寧

4月24日,深度求索(DeepSeek)發(fā)布了旗艦?zāi)P蚔4的預(yù)覽版本并同步開源。

已經(jīng)上線的DeepSeek V4模型分為Pro和Flash兩個(gè)版本,Pro版本的參數(shù)為1.6萬億,激活490億,預(yù)訓(xùn)練數(shù)據(jù)33萬億;而Flash版本的參數(shù)為2840億,激活130億,預(yù)訓(xùn)練數(shù)據(jù)32萬億。兩個(gè)版本模型的上下文都是1M(百萬詞元)。

經(jīng)歷了長(zhǎng)達(dá)15個(gè)月的“靜默期”和多次更新傳聞,DeepSeek V4終于亮相。然而,這并非一次輕盈的亮相。

在V4兩個(gè)版本模型對(duì)API訪問的價(jià)格介紹中,DeepSeek用一行小字表明了現(xiàn)實(shí)的骨感:受限于高端算力,目前V4 Pro的服務(wù)吞吐能力有限,預(yù)計(jì)下半年昇騰950超節(jié)點(diǎn)批量上市后,Pro的價(jià)格會(huì)大幅下調(diào)。

隨后,華為計(jì)算發(fā)文表示,昇騰一直同步支持DeepSeek系列模型,本次雙方更是通過芯模技術(shù)協(xié)同,實(shí)現(xiàn)了昇騰超節(jié)點(diǎn)的全系列產(chǎn)品支持DeepSeek V4系列模型。

由華為昇騰代表的國(guó)產(chǎn)高端算力,與DeepSeek的模型算法進(jìn)行協(xié)同適配,不再猶抱琵琶半遮面。

DeepSeek在同步發(fā)出的V4技術(shù)報(bào)告中稱:“我們?cè)谟ミ_(dá)GPU和華為昇騰NPU兩個(gè)平臺(tái)上均驗(yàn)證了細(xì)粒度EP(專家并行)方案?!边@是DeepSeek第一次在正式文檔中把華為昇騰和英偉達(dá)并列寫進(jìn)硬件驗(yàn)證清單。

一位從事大模型研究的高校學(xué)者還是從DeepSeek的小字說明中判斷:“國(guó)產(chǎn)算力支持下的DeepSeek V4大規(guī)模商用仍需時(shí)間?!?/p>

該學(xué)者早就發(fā)現(xiàn)DeepSeek在產(chǎn)品端的算力緊缺。2026年初至今,DeepSeek曾突發(fā)多次服務(wù)中斷,備受關(guān)注的便是3月30日—31日的連續(xù)宕機(jī)事件。

在他看來,DeepSeek在一眾國(guó)產(chǎn)大模型廠商中,以底層工程極限優(yōu)化著稱,即便在產(chǎn)品服務(wù)出現(xiàn)宕機(jī)風(fēng)險(xiǎn)時(shí),也未公開提及其在芯片等物理設(shè)備方面的缺口問題,而今在新模型亮相之初就袒露算力受限,一定程度上揭示了國(guó)產(chǎn)模型廠商在國(guó)產(chǎn)算力適配上存在著陣痛。

Day 0適配

一位與DeepSeek有模型服務(wù)合作的供應(yīng)商人士認(rèn)為,V4之所以姍姍來遲,深層原因在于算力架構(gòu)的重構(gòu)。

AI開源社區(qū)與模型托管平臺(tái)Hugging Face的亞太生態(tài)負(fù)責(zé)人王鐵震指出,目前各家國(guó)產(chǎn)大模型都在積極展開國(guó)產(chǎn)算力適配,而DeepSeek在過去超一年時(shí)間的V4研發(fā)中,也在試圖大規(guī)模采用國(guó)產(chǎn)芯片替代方案。眼下,DeepSeek除了持續(xù)推進(jìn)與華為昇騰算力的適配,還與包括寒武紀(jì)、沐曦等在內(nèi)的眾多國(guó)產(chǎn)算力廠商展開適配。

王鐵震透露,行業(yè)內(nèi)尤其關(guān)注國(guó)產(chǎn)大模型與國(guó)產(chǎn)算力是否達(dá)到“Day 0”適配。

“Day 0 相當(dāng)于大模型上線的當(dāng)天,算力已完成全鏈路兼容、性能優(yōu)化、穩(wěn)定性驗(yàn)證。開發(fā)者開箱即用,零等待、零額外適配即可直接訓(xùn)練/推理該模型?!币晃粐?guó)產(chǎn)芯片廠商內(nèi)部人士透露,過去只有英偉達(dá)的算力芯片能做到與各家模型的Day 0適配,其他GPU往往要滯后數(shù)月。

就在DeepSeek V4官方信息發(fā)布后,寒武紀(jì)通過其官方公眾號(hào)表示,已基于vLLM 推理框架完成對(duì)DeepSeek V4已上線兩個(gè)模型版本的Day 0適配。

寒武紀(jì)與DeepSeek最新模型完成Day 0適配,意味著國(guó)產(chǎn)GPU已經(jīng)具備了與英偉達(dá)高端算力芯片同等的生態(tài)響應(yīng)速度。而前述國(guó)產(chǎn)芯片廠商內(nèi)部人士表示,其所在廠商也在與DeepSeek V4進(jìn)行產(chǎn)品適配。在此之前,已經(jīng)完成與十幾個(gè)國(guó)產(chǎn)大模型的Day 0適配。

今年初,電信天翼云自主研發(fā)的“息壤”智算平臺(tái)宣布完成了國(guó)產(chǎn)算力芯片與DeepSeek V3系列大模型的深度適配優(yōu)化,伴隨DeepSeek的模型迭代與更新,智算平臺(tái)的優(yōu)化適配也在進(jìn)行中。

聚焦中國(guó)AI市場(chǎng),國(guó)產(chǎn)大模型此前多依賴英偉達(dá)CUDA生態(tài),而今算法要全面適配國(guó)產(chǎn)算力,需要對(duì)底座架構(gòu)進(jìn)行重構(gòu)。

前述大模型研究學(xué)者與國(guó)產(chǎn)芯片廠商內(nèi)部人士有個(gè)共識(shí),算力自主可控是必然趨勢(shì),他們將上述芯模技術(shù)底層的重構(gòu)理解為“算力平替”的過程。從DeepSeek V4耗時(shí)長(zhǎng)達(dá)一年多的研發(fā)進(jìn)程,不難窺見這個(gè)過程的艱難。

“不只是簡(jiǎn)單的代碼遷移,MoE(混合專家模型)架構(gòu)在國(guó)產(chǎn)芯片上的通信延遲優(yōu)化是世界級(jí)難題。”某頭部模型廠商的技術(shù)工程師分析,DeepSeek選擇在此時(shí)坦承吞吐有限,本質(zhì)上也是在等待國(guó)產(chǎn)芯片“超節(jié)點(diǎn)”范式的成熟。

多模態(tài)缺失

4月24日上午,在DeepSeek V4預(yù)覽版上線后,不僅半導(dǎo)體芯片國(guó)產(chǎn)替代板塊個(gè)股大漲,與國(guó)產(chǎn)算力及DeepSeek相關(guān)的概念股均出現(xiàn)異動(dòng)。

截至收盤,寒武紀(jì)(688256.SH)報(bào)1352.5元/股,漲超2.2%。同步走強(qiáng)的還有相關(guān)概念股,像龍芯中科(688047.SH)收盤報(bào)153.86元/股,同樣漲超2個(gè)點(diǎn)。以主營(yíng)大數(shù)據(jù)服務(wù)及數(shù)據(jù)安全的拓爾思(300229.SZ),作為DeepSeek概念股,在24日午前漲至18.9元/股,僅短短5分鐘后便出現(xiàn)下跌,跌幅超過2%?。收盤報(bào)18.34元/股,較當(dāng)日開盤價(jià)漲幅不及1%。

前述頭部模型廠商技術(shù)工程師認(rèn)為,此前傳聞DeepSeek V4會(huì)有多模態(tài)版本,可以具備支持圖片、視頻理解與生成等能力,而今上線的預(yù)覽版本能力,依然固守文本生成與推理領(lǐng)域。

形成鮮明對(duì)比的是,就在DeepSeek V4上線的前幾個(gè)小時(shí),OpenAI發(fā)布了新一代大模型GPT-5.5,其能力展示中特別突出了對(duì)工具調(diào)用的多模態(tài)視覺理解能力。

即使不對(duì)標(biāo)GPT、Gemini等海外頭部模型,在2026年的國(guó)產(chǎn)大模型戰(zhàn)場(chǎng)上,阿里千問、騰訊混元等均已實(shí)現(xiàn)“全模態(tài)一體化”。而V4已上線的兩個(gè)模型版本仍走單模態(tài)路線,前述頭部模型廠商技術(shù)工程師推測(cè),DeepSeek在多模態(tài)識(shí)別能力上或出現(xiàn)短板。

“多模態(tài)需要指數(shù)級(jí)的算力和更復(fù)雜的數(shù)據(jù)工程?!彼J(rèn)為,這極為考驗(yàn)?zāi)P蛷S商的生態(tài)布局。他所在的頭部大廠不斷挖角DeepSeek的技術(shù)人才?!拔覀儓F(tuán)隊(duì)的數(shù)據(jù)負(fù)責(zé)人就來自DeepSeek?!?/p>

這種核心人才的流失是令人擔(dān)憂的。多位受訪者確信DeepSeek在國(guó)產(chǎn)模型第一梯隊(duì)中的技術(shù)護(hù)城河,但也提出,繼核心科學(xué)家羅福莉入職小米、郭達(dá)雅轉(zhuǎn)投字節(jié)跳動(dòng)后,內(nèi)部負(fù)責(zé)核心數(shù)據(jù)工程、多模態(tài)預(yù)訓(xùn)練的關(guān)鍵人士流失,或令其模型在多模態(tài)能力開發(fā)創(chuàng)新方面遇到更大困難。

前述模型技術(shù)工程師分析,模型缺乏多模態(tài)識(shí)別能力或?qū)⒁馕吨搹S商錯(cuò)失大量實(shí)時(shí)視頻交互、視覺分析等高價(jià)值商業(yè)場(chǎng)景。

V4預(yù)覽版的發(fā)布,讓市場(chǎng)看到了國(guó)產(chǎn)模型與算力在底層架構(gòu)上的協(xié)同進(jìn)展,但這并不意味著DeepSeek可以松口氣。在大模型萬億參數(shù)和全模態(tài)競(jìng)爭(zhēng)的當(dāng)下,它還需要交出一份答卷,在下半年昇騰950超節(jié)點(diǎn)到位前,頂著多模態(tài)應(yīng)用技術(shù)的壓力,它的模型服務(wù)、產(chǎn)品迭代,甚至是人才組織架構(gòu),能否保持穩(wěn)定。

前述模型技術(shù)工程師透露,在騰訊、阿里等巨頭有意與DeepSeek接洽首輪外部融資事宜外,近期數(shù)家推動(dòng)國(guó)產(chǎn)替代相關(guān)動(dòng)作的國(guó)資型產(chǎn)業(yè)投資基金,也在與DeepSeek展開深度洽談。在其看來,研發(fā)進(jìn)度緩慢的DeepSeek,在算力資源之外,也對(duì)外來資金表現(xiàn)出極度渴求。

(作者 錢玉娟)

免責(zé)聲明:本文觀點(diǎn)僅代表作者本人,供參考、交流,不構(gòu)成任何建議。


錢玉娟

TMT新聞部記者 長(zhǎng)期關(guān)注并報(bào)道TMT領(lǐng)域的重大事件,時(shí)刻保持新聞敏感,發(fā)現(xiàn)前沿趨勢(shì)。擅長(zhǎng)企業(yè)模式、人物專訪及行業(yè)深度報(bào)道。 重要新聞線索可聯(lián)系qianyujuan@eeo.com.cn 微信號(hào):EstherQ138279

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
大疆創(chuàng)始人汪滔消失十年,如今露面爆內(nèi)情,大疆年賺800億太亮眼

大疆創(chuàng)始人汪滔消失十年,如今露面爆內(nèi)情,大疆年賺800億太亮眼

夢(mèng)錄的西方史話
2026-04-24 14:27:18
06年我軍潛艇在美軍航母前自殺性上浮,老兵淚流滿面:一雪前恥了

06年我軍潛艇在美軍航母前自殺性上浮,老兵淚流滿面:一雪前恥了

干史人
2024-09-15 08:00:03
賺了40億的超級(jí)牛散

賺了40億的超級(jí)牛散

賴博士說
2026-03-21 20:11:22
轟的一聲,日本傳來一聲巨大爆響,自衛(wèi)隊(duì)傷亡慘重,尸體橫倒豎臥

轟的一聲,日本傳來一聲巨大爆響,自衛(wèi)隊(duì)傷亡慘重,尸體橫倒豎臥

青煙小先生
2026-04-24 09:55:09
白宮90后新聞秘書萊維特被指徹底放棄操守睜眼說瞎話

白宮90后新聞秘書萊維特被指徹底放棄操守睜眼說瞎話

掉了顆大白兔糖
2026-04-24 21:25:00
華誼兄弟正式破產(chǎn)

華誼兄弟正式破產(chǎn)

新浪財(cái)經(jīng)
2026-04-24 16:12:14
“見過最廉價(jià)的兜底”,一份山姆燒雞,讓低認(rèn)知母子淪為全網(wǎng)笑柄

“見過最廉價(jià)的兜底”,一份山姆燒雞,讓低認(rèn)知母子淪為全網(wǎng)笑柄

妍妍教育日記
2026-04-15 09:30:09
路易王子8歲啦!威廉凱特曬海邊慶生照,門牙漏風(fēng)笑翻全網(wǎng)

路易王子8歲啦!威廉凱特曬海邊慶生照,門牙漏風(fēng)笑翻全網(wǎng)

手工制作阿殲
2026-04-24 17:22:41
太解氣!單親媽媽被同行惡意“截胡”,全城排隊(duì)替她“復(fù)仇”

太解氣!單親媽媽被同行惡意“截胡”,全城排隊(duì)替她“復(fù)仇”

青梅侃史啊
2026-04-21 19:37:02
如果一個(gè)家庭長(zhǎng)期沒酒局、沒社交,也少走親戚,只能說明一個(gè)問題

如果一個(gè)家庭長(zhǎng)期沒酒局、沒社交,也少走親戚,只能說明一個(gè)問題

大熊歡樂坊
2026-04-19 12:07:22
“千山翠”再現(xiàn),比亞迪旗艦大唐重磅發(fā)布,第三代元PLUS全面升級(jí)

“千山翠”再現(xiàn),比亞迪旗艦大唐重磅發(fā)布,第三代元PLUS全面升級(jí)

光電科技君
2026-04-24 08:11:06
成都天府新區(qū)投資集團(tuán)兩任董事長(zhǎng)被查

成都天府新區(qū)投資集團(tuán)兩任董事長(zhǎng)被查

界面新聞
2026-04-24 17:46:03
34歲女神裁判波娃抽煙照曝光!大量中國(guó)男球迷脫粉,濾鏡碎了

34歲女神裁判波娃抽煙照曝光!大量中國(guó)男球迷脫粉,濾鏡碎了

喜歡歷史的阿繁
2026-04-24 18:13:27
“最佳空腹血糖”是多少?建議:過63歲以后,血糖最好控制這范圍

“最佳空腹血糖”是多少?建議:過63歲以后,血糖最好控制這范圍

醫(yī)學(xué)科普匯
2026-04-24 20:20:03
墮落的“清純女星”酒井法子,這張腿間蝴蝶背后,隱藏著的故事

墮落的“清純女星”酒井法子,這張腿間蝴蝶背后,隱藏著的故事

七阿姨愛八卦
2026-03-29 10:12:33
注意!北京多區(qū)發(fā)布雷電藍(lán)警!有雷陣雨+6級(jí)陣風(fēng)→

注意!北京多區(qū)發(fā)布雷電藍(lán)警!有雷陣雨+6級(jí)陣風(fēng)→

BRTV新聞
2026-04-24 16:17:04
國(guó)際原油短線跳水 抹去之前漲幅

國(guó)際原油短線跳水 抹去之前漲幅

財(cái)聯(lián)社
2026-04-24 19:12:06
35歲女子去做私處緊縮,縫針斷在肉里,醫(yī)生徒手掏了半小時(shí)沒找著

35歲女子去做私處緊縮,縫針斷在肉里,醫(yī)生徒手掏了半小時(shí)沒找著

網(wǎng)絡(luò)易不易
2026-04-21 12:45:10
毛主席緊急離開武漢,空軍竟不放行,楊成武:不認(rèn)我這個(gè)代總長(zhǎng)?

毛主席緊急離開武漢,空軍竟不放行,楊成武:不認(rèn)我這個(gè)代總長(zhǎng)?

驚視
2026-04-24 07:32:15
寧夏一位36歲女博士未婚未育,吐槽無人問津:已徹底放棄結(jié)婚!

寧夏一位36歲女博士未婚未育,吐槽無人問津:已徹底放棄結(jié)婚!

番外行
2026-04-23 07:43:15
2026-04-25 00:04:49
經(jīng)濟(jì)觀察報(bào) incentive-icons
經(jīng)濟(jì)觀察報(bào)
經(jīng)濟(jì)觀察報(bào)是專注于財(cái)經(jīng)新聞與經(jīng)濟(jì)分析的全國(guó)性綜合財(cái)經(jīng)類媒體。聚焦商道、商技和商機(jī)。
114259文章數(shù) 1606738關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價(jià)格依然"屠夫級(jí)"

頭條要聞

航班提前起飛10分鐘 大學(xué)生把海航告了

頭條要聞

航班提前起飛10分鐘 大學(xué)生把海航告了

體育要聞

上海男籃23連勝+主場(chǎng)全勝 姚明之后最強(qiáng)一季

娛樂要聞

停工16個(gè)月!趙露思證實(shí)接拍新劇

財(cái)經(jīng)要聞

LG財(cái)閥內(nèi)斗:百億美元商業(yè)帝國(guó)爭(zhēng)奪戰(zhàn)

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態(tài)度原創(chuàng)

本地
藝術(shù)
房產(chǎn)
數(shù)碼
公開課

本地新聞

云游中國(guó)|逛世界風(fēng)箏都 留學(xué)生探秘中國(guó)傳統(tǒng)文化

藝術(shù)要聞

停工一年多,南京500米第一高樓終于有動(dòng)靜了?方案要改!

房產(chǎn)要聞

新一輪教育大爆發(fā)來了!???,開始瘋狂建學(xué)校!

數(shù)碼要聞

索尼英縱Buds“游戲豆”冰透紫耳機(jī)發(fā)售,首發(fā)價(jià)1079元

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版