国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek-V4上線:使用華為芯片訓(xùn)練,性能比Gemini差3-6個月,價格優(yōu)勢明顯

0
分享至



出品|搜狐科技

作者鄭松毅 常博碩

編輯| 楊 錦

DeepSeek V4,來了!

OpenAI GPT 5.5 前腳剛發(fā)布,DeepSeek就亮出了“真家伙”。

就在剛剛,DeepSeek-V4的預(yù)覽版本正式上線并同步開源。

據(jù)官方介紹,DeepSeek-V4擁有百萬字超長上下文,在 Agent 能力、世界知識和推理性能上均實現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。模型按大小分為兩個版本:


更具產(chǎn)業(yè)里程碑意義的是,DeepSeek-V4 從模型設(shè)計之初就深度適配國產(chǎn)算力,在華為昇騰芯片生態(tài)實測跑通,成為全球首個在國產(chǎn)算力底座上完成訓(xùn)練與推理的萬億參數(shù)級模型,打破對海外芯片與框架的長期依賴。


性能比肩頂級閉源模型

價格比Claude便宜21倍

官方實測數(shù)據(jù)顯示,DeepSeek-V4-Pro性能比肩頂級閉源模型。


Agent(智能體)能力方面,相比前代模型,DeepSeek-V4-Pro的能力顯著增強。在 Agentic Coding 評測中,V4-Pro 已達(dá)到當(dāng)前開源模型最佳水平,并在其他 Agent 相關(guān)評測中同樣表現(xiàn)優(yōu)異。

DeepSeek介紹,目前 DeepSeek-V4 已成為公司內(nèi)部員工使用的 Agentic Coding 模型,據(jù)評測反饋使用體驗優(yōu)于 Sonnet 4.5,交付質(zhì)量接近 Opus 4.6 非思考模式,但仍與Opus 4.6 思考模式存在一定差距。

DeepSeek給出的結(jié)論相對克制。在知識與推理任務(wù)上,其性能已經(jīng)超過主流開源模型,并接近Gemini等閉源系統(tǒng),但仍存在約3到6個月差距。在 agent和代碼任務(wù)上,其表現(xiàn)接近甚至部分超過Claude Sonnet。

此外,在數(shù)學(xué)、STEM、競賽型代碼的測評中,DeepSeek-V4-Pro超越當(dāng)前所有已公開評測的開源模型(包括月之暗面的K2.6 Thinking、智譜GLM-5.1 Thinking等),取得了比肩世界頂級閉源模型的優(yōu)異成績。


相較之下,DeepSeek-V4-Flash主打性價比,能夠提供更加快捷、經(jīng)濟的 API 服務(wù)。在 Agent 測評中,DeepSeek-V4-Flash 在簡單任務(wù)上與 DeepSeek-V4-Pro 旗鼓相當(dāng),但在高難度任務(wù)上仍有差距。

據(jù)悉,V4-Pro 與 V4-Flash 最大上下文長度為 1M,均同時支持非思考模式與思考模式,其中思考模式支持 reasoning_effort 參數(shù)設(shè)置思考強度(high/max)。對于復(fù)雜的 Agent 場景建議使用思考模式,并設(shè)置強度為 max。使用價格如下:


DeepSeek表示,“受限于高端算力,目前Pro的服務(wù)吞吐十分有限,預(yù)計下半年昇騰950超節(jié)點批量上市后,Pro的價格會大幅下調(diào)?!?/p>

再看看國際友商價格對比,可見DeepSeek的實惠:



混合架構(gòu)解決工程落地痛點

全面適配國產(chǎn)算力

大模型處理超長文本的最大痛點,從來不是 “能不能裝下”,而是跑不動、記不住、算不起。隨著傳統(tǒng)注意力機制呈平方級復(fù)雜度攀升,百萬Token場景下顯存與算力直接 “爆炸”,幾乎無法工程落地。

DeepSeek-V4 的發(fā)布,標(biāo)志著大模型正式走出 “參數(shù)競賽”,進入效率優(yōu)先下一代賽道。

從一口氣審計全量代碼庫、一次性解析千頁合同,到全程記住長時間會議、串聯(lián)多輪復(fù)雜智能體任務(wù),V4讓AI 真正具備“完整理解、長期記憶、深度推理”的能力,同時把使用成本大幅下拉。

這一切得益于DeepSeek業(yè)內(nèi)首創(chuàng)“CSA (壓縮稀疏注意力) + HCA (重度壓縮注意力)”的混合架構(gòu)。用一套“分級壓縮 + 分級檢索”思路,把效率拉到極致。這一新方法顯著減少了計算復(fù)雜度,提升了長上下文處理的效率。


具體來看,CSA像給長文本做重點精讀。先把每 4 個Token壓縮成一個信息塊,再用稀疏檢索只挑最相關(guān)的內(nèi)容,既保留中段細(xì)節(jié),又大幅削減計算量,兼顧精準(zhǔn)與效率。HCA像給長文本做大綱速讀,把海量信息濃縮成框架級塊,專門負(fù)責(zé)全局邏輯。

官方數(shù)據(jù)顯示:1M Token場景下,V4-Pro 僅需 V3.2 的 27% 推理算力、10% KV 緩存;Flash 版更是低至 10% 算力、7% 緩存。

除了混合注意力,V4 還帶來三項關(guān)鍵技術(shù)革新,構(gòu)成完整效率革命:

升級傳統(tǒng)殘差連接,把信號傳播約束在穩(wěn)定流形上,深層不衰減、訓(xùn)練不炸數(shù)值。

Muon 優(yōu)化器替代傳統(tǒng) AdamW,收斂更快、訓(xùn)練更穩(wěn),完美適配 MoE 大模型與低精度訓(xùn)練,解決大批次長上下文訓(xùn)練的抖動難題。

全鏈路工程優(yōu)專家并行細(xì)粒度通信重疊、TileLang 內(nèi)核開發(fā)、FP4 量化感知訓(xùn)練、異構(gòu) KV 緩存管理,從計算、通信、存儲全方位降本提速,推理加速最高近2倍。

最受大家關(guān)心的,是V4這次是否成功全面適配國產(chǎn)算力?

報告指出,DeepSeek-V4在英偉達(dá) GPU 與華為昇騰 NPU 兩大硬件平臺上,對細(xì)粒度 EP 優(yōu)化方案完成了全面驗證。相較于性能優(yōu)異的非融合基線方案,該方案在通用推理負(fù)載場景下可實現(xiàn)1.50~1.73 倍的加速比。

有業(yè)內(nèi)觀點指出,這代表已經(jīng)完成華為昇騰平臺的適配和實測落地。但目前對外開源的只有英偉達(dá)GPU版本,昇騰適配代碼未開源,屬于閉源適配優(yōu)化。

值得一提的是,寒武紀(jì)在軟硬一體生態(tài)中,已經(jīng)完成基于 vLLM 推理框架完成對 285B DeepSeek-V4-flash 和 1.6T DeepSeek-V4-pro 的適配,適配代碼已開源到 GitHub 社區(qū)。

剩下的,就等DeepSeek-V4的實用表現(xiàn)了。還有DeepSeek的首輪融資最終花落誰家,也還是個謎題。

“不誘于譽,不恐于誹,率道而行,端然正己。”

DeepSeek官方在文章最后表示,他們將始終秉持長期主義的原則理念,在嘗試與思考中踏實前行,努力向?qū)崿F(xiàn) AGI 的目標(biāo)不斷靠近?!?/p>




運營編輯 |曹倩審核|孟莎莎




特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
聯(lián)想把充電寶做成"方胖子",349元賣的是什么

聯(lián)想把充電寶做成"方胖子",349元賣的是什么

碳基打工人
2026-04-24 10:19:52
新聞大家應(yīng)該都看到了,10萬億大規(guī)?;瘋铰涞亍?>
    </a>
        <h3>
      <a href=新聞大家應(yīng)該都看到了,10萬億大規(guī)?;瘋铰涞亍?/a> 流蘇晚晴
2026-04-24 19:56:06
噩耗傳來,影響中美的大佬突然逝世,川普派人來華,中方送上大禮

噩耗傳來,影響中美的大佬突然逝世,川普派人來華,中方送上大禮

尋墨閣
2026-04-25 01:18:25
當(dāng)不成總統(tǒng)了?美國四位前總統(tǒng)集體發(fā)聲,打響扳倒特朗普的第一槍

當(dāng)不成總統(tǒng)了?美國四位前總統(tǒng)集體發(fā)聲,打響扳倒特朗普的第一槍

軍機Talk
2026-04-24 12:07:37
中子星有多可怕?每立方厘米重10億噸,最高山峰只有1毫米

中子星有多可怕?每立方厘米重10億噸,最高山峰只有1毫米

觀察宇宙
2026-04-24 18:35:19
本可6-2領(lǐng)先 丁俊暉霸氣K球讓英解說拍案叫絕 失誤多包袱重成隱憂

本可6-2領(lǐng)先 丁俊暉霸氣K球讓英解說拍案叫絕 失誤多包袱重成隱憂

風(fēng)過鄉(xiāng)
2026-04-25 08:52:47
反轉(zhuǎn)了?女子參加泰國潑水節(jié)后口吐白沫昏迷 自稱體內(nèi)檢出疑似“聽話水” 泰國警方通報

反轉(zhuǎn)了?女子參加泰國潑水節(jié)后口吐白沫昏迷 自稱體內(nèi)檢出疑似“聽話水” 泰國警方通報

閃電新聞
2026-04-25 09:29:42
取代伊朗踢世界杯?意大利官員回應(yīng)特朗普特使“損招”:這是恥辱!

取代伊朗踢世界杯?意大利官員回應(yīng)特朗普特使“損招”:這是恥辱!

財聯(lián)社
2026-04-24 10:38:32
1場13-3后,世界冠軍創(chuàng)紀(jì)錄!中國TOP16雙星陪跑,吳宜澤明日登場

1場13-3后,世界冠軍創(chuàng)紀(jì)錄!中國TOP16雙星陪跑,吳宜澤明日登場

劉姚堯的文字城堡
2026-04-25 09:54:40
華誼虧損超82億,不放棄事業(yè)不整容的羅海瓊,才是最清醒的老板娘

華誼虧損超82億,不放棄事業(yè)不整容的羅海瓊,才是最清醒的老板娘

一盅情懷
2026-04-18 08:08:54
萬科“財務(wù)幫”覆滅

萬科“財務(wù)幫”覆滅

地產(chǎn)微資訊
2026-04-24 15:38:07
駐日武官王慶簡:為日本潛伏20年出賣軍事機密,卻因一動作暴露身份

駐日武官王慶簡:為日本潛伏20年出賣軍事機密,卻因一動作暴露身份

睡前講故事
2026-02-03 20:55:43
現(xiàn)金行賄真的查不到?紀(jì)委不靠流水鎖定證據(jù),貪腐者別再癡心妄想

現(xiàn)金行賄真的查不到?紀(jì)委不靠流水鎖定證據(jù),貪腐者別再癡心妄想

芳姐侃社會
2026-04-24 22:35:09
古蒂:穆里尼奧早已不在巔峰水準(zhǔn),不看好他回歸皇馬

古蒂:穆里尼奧早已不在巔峰水準(zhǔn),不看好他回歸皇馬

懂球帝
2026-04-25 07:41:07
DeepSeek-V4和GPT-5.5第一波實測對決,結(jié)果出人意料!

DeepSeek-V4和GPT-5.5第一波實測對決,結(jié)果出人意料!

新智元
2026-04-25 08:21:59
4月底A股“戴帽潮”來襲,一晚九家公司密集發(fā)布風(fēng)險警示

4月底A股“戴帽潮”來襲,一晚九家公司密集發(fā)布風(fēng)險警示

極目新聞
2026-04-25 08:36:34
特朗普推出的移民“金卡”,賣了近5個月僅1人獲批,已從500萬美元降價至100萬!美商務(wù)部長:還有數(shù)百名申請者正在排隊

特朗普推出的移民“金卡”,賣了近5個月僅1人獲批,已從500萬美元降價至100萬!美商務(wù)部長:還有數(shù)百名申請者正在排隊

揚子晚報
2026-04-25 07:22:52
最后時刻簽了,高市將全面梭哈?中日航班已停飛,解放軍準(zhǔn)時出海

最后時刻簽了,高市將全面梭哈?中日航班已停飛,解放軍準(zhǔn)時出海

孤單是寂寞的毒
2026-04-24 16:45:41
針對中國,美歐合伙簽了

針對中國,美歐合伙簽了

觀察者網(wǎng)
2026-04-25 10:25:51
特斯拉 Model Y 新版本現(xiàn)身!值得期待

特斯拉 Model Y 新版本現(xiàn)身!值得期待

花果科技
2026-04-22 15:35:37
2026-04-25 11:23:00
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方賬號
4789文章數(shù) 9186關(guān)注度
往期回顧 全部

科技要聞

Anthropic剛拿亞馬遜250億美元,又拿谷歌400億

頭條要聞

中學(xué)印刷廠廠長被指侵吞324萬利潤 本人堅稱正當(dāng)?shù)美?/h3>

頭條要聞

中學(xué)印刷廠廠長被指侵吞324萬利潤 本人堅稱正當(dāng)?shù)美?/h3>

體育要聞

上海男籃23連勝+主場全勝 姚明之后最強一季

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經(jīng)要聞

別高估英偉達(dá),別低估DeepSeek

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態(tài)度原創(chuàng)

本地
家居
健康
手機
公開課

本地新聞

云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

家居要聞

自然肌理 溫潤美學(xué)

干細(xì)胞如何讓燒燙傷皮膚"再生"?

手機要聞

提升50%,消息稱蘋果iPhone 18標(biāo)準(zhǔn)版配12GB內(nèi)存

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版