国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Deepseek V4第一波測評來了!

0
分享至

DeepSeek V4 預(yù)覽版開源上線后,第一波來自第三方榜單的測評結(jié)果已經(jīng)出爐。多家測評顯示,DeepSeek V4性能尤其在代碼任務(wù)上沖進(jìn)開源第一梯隊(duì),同時以“百萬級上下文+低價”把開發(fā)者側(cè)的使用門檻進(jìn)一步壓低。

從第三方評測來看,評測平臺 Arena.ai 在 X 上將V4 Pro(思考模式)定性為"相較DeepSeek V3.2的重大飛躍",在其代碼競技場中列開源模型第3位、綜合第14位;另一家測評方 Vals AI 則稱,V4在其Vibe Code Benchmark中以"壓倒性優(yōu)勢"拿下開源權(quán)重模型榜首,擊敗Gemini 3.1 Pro等閉源模型,較上代V3.2實(shí)現(xiàn)約10倍性能躍升。


定價層面,V4-Flash輸出價格為每百萬token 0.28美元,較Claude Opus 4.7低逾99%;V4-Pro輸出價格為3.48美元,是同級別前沿模型中定價最低的選項(xiàng)之一。對比表格顯示,F(xiàn)lash 處于小模型區(qū)間最低檔,Pro 也處于“大模型前沿”區(qū)間低位。

圍繞實(shí)際體驗(yàn)的討論開始分化。多位網(wǎng)友在 X 上稱其性價比“打穿”。而DeepSeek在自述材料中則保持克制,稱在知識與推理上接近閉源系統(tǒng)但仍有約3到6個月差距,同時提示“受限于高端算力”,Pro 服務(wù)吞吐有限,后續(xù)價格存在下調(diào)預(yù)期。

第三方測評:代碼能力獨(dú)占鰲頭,綜合排名緊追頂級

就在OpenAI GPT-5.5發(fā)布不久后,DeepSeek-V4預(yù)覽版正式上線并同步開源,涵蓋參數(shù)總量1.6萬億(激活參數(shù)49B)的V4-Pro,以及參數(shù)總量2840億(激活參數(shù)13B)的V4-Flash,兩款模型均支持100萬token超長上下文窗口,采用MIT開源協(xié)議。


模型評測平臺Arena.ai在V4發(fā)布當(dāng)日宣布,DeepSeek V4 Pro(思考模式)在其代碼競技場中排名開源模型第3位,綜合排名第14位,并將此次發(fā)布定性為"相較DeepSeek V3.2的重大飛躍"。Arena.ai同時測試了V4 Flash,兩款模型均支持100萬token上下文。

Vals AI的評測結(jié)果更具看點(diǎn)。該平臺表示,DeepSeek V4在其Vibe Code Benchmark中"以壓倒性優(yōu)勢"成為開源權(quán)重模型第一,不僅超越第2名Kimi K2.6,更擊敗Gemini 3.1 Pro等閉源前沿模型。


Vals AI特別強(qiáng)調(diào),V4較V3.2實(shí)現(xiàn)了約10倍的性能躍升——"V3.2在該基準(zhǔn)上僅得5分,這不是筆誤。"在Vals綜合指數(shù)排名中,V4以第2位收官,與榜首Kimi K2.6僅相差0.07%。


社區(qū)反應(yīng)十分積極。在X平臺上,用戶Sigrid Jin稱其帶來新的“shocking moment”,并提到“現(xiàn)在可以在家里跑 gpt 5.4-ish 的模型”。他寫道:

"GPT-5.5,對不起,DeepSeek V4才是新的震撼時刻,它在代碼競技場中擊敗了GPT-5.4高強(qiáng)度模式。"


用戶Ejaaz則稱:

"中國正在主導(dǎo)AI,他們已經(jīng)追上來了。DeepSeek V4 Flash比Opus 4.7便宜99%,每百萬token僅需0.28美元,代碼競技場排名第一,這不是筆誤。"


也有用戶表達(dá)保留意見,X用戶Michael Anti在試用后表示,V4 Flash的實(shí)際體驗(yàn)未能超越此前已相當(dāng)成熟的V3.2,認(rèn)為對老用戶而言升級體驗(yàn)令人失望。


官方自評:措辭克制,代碼與Agent領(lǐng)域差距最小

DeepSeek對自身性能的評述保持了一貫的審慎風(fēng)格。官方文件顯示,在知識與推理任務(wù)上,V4-Pro已超越主流開源模型,接近Gemini等閉源系統(tǒng),但與最先進(jìn)的前沿模型仍存在約3至6個月的差距。在Agent和代碼任務(wù)上,表現(xiàn)接近甚至部分超過Claude Sonnet。


內(nèi)部使用數(shù)據(jù)方面,DeepSeek表示,V4已成為公司內(nèi)部員工的Agentic Coding(智能體編程)主力模型,評測反饋顯示其使用體驗(yàn)優(yōu)于Claude Sonnet 4.5,交付質(zhì)量接近Opus 4.6非思考模式,但與Opus 4.6思考模式仍有一定差距。

在數(shù)學(xué)、STEM及競賽級代碼評測中,V4-Pro超越目前已公開評測的所有開源模型,包括月之暗面的Kimi K2.6 Thinking和智譜GLM-5.1 Thinking,并取得比肩頂級閉源模型的成績。


博主Simon Willison在其測評文章中指出,V4-Pro(1.6萬億參數(shù))是目前已知最大的開源權(quán)重模型,超過Kimi K2.6(1.1萬億)、GLM-5.1(7540億)以及DeepSeek V3.2(6850億),為有意本地部署的企業(yè)用戶提供了新的選項(xiàng)。

他還曬出了不同模型做出的鵜鶘圖例:

這是DeepSeek-V4-Flash的鵜鶘:

至于DeepSeek-V4-Pro:

價格體系:最低僅為競品1%,下半年仍有進(jìn)一步降價空間

DeepSeek的定價策略是此次發(fā)布中最受市場關(guān)注的部分。V4-Flash的輸入/輸出價格分別為每百萬token 0.14美元/0.28美元,低于OpenAI GPT-5.4 Nano(0.20美元/1.25美元)和Gemini 3.1 Flash-Lite(0.25美元/1.50美元),是目前小型模型中定價最低的選項(xiàng)。

V4-Pro的輸入/輸出價格為1.74美元/3.48美元,同樣低于Gemini 3.1 Pro(2美元/12美元)、GPT-5.4(2.50美元/15美元)、Claude Sonnet 4.6(3美元/15美元)和Claude Opus 4.7(5美元/25美元)。

博主Simon Willison匯總的價格對比數(shù)據(jù)顯示,V4-Pro是目前大型前沿模型中成本最低的選項(xiàng),V4-Flash則是小型模型中成本最低的,甚至低于OpenAI的GPT-5.4 Nano。


DeepSeek將上述低價能力歸因于模型在超長上下文場景下的極致效率優(yōu)化。官方數(shù)據(jù)顯示,在100萬token場景下,V4-Pro的單token推理算力僅為V3.2的27%,KV緩存僅為10%;V4-Flash則分別低至10%和7%。

值得關(guān)注的是,DeepSeek在價格說明中附注稱,"受限于高端算力,目前Pro的服務(wù)吞吐十分有限,預(yù)計下半年昇騰950超節(jié)點(diǎn)批量上市后,Pro的價格會大幅下調(diào)",暗示當(dāng)前定價仍有進(jìn)一步下調(diào)空間。

技術(shù)架構(gòu):混合注意力機(jī)制突破長上下文瓶頸,適配國產(chǎn)算力

DeepSeek-V4的核心技術(shù)創(chuàng)新在于首創(chuàng)的"CSA(壓縮稀疏注意力)+HCA(重度壓縮注意力)"混合注意力架構(gòu),旨在解決傳統(tǒng)注意力機(jī)制在超長上下文場景下呈平方級復(fù)雜度攀升、顯存與算力難以工程落地的行業(yè)痛點(diǎn)。CSA將每4個token壓縮為一個信息塊并通過稀疏檢索獲取最相關(guān)內(nèi)容,在保留中段細(xì)節(jié)的同時大幅降低計算量;HCA則將海量信息濃縮為框架級信息塊,專注全局邏輯處理。


在此之外,V4還引入mHC流形約束超連接(升級傳統(tǒng)殘差連接,將信號傳播約束在穩(wěn)定流形上)以及Muon優(yōu)化器(替代傳統(tǒng)AdamW,適配MoE大模型與低精度訓(xùn)練)。官方數(shù)據(jù)顯示,全鏈路工程優(yōu)化可實(shí)現(xiàn)推理加速最高接近2倍。

在國產(chǎn)算力適配方面,DeepSeek-V4在華為昇騰NPU平臺上完成細(xì)粒度專家并行優(yōu)化方案的全面驗(yàn)證,在通用推理負(fù)載場景下可實(shí)現(xiàn)1.50至1.73倍的加速比。DeepSeek官方表示,V4是全球首個在國產(chǎn)算力底座上完成訓(xùn)練與推理的萬億參數(shù)級模型,但目前昇騰平臺適配代碼暫未對外開源,屬于閉源優(yōu)化。此外,寒武紀(jì)已通過vLLM推理框架完成對V4-Flash和V4-Pro的適配,相關(guān)代碼已開源至GitHub社區(qū)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
一場硬核風(fēng)力實(shí)驗(yàn),一見這屆頂級游戲本散熱有多強(qiáng)?

一場硬核風(fēng)力實(shí)驗(yàn),一見這屆頂級游戲本散熱有多強(qiáng)?

極果酷玩
2026-04-23 23:13:17
26歲女子因常年腳冷,習(xí)慣穿著襪子睡覺,腳趾甲變“千層糕”,最終不得不接受拔甲治療

26歲女子因常年腳冷,習(xí)慣穿著襪子睡覺,腳趾甲變“千層糕”,最終不得不接受拔甲治療

觀威海
2026-04-24 09:12:16
用扣子捏了個“財經(jīng)翻譯官”,最簡單的財報打開方式

用扣子捏了個“財經(jīng)翻譯官”,最簡單的財報打開方式

一點(diǎn)財經(jīng)
2026-04-18 13:56:22
江蘇一女子心血來潮拉出大學(xué)到工作十年賬單,查出爸爸給自己轉(zhuǎn)賬20多萬!本人瞬間破防;網(wǎng)友:默默付出的爸爸

江蘇一女子心血來潮拉出大學(xué)到工作十年賬單,查出爸爸給自己轉(zhuǎn)賬20多萬!本人瞬間破防;網(wǎng)友:默默付出的爸爸

臺州交通廣播
2026-04-24 12:14:39
布達(dá)諾夫撂出狠話:我們將很快讓俄國人大吃一驚!

布達(dá)諾夫撂出狠話:我們將很快讓俄國人大吃一驚!

史政先鋒
2026-04-24 11:28:28
100個能救命的冷知識!關(guān)鍵時刻能保命,建議收藏

100個能救命的冷知識!關(guān)鍵時刻能保命,建議收藏

詩詞天地
2026-04-22 14:06:22
靠貸吃貸,中國銀行大連市分行原副行長曲恒善被開除黨籍

靠貸吃貸,中國銀行大連市分行原副行長曲恒善被開除黨籍

界面新聞
2026-04-24 18:30:41
人社部、財政部通知:支持大學(xué)畢業(yè)生“回爐”讀技校

人社部、財政部通知:支持大學(xué)畢業(yè)生“回爐”讀技校

深度報
2026-04-23 22:43:47
知名歌手因搶不到五一高鐵票取消演唱會!

知名歌手因搶不到五一高鐵票取消演唱會!

深圳晚報
2026-04-23 19:29:44
山東新娘輸液昏迷92天初現(xiàn)意識,當(dāng)?shù)貑予b定程序,丈夫:她沖我笑了,但仍是“睜眼昏迷”狀態(tài);其稱妻子是班里最漂亮女生,正籌備婚禮

山東新娘輸液昏迷92天初現(xiàn)意識,當(dāng)?shù)貑予b定程序,丈夫:她沖我笑了,但仍是“睜眼昏迷”狀態(tài);其稱妻子是班里最漂亮女生,正籌備婚禮

大風(fēng)新聞
2026-04-24 12:03:15
1-6脆??!鄭欽文大崩盤,連輸5局,輸球原因曝光,數(shù)據(jù)一目了然!

1-6脆?。∴崥J文大崩盤,連輸5局,輸球原因曝光,數(shù)據(jù)一目了然!

大秦壁虎白話體育
2026-04-24 17:44:00
陜西一高校演出機(jī)器人突然擁抱女生 校方:女生沒事,系機(jī)器人程序故障

陜西一高校演出機(jī)器人突然擁抱女生 校方:女生沒事,系機(jī)器人程序故障

上游新聞
2026-04-24 15:30:11
清朝一個很特殊的官職,叫“道臺”,幾乎沒人能說清他是干啥的

清朝一個很特殊的官職,叫“道臺”,幾乎沒人能說清他是干啥的

抽象派大師
2026-04-24 12:23:42
刷屏!DeepSeek V4成本暴降73%,梁文鋒聯(lián)手華為寒武紀(jì),源神歸位全體起立

刷屏!DeepSeek V4成本暴降73%,梁文鋒聯(lián)手華為寒武紀(jì),源神歸位全體起立

智東西
2026-04-24 13:08:45
中組部有關(guān)負(fù)責(zé)同志宣布中央決定:陳東明履新

中組部有關(guān)負(fù)責(zé)同志宣布中央決定:陳東明履新

上觀新聞
2026-04-24 17:21:07
京東給年輕人造了一輛轎跑,售價低至12.7萬元

京東給年輕人造了一輛轎跑,售價低至12.7萬元

財天COVER
2026-04-24 10:44:40
俾斯麥海發(fā)生6.3級地震 震源深度10公里

俾斯麥海發(fā)生6.3級地震 震源深度10公里

每日經(jīng)濟(jì)新聞
2024-09-12 06:08:07
特朗普用關(guān)稅搜刮的錢填補(bǔ)軍費(fèi)!是對伊戰(zhàn)爭吃虧了還是唯恐落后中俄?

特朗普用關(guān)稅搜刮的錢填補(bǔ)軍費(fèi)!是對伊戰(zhàn)爭吃虧了還是唯恐落后中俄?

網(wǎng)易新聞出品
2026-04-24 10:23:05
中央紀(jì)委國家監(jiān)委公開通報八起違反中央八項(xiàng)規(guī)定精神典型問題

中央紀(jì)委國家監(jiān)委公開通報八起違反中央八項(xiàng)規(guī)定精神典型問題

新華社
2026-04-24 17:05:33
2:1!約基奇被打成玩具!狂輸44正負(fù)值??!

2:1!約基奇被打成玩具!狂輸44正負(fù)值?。?/a>

柚子說球
2026-04-24 13:18:57
2026-04-24 20:20:49
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領(lǐng)先的金融商業(yè)信息提供商
145121文章數(shù) 2653358關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

參與英國研究的50萬名患者信息在中國售賣 外交部回應(yīng)

頭條要聞

參與英國研究的50萬名患者信息在中國售賣 外交部回應(yīng)

體育要聞

里程碑之戰(zhàn)拖后腿,哈登18分8失誤

娛樂要聞

停工16個月!趙露思證實(shí)接拍新劇

財經(jīng)要聞

LG財閥內(nèi)斗:百億美元商業(yè)帝國爭奪戰(zhàn)

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態(tài)度原創(chuàng)

親子
旅游
本地
公開課
軍事航空

親子要聞

為了讓孩子少看電視,給他安排了這個點(diǎn)珠貼畫,鍛煉孩子動手能力和專注力#益智玩具 #親子手工 #手工d...

旅游要聞

游客西雙版納玩“樹降”,不幸高墜多處骨折送醫(yī),警方介入,當(dāng)?shù)卦擁?xiàng)目已被叫停

本地新聞

云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美伊陷入互相封鎖僵局

無障礙瀏覽 進(jìn)入關(guān)懷版