国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

刷屏!DeepSeek V4成本暴降73%,梁文鋒聯(lián)手華為寒武紀(jì),源神歸位全體起立

0
分享至


智東西
作者 江宇 陳駿達(dá)
編輯 心緣

智東西4月24日?qǐng)?bào)道,今日,DeepSeek正式發(fā)布并開(kāi)源DeepSeek-V4系列預(yù)覽版本,這是其繼V3.2之后的新一代旗艦?zāi)P腕w系,智東西第一時(shí)間上手實(shí)測(cè)。

DeepSeek V4“源神”回歸影響力果然不同凡響,幾乎瞬間刷屏,在微博熱搜榜前五占三,僅次于小米YU7GT。


本次發(fā)布包含兩款模型:DeepSeek-V4-Pro與DeepSeek-V4-Flash,分別采用MoE架構(gòu),總參數(shù)規(guī)模達(dá)到1.6T(激活49B)與284B(激活13B),并統(tǒng)一支持最長(zhǎng)100萬(wàn)token上下文。

DeepSeek官方同時(shí)說(shuō)明,受限于高端算力,目前DeepSeek-V4-Pro的服務(wù)吞吐十分有限,預(yù)計(jì)下半年昇騰950超節(jié)點(diǎn)批量上市后,其價(jià)格會(huì)大幅下調(diào)。此外,DeepSeek-V4已獲得寒武紀(jì)Day 0適配支持,相關(guān)適配代碼已開(kāi)源至GitHub社區(qū)。


DeepSeek-V4-Pro主打性能上限,對(duì)標(biāo)閉源旗艦?zāi)P?/strong>;而DeepSeek-V4-Flash則在參數(shù)規(guī)模與激活規(guī)模上大幅縮小,換取更低延遲與更低成本


相比上一代模型,其在A(yíng)gent能力、世界知識(shí)與復(fù)雜推理任務(wù)上進(jìn)一步抬升,并首次將“百萬(wàn)上下文”作為默認(rèn)能力開(kāi)放。

在A(yíng)gent能力方面,DeepSeek-V4-Pro的Agent能力顯著增強(qiáng)。其在A(yíng)gentic Coding等評(píng)測(cè)中進(jìn)入開(kāi)源第一梯隊(duì),內(nèi)部評(píng)測(cè)顯示交付質(zhì)量已接近Claude Opus 4.6非思考模式,但與其思考模式仍存在差距。

DeepSeek-V4-Pro在數(shù)學(xué)、STEM及競(jìng)賽型代碼等高難度任務(wù)中已超過(guò)當(dāng)前已公開(kāi)評(píng)測(cè)的開(kāi)源模型,整體表現(xiàn)接近甚至比肩GPT-5.4、Claude Opus 4.6-Max等頂級(jí)閉源模型。

與此同時(shí),DeepSeek-V4在長(zhǎng)上下文效率上給出了一組更激進(jìn)的優(yōu)化:在100萬(wàn)token場(chǎng)景下,其單token推理計(jì)算量?jī)H為V3.2的27%,KV Cache占用降至約10%,顯著降低長(zhǎng)鏈路任務(wù)的算力與顯存成本。


同時(shí),官方公布了DeepSeek-V4系列的API定價(jià):DeepSeek-V4-Pro在輸入命中緩存的情況下為1元/百萬(wàn)tokens,輸入未命中緩存則為12元/百萬(wàn)tokens,輸出為24元/百萬(wàn)tokens;DeepSeek-V4-Flash在輸入命中緩存僅0.2元/百萬(wàn)tokens,未命中輸入1元/百萬(wàn)tokens,輸出2元/百萬(wàn)tokens。


目前,DeepSeek-V4系列已上線(xiàn)官網(wǎng)與App,并同步開(kāi)放API與模型權(quán)重。

體驗(yàn)地址:chat.deepseek.com或DeepSeek官方APP
API文檔:https://api-docs.deepseek.com/zh-cn/guides/thinking_mode
開(kāi)源鏈接:
https://huggingface.co/collections/deepseek-ai/deepseek-v4
https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
技術(shù)報(bào)告:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

一、Agentic編程能力提升明顯,讀《三體》三部曲燒了54萬(wàn)token

我們初步感受了下DeepSeek-V4的變化,主要測(cè)試的模型是DeepSeek-V4-Pro。

在前端網(wǎng)頁(yè)one-shot案例中,DeepSeek-V4-Pro展現(xiàn)出很高的執(zhí)行效率。由于我們的需求不復(fù)雜,模型僅用了5秒鐘進(jìn)行思考,之后迅速進(jìn)行開(kāi)發(fā),這與之前DeepSeek模型在思考上浪費(fèi)很多token的模式明顯不同。

進(jìn)入到實(shí)際生成過(guò)程后,DeepSeek-V4-Pro的輸出長(zhǎng)度要明顯長(zhǎng)于其他DeepSeek模型。其生成速度較快,基本能做到以5行代碼為單位輸出。

最終,DeepSeek-V4-Pro的生成結(jié)果如下,可以看到其網(wǎng)頁(yè)的完成度要比DeepSeek-V3.2高一些,設(shè)計(jì)更為豐富。


▲DeepSeek-V4-Pro打造的網(wǎng)站

網(wǎng)站鏈接:https://mcp.edgeone.site/share/9pD1cRzY1QA8bmmBLDZ8S

不過(guò),這樣簡(jiǎn)單的編程題目已經(jīng)難不住DeepSeek-V4-Pro,我們?cè)囍屗瓿梢粋(gè)結(jié)合Agent能力與編程的任務(wù):規(guī)劃一次去上海的旅行,然后把所有相關(guān)信息整合為一個(gè)旅行網(wǎng)站,附上對(duì)應(yīng)的景點(diǎn)定位。

執(zhí)行過(guò)程中,可以看到DeepSeek-V4-Pro可以進(jìn)行復(fù)雜多輪工具調(diào)用,聯(lián)網(wǎng)搜索的條目數(shù)量也和之前模型的數(shù)量相比有增加,信息收集得更為全面了。


最終,DeepSeek-V4-Pro收集到了完整的行程信息,規(guī)劃合理,并且配上了每個(gè)景點(diǎn)的定位,點(diǎn)開(kāi)后就可以直接在導(dǎo)航App里使用,十分便捷。在A(yíng)gent任務(wù)中,可以觀(guān)察到它的行動(dòng)十分果斷,工具調(diào)用、思考都在幾秒鐘內(nèi)解決,token效率不錯(cuò)。


▲DeepSeek使用Agent能力和編程能力規(guī)劃的旅行方案

網(wǎng)站鏈接:https://mcp.edgeone.site/share/4TxFYOy24bgaEwxFoxisj

我們的下一個(gè)案例與長(zhǎng)文本有關(guān),DeepSeek-V4系列模型常常掛在嘴邊的就是它能一口氣吃下《三體》三部曲,而我們?nèi)缢干蟼髁送暾摹度w》。

上傳這樣的超長(zhǎng)文件后,DeepSeek能夠迅速定位我們指定的內(nèi)容,成功實(shí)現(xiàn)大海撈針。不過(guò),這種超長(zhǎng)上下文能力是有代價(jià)的,僅僅輸出這一點(diǎn)內(nèi)容就燒掉了54萬(wàn)個(gè)token。


我們還用“OpenAI更新到了哪一個(gè)模型”這一問(wèn)題,試了試模型的知識(shí)截至日期,可以看到,DeepSeek-V4-Pro的知識(shí)截止日期目前仍然停在2025年。


此外,這一模型應(yīng)該暫時(shí)還不支持視覺(jué)能力,上傳圖像后還是會(huì)進(jìn)行文字提取,沒(méi)有文字的圖像會(huì)顯示無(wú)法處理。


二、百萬(wàn)上下文成標(biāo)配,新架構(gòu)把“長(zhǎng)任務(wù)成本”壓下來(lái)

這一代V4最直接的變化,是把“長(zhǎng)上下文”變成默認(rèn)能力。

不同于傳統(tǒng)通過(guò)簡(jiǎn)單擴(kuò)展窗口的方式,DeepSeek-V4-Pro引入了全新的混合注意力架構(gòu),將Compressed Sparse Attention與高壓縮注意力(HCA)結(jié)合,同時(shí)配合DSA稀疏注意力,在token維度進(jìn)行壓縮。

此外,模型引入了流形約束超連接(mHC)增強(qiáng)傳統(tǒng)殘差連接,并使用Muon優(yōu)化器提升收斂速度和訓(xùn)練穩(wěn)定性。這一系列設(shè)計(jì),使得模型在“記得更長(zhǎng)”的同時(shí),有效控制計(jì)算成本。

從官方給出的數(shù)據(jù)來(lái)看,在100萬(wàn)token上下文下,DeepSeek-V4-Pro單token推理TFLOPs相比DeepSeek-V3.2下降約3.7倍至9.8倍區(qū)間,KV Cache占用下降9.5倍至13.7倍。


這意味著,過(guò)去難以實(shí)際運(yùn)行的超長(zhǎng)鏈路任務(wù)(如多輪Agent規(guī)劃、長(zhǎng)文檔處理),開(kāi)始進(jìn)入可執(zhí)行范圍。

三、推理、知識(shí)、代碼三線(xiàn)抬升,開(kāi)源模型逼近閉源上限

從能力結(jié)構(gòu)來(lái)看,DeepSeek-V4-Pro的提升是推理、知識(shí)與Agent能力的同步抬升。

在知識(shí)與推理類(lèi)任務(wù)中,其在SimpleQA、Apex、Codeforces等評(píng)測(cè)中均超過(guò)當(dāng)前主流開(kāi)源模型,并在多項(xiàng)任務(wù)上接近GPT-5.4與Gemini 3.1 Pro。例如在A(yíng)pex Shortlist中達(dá)到90.2分,已經(jīng)超越頂級(jí)閉源模型;在Codeforces等競(jìng)賽類(lèi)任務(wù)中,也維持在第一梯隊(duì)水平。

在A(yíng)gent能力相關(guān)任務(wù)中,DeepSeek-V4-Pro在SWE Verified、Terminal Bench等指標(biāo)上表現(xiàn)穩(wěn)定,SWE Verified達(dá)到80.6,接近Claude Opus 4.6,明顯高于多數(shù)開(kāi)源模型。其表現(xiàn)同樣超過(guò)GLM-5.1 Thinking、Kimi K2.6 Thinking等模型


整體來(lái)看,DeepSeek-V4-Pro已是目前開(kāi)源模型的“天花板”。

四、Agent能力專(zhuān)項(xiàng)優(yōu)化,開(kāi)始圍繞真實(shí)工作流打磨

這一代DeepSeek-V4明顯強(qiáng)化了對(duì)Agent場(chǎng)景的適配。其針對(duì)Claude Code、OpenClaw、CodeBuddy等主流Agent框架進(jìn)行了專(zhuān)項(xiàng)優(yōu)化,在代碼生成、文檔生成等多步驟任務(wù)中表現(xiàn)更穩(wěn)定。下圖為DeepSeek-V4-Pro在某 Agent框架下生成的PPT內(nèi)頁(yè)示例:


從實(shí)際定位來(lái)看,DeepSeek-V4-Pro已經(jīng)被DeepSeek內(nèi)部作為Agentic Coding模型使用,側(cè)重點(diǎn)在于“完成任務(wù)”。在簡(jiǎn)單任務(wù)上,V4-Flash已可與Pro版本接近,而在復(fù)雜任務(wù)中仍存在明顯差距。

本質(zhì)上是在為Agent應(yīng)用提供兩種“算力檔位”。DeepSeek-V4-Flash在簡(jiǎn)單Agent任務(wù)中已經(jīng)能夠與Pro“旗鼓相當(dāng)”,但在復(fù)雜任務(wù)中仍有差距。這種差異,本質(zhì)上是推理深度與上下文利用能力的差別。

結(jié)語(yǔ):DeepSeek-V4亮相,國(guó)產(chǎn)算力與開(kāi)源路線(xiàn)的落地之光

DeepSeek-V4的發(fā)布不僅展現(xiàn)了團(tuán)隊(duì)在技術(shù)和架構(gòu)上的積淀,也標(biāo)志著開(kāi)源大模型在國(guó)產(chǎn)算力生態(tài)下的實(shí)際落地能力。

經(jīng)過(guò)對(duì)華為昇騰、寒武紀(jì)等國(guó)產(chǎn)芯片的適配優(yōu)化,DeepSeek-V4系列實(shí)現(xiàn)了百萬(wàn)token上下文的穩(wěn)定支持和高效推理,使長(zhǎng)鏈路任務(wù)與多步Agent執(zhí)行成為可能。

這一版本將Pro與Flash的不同定位落到實(shí)處,在性能上逼近閉源旗艦?zāi)P,在成本上保持高性(xún)r(jià)比,為國(guó)內(nèi)開(kāi)發(fā)者提供了前所未有的開(kāi)放選項(xiàng)。

更重要的是,這次發(fā)布顯示出開(kāi)源模型不僅能在全球競(jìng)爭(zhēng)中站穩(wěn)腳跟,也能夠借助國(guó)產(chǎn)算力和優(yōu)化架構(gòu),將技術(shù)潛力轉(zhuǎn)化為實(shí)際可用的生產(chǎn)力。DeepSeek-V4或許是中國(guó)開(kāi)源力量在高性能AI賽道上邁出的關(guān)鍵一步,也為國(guó)內(nèi)AI生態(tài)的創(chuàng)新和落地提供了明確指引。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
李嘉欣現(xiàn)身倫敦街頭被路人偶遇,頂級(jí)骨相美到發(fā)光完全不像55歲

李嘉欣現(xiàn)身倫敦街頭被路人偶遇,頂級(jí)骨相美到發(fā)光完全不像55歲

喜歡歷史的阿繁
2026-04-24 11:57:41
拉賈斯坦邦的沉默突圍:一場(chǎng)關(guān)于信任的實(shí)驗(yàn)

拉賈斯坦邦的沉默突圍:一場(chǎng)關(guān)于信任的實(shí)驗(yàn)

晚風(fēng)也遺憾
2026-04-23 15:46:46
貝克漢姆家終于認(rèn)清現(xiàn)實(shí):兒子都是廢柴,搞錢(qián)還得靠14歲的女兒

貝克漢姆家終于認(rèn)清現(xiàn)實(shí):兒子都是廢柴,搞錢(qián)還得靠14歲的女兒

白露文娛志
2026-04-24 15:10:07
澎湃漫評(píng)|“臥鋪大巴”絕不能死灰復(fù)燃

澎湃漫評(píng)|“臥鋪大巴”絕不能死灰復(fù)燃

澎湃新聞
2026-04-23 19:50:26
三屆MVP就這?戈貝爾扮演約基奇最大克星

三屆MVP就這?戈貝爾扮演約基奇最大克星

體壇周報(bào)
2026-04-24 14:36:13
濟(jì)南市市中區(qū)副區(qū)長(zhǎng)許勝勇,被查

濟(jì)南市市中區(qū)副區(qū)長(zhǎng)許勝勇,被查

魯中晨報(bào)
2026-04-24 16:40:06
5.2米!吉利正式官宣:新車(chē)25.98萬(wàn)起

5.2米!吉利正式官宣:新車(chē)25.98萬(wàn)起

手機(jī)評(píng)測(cè)室
2026-04-24 11:48:54
一幼兒園14名兒童嘔吐、腹瀉 園方稱(chēng)或感染諾如病毒 官方已介入調(diào)查

一幼兒園14名兒童嘔吐、腹瀉 園方稱(chēng)或感染諾如病毒 官方已介入調(diào)查

紅星新聞
2026-04-24 13:11:25
姆巴佩在社交媒體暗戳支持穆里尼奧回歸皇馬后,現(xiàn)任主帥作出回應(yīng)

姆巴佩在社交媒體暗戳支持穆里尼奧回歸皇馬后,現(xiàn)任主帥作出回應(yīng)

夜白侃球
2026-04-24 10:51:37
余承東話(huà)含金量還在上升!日產(chǎn)3月在華新車(chē)銷(xiāo)量增長(zhǎng)23% 靠華為拉爆豐田本田

余承東話(huà)含金量還在上升!日產(chǎn)3月在華新車(chē)銷(xiāo)量增長(zhǎng)23% 靠華為拉爆豐田本田

快科技
2026-04-23 11:56:29
女子大鬧亞航后續(xù):真容傳開(kāi)社死,真實(shí)身份被扒,寫(xiě)保證書(shū)拒認(rèn)錯(cuò)

女子大鬧亞航后續(xù):真容傳開(kāi)社死,真實(shí)身份被扒,寫(xiě)保證書(shū)拒認(rèn)錯(cuò)

阿纂看事
2026-04-24 12:19:35
炸鍋!美部長(zhǎng)當(dāng)眾承認(rèn):中國(guó)一顆H200芯片沒(méi)買(mǎi)

炸鍋!美部長(zhǎng)當(dāng)眾承認(rèn):中國(guó)一顆H200芯片沒(méi)買(mǎi)

林子說(shuō)事
2026-04-23 17:52:16
5月1日起,3萬(wàn)塊就能把老板送進(jìn)去,不明財(cái)產(chǎn)門(mén)檻卻漲到了300萬(wàn)!

5月1日起,3萬(wàn)塊就能把老板送進(jìn)去,不明財(cái)產(chǎn)門(mén)檻卻漲到了300萬(wàn)!

今朝牛馬
2026-04-23 23:23:59
10月7日獲釋的恐怖分子在伯克利教室發(fā)表演講

10月7日獲釋的恐怖分子在伯克利教室發(fā)表演講

老王說(shuō)正義
2026-04-23 23:43:35
直播現(xiàn)場(chǎng)怒罵CEO五分鐘!提詞器都沒(méi)這段,高管臉都綠了

直播現(xiàn)場(chǎng)怒罵CEO五分鐘!提詞器都沒(méi)這段,高管臉都綠了

不寫(xiě)散文詩(shī)
2026-04-23 19:08:22
緊急通知!2026年起,銀行取錢(qián)全部換新,中老年家庭速看避坑!

緊急通知!2026年起,銀行取錢(qián)全部換新,中老年家庭速看避坑!

生活新鮮市
2026-04-24 03:54:14
注意!5月1日起全面嚴(yán)查,這8種行為直接入刑,普通人千萬(wàn)別大意

注意!5月1日起全面嚴(yán)查,這8種行為直接入刑,普通人千萬(wàn)別大意

芳姐侃社會(huì)
2026-04-23 17:24:10
山姆“爆雷”,3億中產(chǎn)炸了!

山姆“爆雷”,3億中產(chǎn)炸了!

新零售參考Pro
2026-04-23 16:31:50
A股:今天,4月24日,加速跳水,釋放了兩個(gè)信息!

A股:今天,4月24日,加速跳水,釋放了兩個(gè)信息!

明心
2026-04-24 11:41:30
民進(jìn)黨發(fā)言人吳崢慌了!

民進(jìn)黨發(fā)言人吳崢慌了!

福建睿平
2026-04-24 13:10:15
2026-04-24 17:59:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專(zhuān)注報(bào)道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)變革。
11680文章數(shù) 117039關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價(jià)格依然"屠夫級(jí)"

頭條要聞

媒體:伊朗將恢復(fù)往返中國(guó)航班 霍爾木茲決戰(zhàn)或收兵了

頭條要聞

媒體:伊朗將恢復(fù)往返中國(guó)航班 霍爾木茲決戰(zhàn)或收兵了

體育要聞

里程碑之戰(zhàn)拖后腿,哈登18分8失誤

娛樂(lè)要聞

停工16個(gè)月!趙露思證實(shí)接拍新劇

財(cái)經(jīng)要聞

19家企業(yè)要"鋁代銅",格力偏不

汽車(chē)要聞

零跑Lafa5 Ultra北京車(chē)展上市:11.88-12.48萬(wàn)

態(tài)度原創(chuàng)

游戲
房產(chǎn)
教育
健康
公開(kāi)課

數(shù)毛社銳評(píng)PS獨(dú)占第一方新作!虛幻5粒子特效天花板

房產(chǎn)要聞

三亞安居房,突然官宣!

教育要聞

山東省“書(shū)香校園”聯(lián)盟成立

干細(xì)胞如何讓燒燙傷皮膚"再生"?

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版