国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek V4爆春節(jié)登場!四大殺招突襲全球編程王座,Claude危

0
分享至

  

  新智元報道

  編輯:桃子 定慧

  【新智元導(dǎo)讀】DeepSeek春節(jié)憋大招,V4要當「編程之神」!一個月后代碼圈變天?

  每逢假期,必發(fā)新品。

  Information爆料稱,DeepSeek將計劃在2月中旬,也正是春節(jié)前后,正式發(fā)布下一代V4模型。

  

  而這一次,所有目光都聚焦在同一維度上——編程能力。

  目標:編程之王。

  據(jù)稱,DeepSeek V4編程實力可以趕超Claude、GPT系列等頂尖閉源模型。

  要知道,如今Claude是全網(wǎng)公認的編程王者,真要擊敗了它,那可真不是小事兒。

  

  毫無疑問,V4是繼去年12月V3的重大迭代版,但內(nèi)部測試者普遍反饋:

  這不是一次常規(guī)的升級,而是一次質(zhì)的跨越。

  復(fù)刻R1春節(jié)核爆,全網(wǎng)期待值拉滿

  此次發(fā)布時間的選擇,同樣意味深長。

  還記得,去年1月20日,恰逢春節(jié)前夕,DeepSeek R1重磅出世,在全網(wǎng)掀起了巨震。

  R1的上線,最終被證明是教科書級的節(jié)奏:討論密度、傳播強度、社區(qū)反饋,全部被拉到了峰值。

  或許這一次,DeepSeek希望再次復(fù)刻這種「時間窗口效應(yīng)」。

  回看過去一年,DeepSeek的發(fā)展軌跡,其實已經(jīng)給出一條清晰的敘事線:

  DeepSeek V3嶄露頭角,讓國際開發(fā)者第一次正眼看這個來自中國的團隊。

  DeepSeek R1才是真正引爆的那個點。

  一款開源「推理」模型,把「先思考、再作答」變成顯性過程,用相對克制的訓(xùn)練成本,實現(xiàn)了復(fù)雜問題上的驚人穩(wěn)定性。

  這種「性價比反差」,直接擊中了硅谷最敏感的那根神經(jīng)。

  

  隨后,DeepSeek在國內(nèi),推出了由R1+V3加持的聊天應(yīng)用,短時間內(nèi)成為了現(xiàn)象級應(yīng)用。

  接下來的一年中,DeepSeek進行了多次模型版本迭代,比如V3.1、V3.2,智能體能力植入等等。

  進入2025年,開源早已成為整個行業(yè)最大共識。

  中國大廠與初創(chuàng)公司密集發(fā)布和開源,中國AI的存在感被整體抬升了一個量級,被視為全球開源AI領(lǐng)導(dǎo)力量之一。

  上個月,DeepSeek V3.2出世,在部分基準測試上碾壓GPT-5、Gemini 3.0 Pro。

  這是DeepSeek在一直未推出真正意義上的重大換代模型的情況下,實現(xiàn)的反超。

  

  也正因如此,V4被賦予了比以往任何一次迭代都更高的期待。

  劍指編程王座,四大突破曝光

  從目前流出的信息來看,DeepSeek V4在以下四個關(guān)鍵方向上,實現(xiàn)了核心突破,或?qū)⒏淖冇螒蛞?guī)則。

  編程能力:劍指Claude王座

  2025開年,Claude一夜之間成為公認的編程之王。無論是代碼生成、調(diào)試還是重構(gòu),幾乎沒有對手。

  但現(xiàn)在,這個格局可能要變了。

  知情人士透露,DeepSeek內(nèi)部的初步基準測試顯示,V4在編程任務(wù)上的表現(xiàn)已經(jīng)超越了目前的主流模型,包括Claude系列、GPT系列。

  如果消息屬實,DeepSeek將從追趕者一步躍升為領(lǐng)跑者——至少在編程這個AI應(yīng)用最核心的賽道上。

  超長上下文代碼處理:工程師的終極利器

  V4的另一個技術(shù)突破在于,處理和解析極長代碼提示詞的能力。

  對于日常寫幾十行代碼的用戶來說,這可能感知不強。但對于真正在大型項目中工作的軟件工程師來說,這是一個革命性的能力。

  想象一下:你有一個幾萬行代碼的項目,你需要AI理解整個代碼庫的上下文,然后在正確的位置插入新功能、修復(fù)bug或者進行重構(gòu)。以前的模型往往會忘記之前的代碼,或者在長上下文中迷失方向。

  V4在這個維度上取得了技術(shù)突破,能夠一次性理解更龐大的代碼庫上下文。

  這對于企業(yè)級開發(fā)來說,是真正的生產(chǎn)力革命。

  算法提升,不易出現(xiàn)衰減

  據(jù)透露,V4在訓(xùn)練過程的各個階段,對數(shù)據(jù)模式的理解能力也得到了提升,并且不容易出現(xiàn)衰減。

  AI訓(xùn)練需要模型從海量數(shù)據(jù)集中反復(fù)學(xué)習(xí),但學(xué)到的模式/特征可能會在多輪訓(xùn)練中逐漸衰減。

  通常來說,擁有大量AI芯片儲備的開發(fā)者可以通過增加訓(xùn)練輪次來緩解這一問題。

  推理能力提升:更嚴密、更可靠

  知情人士還透露了一個關(guān)鍵細節(jié):用戶會發(fā)現(xiàn)V4的輸出在邏輯上更加嚴密和清晰。

  這不是一個小改進。這意味著模型在整個訓(xùn)練流程中對數(shù)據(jù)模式的理解能力有了質(zhì)的提升,而且更重要的是——性能沒有出現(xiàn)退化。

  在AI模型的世界里,沒有退化是一個非常高的評價。很多模型在提升某些能力時,會不可避免地犧牲其他維度的表現(xiàn)。

  V4似乎找到了一個更優(yōu)的平衡點。

  最近一周,CEO梁文鋒參與合著的一篇論文,也透露出一些線索:

  他們提出了一種全新的訓(xùn)練架構(gòu),在無需按比例增加芯片數(shù)量的情況下,可以Scaling更大規(guī)模的模型。

  

  論文地址:https://arxiv.org/pdf/2512.24880

  技術(shù)溯源

  從V3到V4,DeepSeek做對了什么?

  要理解V4可能有多強,我們需要先回顧DeepSeek過去一年的技術(shù)積淀。

  MoE架構(gòu):用更少的計算做更多的事

  DeepSeek-V3的核心技術(shù)優(yōu)勢在于其創(chuàng)新的MoE(混合專家)架構(gòu)。

  V3擁有高達6710億的總參數(shù),但推理時每個token只激活約370億參數(shù)。

  這種稀疏激活機制讓模型在保持超大規(guī)模的同時,維持了極高的推理效率。

  更重要的是,DeepSeek改進了傳統(tǒng)MoE模型的訓(xùn)練方法,采用「細粒度專家+通才專家」的策略——使用大量小型專家而非少數(shù)大型專家,更好地逼近連續(xù)的多維知識空間。

  

  MLA:讓推理更快、更省內(nèi)存

  另一個關(guān)鍵技術(shù)是MLA(多頭潛在注意力)機制

  這項技術(shù)從V2就開始引入,通過將鍵(Key)和值(Value)張量壓縮到低維空間,大幅減少推理時的KV緩存和內(nèi)存占用。

  

  研究表明,MLA在建模性能上優(yōu)于傳統(tǒng)的分組查詢注意力(GQA),這是DeepSeek能夠在有限硬件條件下實現(xiàn)高性能的關(guān)鍵。

  R1強化學(xué)習(xí)經(jīng)驗

  2025年1月發(fā)布的DeepSeek-R1是一個由強化學(xué)習(xí)驅(qū)動的推理模型,其核心技術(shù)后來被融合到了更新版的V3中。

  這里有一個關(guān)鍵信息:V4很可能繼承了R1在強化學(xué)習(xí)方面的所有優(yōu)化經(jīng)驗。

  如果說V3是「基礎(chǔ)能力」,R1是「推理能力」,那么V4很可能是兩者的完美融合——基礎(chǔ)能力+強化學(xué)習(xí)優(yōu)化+編程專項突破。

  而且不要忘了剛剛發(fā)布的新論文mHC。

  mHC:解決大模型訓(xùn)練的根本性約束

  就在2025年12月31日,也就是V4爆料前不久,DeepSeek悄悄發(fā)布了一篇重磅論文:《mHC:Manifold-Constrained Hyper-Connections》(流形約束超連接)。

  

  這篇論文解決了一個困擾AI行業(yè)十年之久的難題:大模型訓(xùn)練的不穩(wěn)定性問題。

  核心思想是什么?

  在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,信號在層與層之間傳遞時會出現(xiàn)放大效應(yīng)——在不受約束的情況下,信號可能被放大3000倍

  這種失控的放大會導(dǎo)致訓(xùn)練崩潰、梯度爆炸等一系列問題,是阻礙大模型規(guī)?;母拘云款i之一。

  mHC的解決方案是:利用Sinkhorn-Knopp算法,將神經(jīng)網(wǎng)絡(luò)的連接矩陣投影到一個數(shù)學(xué)流形上,從而精確控制信號放大。結(jié)果:信號放大被壓縮到僅1.6倍。

  實際效果有多強?

  - 在BIG-BenchHard推理基準上提升了2.1%

  - 僅增加6.7%的訓(xùn)練開銷

  - 在高達270億參數(shù)的模型上得到驗證

  業(yè)內(nèi)專家評價:這項研究可能重塑整個行業(yè)構(gòu)建基礎(chǔ)模型的方式。它解決了一個限制大語言模型架構(gòu)創(chuàng)新的根本性約束。

  可以看出,DeepSeek一直在進行底層算法優(yōu)化、數(shù)學(xué)工程優(yōu)化,但不要忘了更重要的一件事:

  這些優(yōu)化都是在「限制之下」完成的,這也正是DeepSeek的厲害之處。

  硬件限制下的算法突破

  這才是真正的故事

  在討論V4時,有一個背景不能忽視:芯片出口限制。

  外媒的報道特別提到,盡管面臨芯片出口限制,DeepSeek依然在算法效率上取得了進展。這與其V3/R1系列的高性價比路線一致。

  還記得V3的訓(xùn)練成本嗎?約557.6萬美元。

  這個數(shù)字在當時震驚了整個AI行業(yè),因為它遠低于其他同級別模型——OpenAI和Google的訓(xùn)練成本往往是這個數(shù)字的幾十倍。

  DeepSeek用更少的資源做出更好的模型,這不是偶然,而是算法、框架和硬件協(xié)同優(yōu)化的結(jié)果。

  V4很可能延續(xù)這一路線:不拼硬件數(shù)量,而是拼算法效率。

  如果V4真的在受限硬件條件下實現(xiàn)了超越Claude的編程能力,這將是一個極具象征意義的里程碑——

  證明在AI競賽中,聰明的算法可以彌補硬件的不足。

  懸念:V4還會有哪些驚喜?

  根據(jù)目前的信息,我們已經(jīng)知道V4在編程能力、長上下文處理、推理嚴密性三個維度上有顯著提升。

  但DeepSeek向來有低調(diào)憋大招的傳統(tǒng)。

  以下是幾個值得關(guān)注的懸念:

  1.是否會有蒸餾版本?

  DeepSeek-R1發(fā)布時,同時推出了一系列蒸餾版本,讓更多用戶可以在消費級硬件上體驗強化學(xué)習(xí)推理模型。

  V4是否會延續(xù)這一策略?

  2.多模態(tài)能力如何?

  目前的報道主要聚焦于編程能力,但V4在多模態(tài)(圖像、音頻等)方面是否有提升?這是一個未知數(shù)。

  3.API定價會有驚喜嗎?

  DeepSeek一直走極致性價比路線。

  如果V4的編程能力真的超越Claude,但價格只有Claude的幾分之一,那將是對整個市場的巨大沖擊。

  4.開源策略會變嗎?

  V3和R1都在MIT許可下開源。

  V4是否會延續(xù)這一策略?V5、V6呢,DeepSeek會一直開源下去嗎?

  考慮到編程領(lǐng)域的商業(yè)價值,這是一個值得觀察的變量。

  LMArena上的神秘身影:V4已經(jīng)在野測了?

  如果說以上都是內(nèi)部消息,那么有一個線索可能暗示V4比我們想象的更接近:

  有用戶在LMArena(大模型競技場)上發(fā)現(xiàn)了匿名模型,據(jù)說就是V4。

  有人已經(jīng)在LMArena上發(fā)現(xiàn)匿名模型,據(jù)說就是V4。

  

  但由于模型會「撒謊」,還無法最終確認。

  

  這是一個值得密切關(guān)注的信號。

  如果The Information的報道屬實,那么我們只需要再等不到一個月的時間。

  屆時,它是否能真正超越Claude成為編程之王?

  敬請期待。

  參考資料:

  https://x.com/jukan05/status/2009616683607179726

  https://www.theinformation.com/articles/deepseek-release-next-flagship-ai-model-strong-coding-ability?rc=lx3hes

  https://www.reddit.com/r/LocalLLaMA/comments/1q88hdc/the_information_deepseek_to_release_next_flagship/

  https://www.reddit.com/r/LocalLLaMA/comments/1q89g1i/deepseek_v4_coming/

  https://x.com/jukan05/status/2009617025933656436?s=20

  https://www.theinformation.com/articles/deepseek-release-next-flagship-ai-model-strong-coding-ability

  https://economictimes.indiatimes.com/tech/artificial-intelligence/deepseek-to-launch-new-ai-model-focused-on-coding-in-february-report/articleshow/126438150.cms?from=mdr

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
史無前例!資金大挪移開始了

史無前例!資金大挪移開始了

大貓財經(jīng)Pro
2026-01-12 19:19:00
女人染上“性癮”是一種怎樣的體驗?可能和你想象得不同

女人染上“性癮”是一種怎樣的體驗?可能和你想象得不同

紙上的心語
2025-11-23 11:36:00
港警飛虎隊換槍,為何不選國產(chǎn)QCQ171,是技術(shù)差距還是另有隱情?

港警飛虎隊換槍,為何不選國產(chǎn)QCQ171,是技術(shù)差距還是另有隱情?

太空記
2026-01-12 15:28:04
上海男籃VS深圳!盧偉沖擊10連勝,張鎮(zhèn)麟對位賀希寧,央視直播

上海男籃VS深圳!盧偉沖擊10連勝,張鎮(zhèn)麟對位賀希寧,央視直播

體壇瞎白話
2026-01-12 17:37:47
省廳公開通報!三明這些人被立案調(diào)查

省廳公開通報!三明這些人被立案調(diào)查

最三明
2026-01-12 11:59:12
法國超熟齡性工作者,88歲還在接客?自稱“越老越搶手”,入行原因太心酸!

法國超熟齡性工作者,88歲還在接客?自稱“越老越搶手”,入行原因太心酸!

新歐洲
2026-01-10 19:38:22
秒殺北上廣,曾經(jīng)的“鬼城”,竟逆襲成中國最富?

秒殺北上廣,曾經(jīng)的“鬼城”,竟逆襲成中國最富?

李云飛Afey
2026-01-12 23:31:11
U23國足擊敗澳大利亞,足協(xié)就有可能做出重要決定,事關(guān)主帥去留

U23國足擊敗澳大利亞,足協(xié)就有可能做出重要決定,事關(guān)主帥去留

籃球看比賽
2026-01-12 11:23:05
重磅!啟動南北橫線建設(shè)!2026年長沙政府工作報告全文公布!

重磅!啟動南北橫線建設(shè)!2026年長沙政府工作報告全文公布!

星耀長沙
2026-01-12 21:01:09
張水華:我最好說話!同事找我調(diào)休我都同意 辭職沒和她們打招呼

張水華:我最好說話!同事找我調(diào)休我都同意 辭職沒和她們打招呼

念洲
2026-01-12 13:02:28
原來大佬寫的推薦信都這么短啊 ??!網(wǎng)友:有用不在于字多

原來大佬寫的推薦信都這么短啊 ??!網(wǎng)友:有用不在于字多

夜深愛雜談
2026-01-10 22:24:02
山河四省,三億人的悲哀

山河四省,三億人的悲哀

銀河系漫游客
2025-12-30 14:04:48
龍湖集團裁員1.57萬人

龍湖集團裁員1.57萬人

地產(chǎn)微資訊
2026-01-10 08:43:45
59年張國燾在香港窮困潦倒,毛主席:可考慮予以補助,但有一要求

59年張國燾在香港窮困潦倒,毛主席:可考慮予以補助,但有一要求

海佑講史
2026-01-04 09:30:15
一場新的戰(zhàn)爭,已是一觸即發(fā)

一場新的戰(zhàn)爭,已是一觸即發(fā)

牛彈琴
2026-01-12 07:51:07
河南新蔡13歲學(xué)生死亡后續(xù):左胸部針孔和嘴角紅色液體解釋來了

河南新蔡13歲學(xué)生死亡后續(xù):左胸部針孔和嘴角紅色液體解釋來了

江山揮筆
2026-01-11 09:27:07
原來有這么多不體面但掙錢的小生意!原來都是悶聲發(fā)大財??!

原來有這么多不體面但掙錢的小生意!原來都是悶聲發(fā)大財??!

另子維愛讀史
2025-12-06 22:09:07
三年3次換帥,魅族正耗盡吉利的耐心

三年3次換帥,魅族正耗盡吉利的耐心

螳螂觀察
2026-01-12 18:47:57
馮小剛徐帆婚變實錘?密會陳思誠3小時,養(yǎng)女成“托孤”籌碼

馮小剛徐帆婚變實錘?密會陳思誠3小時,養(yǎng)女成“托孤”籌碼

未曾青梅
2026-01-10 18:26:19
輸球又輸人!皇馬決賽最慘之人:阿隆索親手將他打入冷宮

輸球又輸人!皇馬決賽最慘之人:阿隆索親手將他打入冷宮

瀾歸序
2026-01-12 05:35:15
2026-01-13 00:35:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14319文章數(shù) 66454關(guān)注度
往期回顧 全部

科技要聞

面對SpaceX瘋狂“下餃子” 中國正面接招

頭條要聞

外媒問王毅調(diào)整索馬里行程是否出于安全考慮 中方回應(yīng)

頭條要聞

外媒問王毅調(diào)整索馬里行程是否出于安全考慮 中方回應(yīng)

體育要聞

一場安東尼奧式勝利,給中國足球帶來驚喜

娛樂要聞

蔡少芬結(jié)婚18周年,與張晉過二人世界

財經(jīng)要聞

倍輕松信披迷霧 實控人占用資金金額存疑

汽車要聞

增配不加價 北京現(xiàn)代 第五代 勝達2026款上市

態(tài)度原創(chuàng)

藝術(shù)
親子
本地
健康
房產(chǎn)

藝術(shù)要聞

畫完這組畫,他抑郁了,后來自殺了

親子要聞

輪班,寶媽理所應(yīng)當固定周日休,網(wǎng)友:家庭地位低,把同事當老公

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

血常規(guī)3項異常,是身體警報!

房產(chǎn)要聞

重磅調(diào)規(guī)!417畝商改住+教育地塊!??谖骱0队忠l(fā)!

無障礙瀏覽 進入關(guān)懷版