国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

編程表現(xiàn)超越Claude和GPT?DeepSeek準備第二次震驚全世界

DeepSeek能否第二次震驚全世界

DeepSeek準備第二次震驚全世界

DeepSeek能第二次震驚世界嗎

0
分享至



去年7月,由于DeepSeek下載量從高峰期的8000多萬暴跌至2000多萬,下滑72.2%,“DeepSeek跌落神壇”就成為了當時互聯(lián)網最熱門的話題。

但據(jù)多位知情人士透露,DeepSeek即將重登王座。他們計劃在二月中旬發(fā)布新一代模型DeepSeek-V4。

也就是農歷2026年新年期間,距離上一代模型DeepSeek-R1的發(fā)布正好一年。

這次發(fā)布的重點是代碼生成和處理能力。

根據(jù)DeepSeek內部的基準測試,V4在編程任務上的表現(xiàn)超過了目前市場上的主流競品,包括Anthropic的Claude和OpenAI的GPT系列。

根據(jù)報道,在即將發(fā)布的新模型中,DeepSeek團隊解決了許多長期困擾AI發(fā)展的技術難題。很可能會徹底改變Vibe Coding產業(yè)。

01

報道中提到一件事,“DeepSeek-V4模型在整個訓練過程中理解數(shù)據(jù)模式的能力也有所改進,且性能未出現(xiàn)衰減。”

這句話有些難以理解,我們不妨拆開來解讀。

首先是前半句,它指的是模型不再只是死記硬背數(shù)據(jù),而是能看透數(shù)據(jù)背后的規(guī)律和邏輯。

DeepSeek-R1有個具代表性的例子,就是讓模型數(shù)strawberry里有幾個r。

由于當時的DeepSeek模型并不能理解“數(shù)”(count)這個概念,只能根據(jù)訓練時的數(shù)據(jù)來輸出答案??蛇@個數(shù)據(jù)恰好又是錯的,所以無論DeepSeek怎么思考,它給出的答案大多數(shù)情況都是2,而不是正確的3。



而DeepSeek-V4則會徹底杜絕這個情況,前提是在訓練過程中,讓模型徹底理解某一件事情。

后半句的性能退化,指的是在AI訓練中,隨著模型不斷學習新東西或訓練時間加長,往往會出現(xiàn)“學了新的忘了舊的”或者模型變得不穩(wěn)定的情況。

這種現(xiàn)象在業(yè)內被稱為“災難性遺忘”(Catastrophic Forgetting)或“模型坍塌”(Model Collapse)。

因此,V4在不斷變聰明、變復雜的過程中,依然保持了極高的穩(wěn)定性和原有能力的完整性,沒有出現(xiàn)任何“副作用”或能力倒退。

這恰恰是構建編程Agent的前置條件。

在現(xiàn)代軟件工程中,一個微小的修改可能波及數(shù)個文件、數(shù)千行代碼的依賴關系。

但是以往的模型往往受限于上下文窗口或注意力機制的衰減,從而沒辦法對于龐大的項目進行修改。

V4極有可能是一個為“Agent時代”量身定制的模型。

一年前,DeepSeek-R1 的發(fā)布確實在行業(yè)內引起了不小的波動。那款主打推理能力的模型證明了低成本研發(fā)路徑的可行性。

然而一年后的今天,人工智能行業(yè)的關注焦點已經發(fā)生了顯著轉移。單純的文本生成或邏輯推理已不再是唯一的競爭高地,代碼生成正在演變?yōu)榇竽P湍芰Φ摹霸嚱鹗薄?/p>

在當前的開發(fā)環(huán)境中,“Vibe Coding”成為新趨勢,要求AI不僅能補全代碼,更能理解開發(fā)者的意圖流(Flow),實現(xiàn)從自然語言到復雜工程邏輯的無縫轉化。

DeepSeek似乎已經準備好在新賽道上狂飆了。

02

如果深入梳理DeepSeek團隊以及核心人物梁文鋒在R1發(fā)布之后這一年里的學術軌跡,我們會發(fā)現(xiàn)一條清晰且扎實的技術演進路線。

這些公開發(fā)表的論文與技術報告,不僅是對過去成果的總結,更是V4強大能力的注腳與預演。

2025年9月,DeepSeek-R1的相關論文成功登上了頂級學術期刊《Nature》的封面,梁文鋒署名通訊作者。

面對審稿人關于是否使用了OpenAI模型輸出進行蒸餾訓練的尖銳質疑,DeepSeek團隊在回應中給出了明確的否認,并首次公開了令人咋舌的低成本數(shù)據(jù):從V3-Base訓練到R1,僅花費了29.4萬美元。

當然,這個成本僅指R1的后訓練階段成本,不包含V3-Base基礎模型本身約600萬美元的訓練投入。

數(shù)據(jù)公開后,以及《Nature》為此專門撰寫的社論,標志著DeepSeek在學術嚴謹性和技術原創(chuàng)性上獲得了國際最高認可,徹底洗刷了外界對于中國大模型“套殼”或“跟隨”的刻板印象。

不過,真正能佐證DeepSeek-V4在代碼方面有大幅突破的證據(jù),是2025年最后一天,DeepSeek團隊發(fā)表的論文《mHC:流形約束超連接》。

代碼生成任務對模型的邏輯深度和上下文跨度有著極高的要求,這通常需要更大規(guī)模的模型參數(shù)和更深的網絡結構。

然而,傳統(tǒng)的超連接(Hyper-Connections)架構在模型規(guī)模擴大時,會面臨嚴重的信號增益問題,最終導致訓練過程極不穩(wěn)定甚至崩潰。

為了解決這一阻礙模型擴容的根本性物理難題,DeepSeek團隊在這篇論文中提出了一種全新的架構mHC。

簡單來說,它給狂奔的信號加了一道精密的閥門,將信號增益嚴格控制在1.6倍左右。

論文數(shù)據(jù)顯示,在3B、9B乃至18B參數(shù)規(guī)模的模型測試中,應用了mHC架構的模型在BIG-BenchHard推理基準上提升了2.1%。

這項由梁文鋒聯(lián)合署名的研究成果,實際上解決了大模型在“做大”和“做復雜”過程中的穩(wěn)定性難題。

這意味著V4模型極有可能采用了這種全新的架構,從而在擁有更龐大參數(shù)量和更深層推理能力的同時,依然保持了高效的訓練效率和極高的穩(wěn)定性。



不僅如此,在2026年1月初,DeepSeek悄無聲息地將arXiV上的R1論文從原本的22頁大幅擴充至86頁。

這多出來的60多頁內容,詳盡地披露了R1的完整訓練管線,包括冷啟動、推理導向的強化學習(RL)、拒絕采樣與再微調、以及對齊導向的強化學習這四個關鍵步驟。

業(yè)界普遍推測,這種在春節(jié)前夕“清庫存”式的技術披露,往往預示著下一代更強大的技術已經成熟。

既然R1的技術細節(jié)已經不再是核心壁壘,那么即將到來的V4必然擁有了更高維度的護城河。

03

就在2026年的元旦,另一股來自量化界的力量也加入了戰(zhàn)局。

由九坤投資創(chuàng)始團隊發(fā)起成立的至知創(chuàng)新研究院(IQuestResearch),發(fā)布了名為IQuest-Coder-V1的開源代碼大模型。我們曾在文章《又是量化基金,第二個DeepSeek時刻到來了?》中對其進行了報道。

這支同樣出身于量化背景的團隊,他們僅有40B參數(shù)的模型,在SWE-benchVerified測試中斬獲了81.4%的高分,一舉達到了Claude和ChatGPT的水平。

而在Vibe Coding的戰(zhàn)場上,國內互聯(lián)網大廠的動作同樣不容小覷。

字節(jié)跳動的豆包在2025年初就推出了Trae編程工具,并在AI編程功能上實現(xiàn)了HTML預覽、Python運行和完整項目生成等能力,讓開發(fā)者可以在一個界面內完成從構思到部署的全流程。

阿里的通義千問則在12月26日更新到了Qwen Code v0.5.0版本。

此次更新的最大亮點就是支持在終端窗口中同時運行四個Qwen Code實例,可并行處理智能問答、實時翻譯、原型設計、創(chuàng)意繪圖等不同任務,實現(xiàn)了AI編程“跳出命令行”的突破。

不過,真正引發(fā)行業(yè)震動的,是豆包在硬件終端上的突破性嘗試。

2025年12月1日,字節(jié)跳動與中興通訊合作推出了搭載豆包手機助手的努比亞M153工程樣機,售價3499元,首批約3萬臺在當天迅速售罄,甚至在二手市場炒出了高價。

這款手機助手的核心能力在于跨應用操作。用戶只需用自然語言下達指令,AI就能自動跳轉多個應用完成點外賣、訂機票、比價購物等復雜任務。

這一系列動作背后,折射出的是AI大模型從云端走向終端、從工具走向入口的戰(zhàn)略轉型。

說不定DeepSeek手機也不遠了。



與此同時,資本市場也迎來了大模型行業(yè)的收獲季。

曾經歷過“百模大戰(zhàn)”喧囂的中國AI行業(yè),正在加速向頭部收斂。智譜AI和MiniMax這兩家公司均已成功上市。

智譜是1月8日在港交所敲的鐘,發(fā)行價定在116.2港元/股,上市第一天就給了市場一個驚喜 —— 開盤120港元,收盤131.5港元,第一天就漲了13.17%,市值一下子沖到578.9億港元,成了 “全球大模型第一股”。

第二天開盤直接137.2港元起,收盤158.6港元,較首日收盤價又漲了20.6%,市值也跟著漲到698.21億港元,兩天下來從發(fā)行價算已經漲了快37%,完全沒給空頭機會。

MiniMax比智譜晚一天,但風頭更勁。發(fā)行價165港元/股,而且是頂格定價,上市前一天的暗盤就已經漲了25%-29%,報205.60-212.60港元。

上市當天開盤235.4港元,漲了42.7%,之后一路飆升,盤中最高到351.8港元,最終收盤345港元,較發(fā)行價暴漲 109.09%,市值來到1054億港元,成了千億市值俱樂部新成員。

雖然高額的研發(fā)投入使得兩家公司目前仍處于虧損狀態(tài),但強勁的增長曲線證明了市場對于高質量AI模型的付費意愿正在形成。

中國AI方興未艾,但當全球目光已經再次聚焦到DeepSeek身上。一年前那個用低成本路徑顛覆行業(yè)認知的團隊,即將在春節(jié)期間交出新的答卷。

DeepSeek能否第二次“震驚全世界”,只要再等幾天就會知曉。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
烏專家:中國“吸干”蘇聯(lián)遺產,我們圖紙都沒看懂,他們造出2.0

烏專家:中國“吸干”蘇聯(lián)遺產,我們圖紙都沒看懂,他們造出2.0

博覽歷史
2025-12-29 19:26:45
張家界“愛國賊事件”:傻X式愛國,是個巨大禍害

張家界“愛國賊事件”:傻X式愛國,是個巨大禍害

麥大人
2025-10-13 15:29:56
利好來了!上海重磅發(fā)布,事關商業(yè)航天、機器人……

利好來了!上海重磅發(fā)布,事關商業(yè)航天、機器人……

財經早餐
2026-01-11 06:44:33
注意!蘋果宣布這一服務即將徹底關閉

注意!蘋果宣布這一服務即將徹底關閉

XCiOS俱樂部
2026-01-10 10:54:32
揭秘尼姑庵的黑暗面:尼姑平均年齡不到25,香客人來人往究竟為何

揭秘尼姑庵的黑暗面:尼姑平均年齡不到25,香客人來人往究竟為何

豐譚筆錄
2026-01-06 11:40:49
中央戲劇學院:演員閆某晶之子林某霏曾就讀“中戲新疆班”不屬實

中央戲劇學院:演員閆某晶之子林某霏曾就讀“中戲新疆班”不屬實

新京報
2026-01-11 21:08:06
包養(yǎng)情人無數(shù),玩老婆閨蜜,娶初中同學女兒為妻,孫道存有多荒唐

包養(yǎng)情人無數(shù),玩老婆閨蜜,娶初中同學女兒為妻,孫道存有多荒唐

瓜汁橘長Dr
2026-01-06 10:11:41
中國主導,伊朗派兵俄也派兵,行動準時開始,馬克龍通知7國后退

中國主導,伊朗派兵俄也派兵,行動準時開始,馬克龍通知7國后退

紀中百大事
2026-01-11 21:18:08
火記:杜蘭特沒興趣當超級英雄,火箭若奪冠無望,他可能選擇離開

火記:杜蘭特沒興趣當超級英雄,火箭若奪冠無望,他可能選擇離開

移動擋拆
2026-01-11 05:16:35
不提徐杰,不提胡明軒!周琦公開夸兩后衛(wèi),趙睿首選不是北京隊

不提徐杰,不提胡明軒!周琦公開夸兩后衛(wèi),趙睿首選不是北京隊

體壇大事記
2026-01-11 12:43:52
江蘇南京一模特太漂亮 身高177cm體重55kg五官精致到無懈可擊

江蘇南京一模特太漂亮 身高177cm體重55kg五官精致到無懈可擊

陳意小可愛
2026-01-10 01:19:36
海歸光環(huán)徹底消失?49.5萬留學生涌回國,殘酷真相:企業(yè)只認這個

海歸光環(huán)徹底消失?49.5萬留學生涌回國,殘酷真相:企業(yè)只認這個

南權先生
2025-12-23 16:16:33
又一個巨頭崛起!年入8715億,超越華為,成第三民營企業(yè)!

又一個巨頭崛起!年入8715億,超越華為,成第三民營企業(yè)!

牛牛叨史
2025-12-23 23:07:38
河南新蔡13歲學生死亡后續(xù):左胸部針孔和嘴角紅色液體解釋來了

河南新蔡13歲學生死亡后續(xù):左胸部針孔和嘴角紅色液體解釋來了

江山揮筆
2026-01-11 09:27:07
1月12日精選熱點:核聚變大會下周開啟,這些隱形冠軍確定參加

1月12日精選熱點:核聚變大會下周開啟,這些隱形冠軍確定參加

元芳說投資
2026-01-11 20:19:57
林光寧追悼會:林有慧傷心到走路踉蹌 蕭敬騰哭承諾一輩子不離婚

林光寧追悼會:林有慧傷心到走路踉蹌 蕭敬騰哭承諾一輩子不離婚

八斗小先生
2026-01-09 09:26:16
山東女籃加時險勝江蘇,張子宇沒費吹灰之力,是她決定了比賽走勢

山東女籃加時險勝江蘇,張子宇沒費吹灰之力,是她決定了比賽走勢

姜大叔侃球
2026-01-10 22:11:17
樸槿惠出獄生活:住別墅,與小10歲律師為伴,如今生活安逸

樸槿惠出獄生活:住別墅,與小10歲律師為伴,如今生活安逸

策略述
2026-01-09 13:02:41
下周A股十大潛力標的梳理

下周A股十大潛力標的梳理

風風順
2026-01-11 08:19:48
震驚!網傳重慶某酒店提及年輕人的性張力,吃完火鍋還有勁折騰…

震驚!網傳重慶某酒店提及年輕人的性張力,吃完火鍋還有勁折騰…

火山詩話
2026-01-11 08:30:39
2026-01-11 22:03:00
字母榜 incentive-icons
字母榜
讓未來不止于大。
2160文章數(shù) 8036關注度
往期回顧 全部

科技要聞

“我們與美國的差距也許還在拉大”

頭條要聞

10人違規(guī)吃喝1人飲酒后死亡 組織者曾找商人借錢補償

頭條要聞

10人違規(guī)吃喝1人飲酒后死亡 組織者曾找商人借錢補償

體育要聞

詹皇曬照不滿打手沒哨 裁判報告最后兩分鐘無誤判

娛樂要聞

留幾手為閆學晶叫屈?稱網友自卑敏感

財經要聞

外賣平臺"燒錢搶存量市場"迎來終局?

汽車要聞

2026款宋Pro DM-i長續(xù)航補貼后9.98萬起

態(tài)度原創(chuàng)

手機
家居
藝術
房產
數(shù)碼

手機要聞

AI需求引發(fā)存儲芯片成本飆升,魅族22 Air無奈取消上市

家居要聞

木色留白 演繹現(xiàn)代自由

藝術要聞

砸18億!游戲巨頭落子廣州!詩悅網絡總部大樓新進展

房產要聞

66萬方!4755套!三亞巨量房源正瘋狂砸出!

數(shù)碼要聞

ECS精英推出Liva Z系列迷你主機,多CPU可選

無障礙瀏覽 進入關懷版