国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

編程表現(xiàn)超越Claude和GPT?DeepSeek準(zhǔn)備第二次震驚全世界

DeepSeek能否第二次震驚全世界

DeepSeek準(zhǔn)備第二次震驚全世界

DeepSeek能第二次震驚世界嗎

0
分享至



去年7月,由于DeepSeek下載量從高峰期的8000多萬(wàn)暴跌至2000多萬(wàn),下滑72.2%,“DeepSeek跌落神壇”就成為了當(dāng)時(shí)互聯(lián)網(wǎng)最熱門(mén)的話題。

但據(jù)多位知情人士透露,DeepSeek即將重登王座。他們計(jì)劃在二月中旬發(fā)布新一代模型DeepSeek-V4。

也就是農(nóng)歷2026年新年期間,距離上一代模型DeepSeek-R1的發(fā)布正好一年。

這次發(fā)布的重點(diǎn)是代碼生成和處理能力。

根據(jù)DeepSeek內(nèi)部的基準(zhǔn)測(cè)試,V4在編程任務(wù)上的表現(xiàn)超過(guò)了目前市場(chǎng)上的主流競(jìng)品,包括Anthropic的Claude和OpenAI的GPT系列。

根據(jù)報(bào)道,在即將發(fā)布的新模型中,DeepSeek團(tuán)隊(duì)解決了許多長(zhǎng)期困擾AI發(fā)展的技術(shù)難題。很可能會(huì)徹底改變Vibe Coding產(chǎn)業(yè)。

01

報(bào)道中提到一件事,“DeepSeek-V4模型在整個(gè)訓(xùn)練過(guò)程中理解數(shù)據(jù)模式的能力也有所改進(jìn),且性能未出現(xiàn)衰減?!?/p>

這句話有些難以理解,我們不妨拆開(kāi)來(lái)解讀。

首先是前半句,它指的是模型不再只是死記硬背數(shù)據(jù),而是能看透數(shù)據(jù)背后的規(guī)律和邏輯。

DeepSeek-R1有個(gè)具代表性的例子,就是讓模型數(shù)strawberry里有幾個(gè)r。

由于當(dāng)時(shí)的DeepSeek模型并不能理解“數(shù)”(count)這個(gè)概念,只能根據(jù)訓(xùn)練時(shí)的數(shù)據(jù)來(lái)輸出答案。可這個(gè)數(shù)據(jù)恰好又是錯(cuò)的,所以無(wú)論DeepSeek怎么思考,它給出的答案大多數(shù)情況都是2,而不是正確的3。



而DeepSeek-V4則會(huì)徹底杜絕這個(gè)情況,前提是在訓(xùn)練過(guò)程中,讓模型徹底理解某一件事情。

后半句的性能退化,指的是在AI訓(xùn)練中,隨著模型不斷學(xué)習(xí)新東西或訓(xùn)練時(shí)間加長(zhǎng),往往會(huì)出現(xiàn)“學(xué)了新的忘了舊的”或者模型變得不穩(wěn)定的情況。

這種現(xiàn)象在業(yè)內(nèi)被稱(chēng)為“災(zāi)難性遺忘”(Catastrophic Forgetting)或“模型坍塌”(Model Collapse)。

因此,V4在不斷變聰明、變復(fù)雜的過(guò)程中,依然保持了極高的穩(wěn)定性和原有能力的完整性,沒(méi)有出現(xiàn)任何“副作用”或能力倒退。

這恰恰是構(gòu)建編程Agent的前置條件。

在現(xiàn)代軟件工程中,一個(gè)微小的修改可能波及數(shù)個(gè)文件、數(shù)千行代碼的依賴(lài)關(guān)系。

但是以往的模型往往受限于上下文窗口或注意力機(jī)制的衰減,從而沒(méi)辦法對(duì)于龐大的項(xiàng)目進(jìn)行修改。

V4極有可能是一個(gè)為“Agent時(shí)代”量身定制的模型。

一年前,DeepSeek-R1 的發(fā)布確實(shí)在行業(yè)內(nèi)引起了不小的波動(dòng)。那款主打推理能力的模型證明了低成本研發(fā)路徑的可行性。

然而一年后的今天,人工智能行業(yè)的關(guān)注焦點(diǎn)已經(jīng)發(fā)生了顯著轉(zhuǎn)移。單純的文本生成或邏輯推理已不再是唯一的競(jìng)爭(zhēng)高地,代碼生成正在演變?yōu)榇竽P湍芰Φ摹霸嚱鹗薄?/p>

在當(dāng)前的開(kāi)發(fā)環(huán)境中,“Vibe Coding”成為新趨勢(shì),要求AI不僅能補(bǔ)全代碼,更能理解開(kāi)發(fā)者的意圖流(Flow),實(shí)現(xiàn)從自然語(yǔ)言到復(fù)雜工程邏輯的無(wú)縫轉(zhuǎn)化。

DeepSeek似乎已經(jīng)準(zhǔn)備好在新賽道上狂飆了。

02

如果深入梳理DeepSeek團(tuán)隊(duì)以及核心人物梁文鋒在R1發(fā)布之后這一年里的學(xué)術(shù)軌跡,我們會(huì)發(fā)現(xiàn)一條清晰且扎實(shí)的技術(shù)演進(jìn)路線。

這些公開(kāi)發(fā)表的論文與技術(shù)報(bào)告,不僅是對(duì)過(guò)去成果的總結(jié),更是V4強(qiáng)大能力的注腳與預(yù)演。

2025年9月,DeepSeek-R1的相關(guān)論文成功登上了頂級(jí)學(xué)術(shù)期刊《Nature》的封面,梁文鋒署名通訊作者。

面對(duì)審稿人關(guān)于是否使用了OpenAI模型輸出進(jìn)行蒸餾訓(xùn)練的尖銳質(zhì)疑,DeepSeek團(tuán)隊(duì)在回應(yīng)中給出了明確的否認(rèn),并首次公開(kāi)了令人咋舌的低成本數(shù)據(jù):從V3-Base訓(xùn)練到R1,僅花費(fèi)了29.4萬(wàn)美元。

當(dāng)然,這個(gè)成本僅指R1的后訓(xùn)練階段成本,不包含V3-Base基礎(chǔ)模型本身約600萬(wàn)美元的訓(xùn)練投入。

數(shù)據(jù)公開(kāi)后,以及《Nature》為此專(zhuān)門(mén)撰寫(xiě)的社論,標(biāo)志著DeepSeek在學(xué)術(shù)嚴(yán)謹(jǐn)性和技術(shù)原創(chuàng)性上獲得了國(guó)際最高認(rèn)可,徹底洗刷了外界對(duì)于中國(guó)大模型“套殼”或“跟隨”的刻板印象。

不過(guò),真正能佐證DeepSeek-V4在代碼方面有大幅突破的證據(jù),是2025年最后一天,DeepSeek團(tuán)隊(duì)發(fā)表的論文《mHC:流形約束超連接》。

代碼生成任務(wù)對(duì)模型的邏輯深度和上下文跨度有著極高的要求,這通常需要更大規(guī)模的模型參數(shù)和更深的網(wǎng)絡(luò)結(jié)構(gòu)。

然而,傳統(tǒng)的超連接(Hyper-Connections)架構(gòu)在模型規(guī)模擴(kuò)大時(shí),會(huì)面臨嚴(yán)重的信號(hào)增益問(wèn)題,最終導(dǎo)致訓(xùn)練過(guò)程極不穩(wěn)定甚至崩潰。

為了解決這一阻礙模型擴(kuò)容的根本性物理難題,DeepSeek團(tuán)隊(duì)在這篇論文中提出了一種全新的架構(gòu)mHC。

簡(jiǎn)單來(lái)說(shuō),它給狂奔的信號(hào)加了一道精密的閥門(mén),將信號(hào)增益嚴(yán)格控制在1.6倍左右。

論文數(shù)據(jù)顯示,在3B、9B乃至18B參數(shù)規(guī)模的模型測(cè)試中,應(yīng)用了mHC架構(gòu)的模型在BIG-BenchHard推理基準(zhǔn)上提升了2.1%。

這項(xiàng)由梁文鋒聯(lián)合署名的研究成果,實(shí)際上解決了大模型在“做大”和“做復(fù)雜”過(guò)程中的穩(wěn)定性難題。

這意味著V4模型極有可能采用了這種全新的架構(gòu),從而在擁有更龐大參數(shù)量和更深層推理能力的同時(shí),依然保持了高效的訓(xùn)練效率和極高的穩(wěn)定性。



不僅如此,在2026年1月初,DeepSeek悄無(wú)聲息地將arXiV上的R1論文從原本的22頁(yè)大幅擴(kuò)充至86頁(yè)。

這多出來(lái)的60多頁(yè)內(nèi)容,詳盡地披露了R1的完整訓(xùn)練管線,包括冷啟動(dòng)、推理導(dǎo)向的強(qiáng)化學(xué)習(xí)(RL)、拒絕采樣與再微調(diào)、以及對(duì)齊導(dǎo)向的強(qiáng)化學(xué)習(xí)這四個(gè)關(guān)鍵步驟。

業(yè)界普遍推測(cè),這種在春節(jié)前夕“清庫(kù)存”式的技術(shù)披露,往往預(yù)示著下一代更強(qiáng)大的技術(shù)已經(jīng)成熟。

既然R1的技術(shù)細(xì)節(jié)已經(jīng)不再是核心壁壘,那么即將到來(lái)的V4必然擁有了更高維度的護(hù)城河。

03

就在2026年的元旦,另一股來(lái)自量化界的力量也加入了戰(zhàn)局。

由九坤投資創(chuàng)始團(tuán)隊(duì)發(fā)起成立的至知?jiǎng)?chuàng)新研究院(IQuestResearch),發(fā)布了名為IQuest-Coder-V1的開(kāi)源代碼大模型。我們?cè)谖恼隆队质橇炕?,第二個(gè)DeepSeek時(shí)刻到來(lái)了?》中對(duì)其進(jìn)行了報(bào)道。

這支同樣出身于量化背景的團(tuán)隊(duì),他們僅有40B參數(shù)的模型,在SWE-benchVerified測(cè)試中斬獲了81.4%的高分,一舉達(dá)到了Claude和ChatGPT的水平。

而在Vibe Coding的戰(zhàn)場(chǎng)上,國(guó)內(nèi)互聯(lián)網(wǎng)大廠的動(dòng)作同樣不容小覷。

字節(jié)跳動(dòng)的豆包在2025年初就推出了Trae編程工具,并在AI編程功能上實(shí)現(xiàn)了HTML預(yù)覽、Python運(yùn)行和完整項(xiàng)目生成等能力,讓開(kāi)發(fā)者可以在一個(gè)界面內(nèi)完成從構(gòu)思到部署的全流程。

阿里的通義千問(wèn)則在12月26日更新到了Qwen Code v0.5.0版本。

此次更新的最大亮點(diǎn)就是支持在終端窗口中同時(shí)運(yùn)行四個(gè)Qwen Code實(shí)例,可并行處理智能問(wèn)答、實(shí)時(shí)翻譯、原型設(shè)計(jì)、創(chuàng)意繪圖等不同任務(wù),實(shí)現(xiàn)了AI編程“跳出命令行”的突破。

不過(guò),真正引發(fā)行業(yè)震動(dòng)的,是豆包在硬件終端上的突破性嘗試。

2025年12月1日,字節(jié)跳動(dòng)與中興通訊合作推出了搭載豆包手機(jī)助手的努比亞M153工程樣機(jī),售價(jià)3499元,首批約3萬(wàn)臺(tái)在當(dāng)天迅速售罄,甚至在二手市場(chǎng)炒出了高價(jià)。

這款手機(jī)助手的核心能力在于跨應(yīng)用操作。用戶(hù)只需用自然語(yǔ)言下達(dá)指令,AI就能自動(dòng)跳轉(zhuǎn)多個(gè)應(yīng)用完成點(diǎn)外賣(mài)、訂機(jī)票、比價(jià)購(gòu)物等復(fù)雜任務(wù)。

這一系列動(dòng)作背后,折射出的是AI大模型從云端走向終端、從工具走向入口的戰(zhàn)略轉(zhuǎn)型。

說(shuō)不定DeepSeek手機(jī)也不遠(yuǎn)了。



與此同時(shí),資本市場(chǎng)也迎來(lái)了大模型行業(yè)的收獲季。

曾經(jīng)歷過(guò)“百模大戰(zhàn)”喧囂的中國(guó)AI行業(yè),正在加速向頭部收斂。智譜AI和MiniMax這兩家公司均已成功上市。

智譜是1月8日在港交所敲的鐘,發(fā)行價(jià)定在116.2港元/股,上市第一天就給了市場(chǎng)一個(gè)驚喜 —— 開(kāi)盤(pán)120港元,收盤(pán)131.5港元,第一天就漲了13.17%,市值一下子沖到578.9億港元,成了 “全球大模型第一股”。

第二天開(kāi)盤(pán)直接137.2港元起,收盤(pán)158.6港元,較首日收盤(pán)價(jià)又漲了20.6%,市值也跟著漲到698.21億港元,兩天下來(lái)從發(fā)行價(jià)算已經(jīng)漲了快37%,完全沒(méi)給空頭機(jī)會(huì)。

MiniMax比智譜晚一天,但風(fēng)頭更勁。發(fā)行價(jià)165港元/股,而且是頂格定價(jià),上市前一天的暗盤(pán)就已經(jīng)漲了25%-29%,報(bào)205.60-212.60港元。

上市當(dāng)天開(kāi)盤(pán)235.4港元,漲了42.7%,之后一路飆升,盤(pán)中最高到351.8港元,最終收盤(pán)345港元,較發(fā)行價(jià)暴漲 109.09%,市值來(lái)到1054億港元,成了千億市值俱樂(lè)部新成員。

雖然高額的研發(fā)投入使得兩家公司目前仍處于虧損狀態(tài),但強(qiáng)勁的增長(zhǎng)曲線證明了市場(chǎng)對(duì)于高質(zhì)量AI模型的付費(fèi)意愿正在形成。

中國(guó)AI方興未艾,但當(dāng)全球目光已經(jīng)再次聚焦到DeepSeek身上。一年前那個(gè)用低成本路徑顛覆行業(yè)認(rèn)知的團(tuán)隊(duì),即將在春節(jié)期間交出新的答卷。

DeepSeek能否第二次“震驚全世界”,只要再等幾天就會(huì)知曉。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
日本珍藏祝枝山真跡,字字都是“金字塔尖”

日本珍藏祝枝山真跡,字字都是“金字塔尖”

書(shū)法網(wǎng)
2026-01-01 17:25:06
馮小剛徐帆婚變實(shí)錘?密會(huì)陳思誠(chéng)3小時(shí),養(yǎng)女成“托孤”籌碼

馮小剛徐帆婚變實(shí)錘?密會(huì)陳思誠(chéng)3小時(shí),養(yǎng)女成“托孤”籌碼

未曾青梅
2026-01-10 18:26:19
王曼昱輸球原因曝光!郭焱點(diǎn)評(píng)讓人落淚!央視直播多哈冠軍賽決賽

王曼昱輸球原因曝光!郭焱點(diǎn)評(píng)讓人落淚!央視直播多哈冠軍賽決賽

好乒乓
2026-01-11 16:28:04
一個(gè)都跑不了!被列“黑名單”后,陳舒怡嚇得只會(huì)說(shuō)“謝謝”

一個(gè)都跑不了!被列“黑名單”后,陳舒怡嚇得只會(huì)說(shuō)“謝謝”

菊寶視界
2026-01-10 19:00:02
李凱馨泳裝好肥嫩

李凱馨泳裝好肥嫩

小椰的奶奶
2026-01-12 00:58:55
人窮別走親戚?網(wǎng)友評(píng)論驚呆眾人,真相不容小覷!

人窮別走親戚?網(wǎng)友評(píng)論驚呆眾人,真相不容小覷!

特約前排觀眾
2026-01-12 00:15:03
伊朗IRPG進(jìn)入最高警戒狀態(tài),死傷大幅增加,美以將隨時(shí)支援伊朗人民

伊朗IRPG進(jìn)入最高警戒狀態(tài),死傷大幅增加,美以將隨時(shí)支援伊朗人民

以色列計(jì)劃Pro
2026-01-11 12:24:32
美國(guó)共和黨眾議員拉馬爾法突然去世,共和黨在眾議院困局加劇

美國(guó)共和黨眾議員拉馬爾法突然去世,共和黨在眾議院困局加劇

林子說(shuō)事
2026-01-11 09:08:20
林光寧追悼會(huì):林有慧傷心到走路踉蹌 蕭敬騰哭承諾一輩子不離婚

林光寧追悼會(huì):林有慧傷心到走路踉蹌 蕭敬騰哭承諾一輩子不離婚

八斗小先生
2026-01-09 09:26:16
新恒大誕生?中國(guó)足壇新貴崛起,連買(mǎi)2大強(qiáng)力球星!身價(jià)暴漲5千萬(wàn)

新恒大誕生?中國(guó)足壇新貴崛起,連買(mǎi)2大強(qiáng)力球星!身價(jià)暴漲5千萬(wàn)

國(guó)足風(fēng)云
2026-01-11 11:55:21
中國(guó)4月1日起全面取消光伏產(chǎn)品增值稅出口退稅,向全世界輸出通脹

中國(guó)4月1日起全面取消光伏產(chǎn)品增值稅出口退稅,向全世界輸出通脹

我心縱橫天地間
2026-01-11 15:10:13
伊朗警方:8名安全人員在騷亂中殉職

伊朗警方:8名安全人員在騷亂中殉職

界面新聞
2026-01-11 18:22:58
U23國(guó)足首球誕生!彭嘯爆射世界波,對(duì)手解圍失誤,王鈺棟策動(dòng)

U23國(guó)足首球誕生!彭嘯爆射世界波,對(duì)手解圍失誤,王鈺棟策動(dòng)

奧拜爾
2026-01-11 20:17:38
回國(guó)了我才敢說(shuō):委內(nèi)瑞拉,是我去過(guò)的所有國(guó)家中,最被低估的!

回國(guó)了我才敢說(shuō):委內(nèi)瑞拉,是我去過(guò)的所有國(guó)家中,最被低估的!

另子維愛(ài)讀史
2026-01-09 21:09:05
切爾西最 “冤” 主帥!博阿斯 9 個(gè)月被炒,10 筆引援卻封神!

切爾西最 “冤” 主帥!博阿斯 9 個(gè)月被炒,10 筆引援卻封神!

瀾歸序
2026-01-11 03:06:51
天大噩耗:姆巴佩將在明天凌晨的西班牙德比中先坐冷板凳

天大噩耗:姆巴佩將在明天凌晨的西班牙德比中先坐冷板凳

油潑辣不辣
2026-01-11 15:56:44
中央已明確落實(shí):“兩延一彈一自愿”,2026年退休如何選擇更劃算

中央已明確落實(shí):“兩延一彈一自愿”,2026年退休如何選擇更劃算

夜深?lèi)?ài)雜談
2026-01-11 19:29:48
30分不敵廣東!楊鳴回懟記者提問(wèn) 給國(guó)內(nèi)球員傾斜戰(zhàn)術(shù)是什么意思?

30分不敵廣東!楊鳴回懟記者提問(wèn) 給國(guó)內(nèi)球員傾斜戰(zhàn)術(shù)是什么意思?

狼叔評(píng)論
2026-01-11 22:50:13
美國(guó)得到格陵蘭島的三種可能路徑:只剩3年任期的特朗普VS千年命運(yùn)考量的島民

美國(guó)得到格陵蘭島的三種可能路徑:只剩3年任期的特朗普VS千年命運(yùn)考量的島民

紅星新聞
2026-01-09 19:24:42
給人養(yǎng)了7年閑人,廣汽終于要關(guān)閉洛杉磯的研發(fā)中心

給人養(yǎng)了7年閑人,廣汽終于要關(guān)閉洛杉磯的研發(fā)中心

與車(chē)同樂(lè)
2025-12-04 10:05:02
2026-01-12 01:24:49
字母榜 incentive-icons
字母榜
讓未來(lái)不止于大。
2160文章數(shù) 8036關(guān)注度
往期回顧 全部

科技要聞

“我們與美國(guó)的差距也許還在拉大”

頭條要聞

特朗普就格陵蘭島下最后通牒 加拿大開(kāi)始行動(dòng)了

頭條要聞

特朗普就格陵蘭島下最后通牒 加拿大開(kāi)始行動(dòng)了

體育要聞

U23國(guó)足形勢(shì):末輪不負(fù)泰國(guó)即確保晉級(jí)

娛樂(lè)要聞

留幾手為閆學(xué)晶叫屈?稱(chēng)網(wǎng)友自卑敏感

財(cái)經(jīng)要聞

外賣(mài)平臺(tái)"燒錢(qián)搶存量市場(chǎng)"迎來(lái)終局?

汽車(chē)要聞

2026款宋Pro DM-i長(zhǎng)續(xù)航補(bǔ)貼后9.98萬(wàn)起

態(tài)度原創(chuàng)

藝術(shù)
數(shù)碼
親子
健康
公開(kāi)課

藝術(shù)要聞

25位世界名人告訴你,音樂(lè)是人一生能擁有最棒的事!

數(shù)碼要聞

科技有AI,連接全球:海信家電參展CES 2026,定義智慧生活新圖景

親子要聞

晨時(shí)評(píng) | 新生兒疑被助產(chǎn)士剪斷手指,別用孩子亂動(dòng)推卸責(zé)任

這些新療法,讓化療不再那么痛苦

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版