国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

編程表現(xiàn)超越Claude和GPT?DeepSeek準(zhǔn)備第二次震驚全世界

DeepSeek能否第二次震驚全世界

DeepSeek準(zhǔn)備第二次震驚全世界

DeepSeek能第二次震驚世界嗎

0
分享至



去年7月,由于DeepSeek下載量從高峰期的8000多萬暴跌至2000多萬,下滑72.2%,“DeepSeek跌落神壇”就成為了當(dāng)時(shí)互聯(lián)網(wǎng)最熱門的話題。

但據(jù)多位知情人士透露,DeepSeek即將重登王座。他們計(jì)劃在二月中旬發(fā)布新一代模型DeepSeek-V4。

也就是農(nóng)歷2026年新年期間,距離上一代模型DeepSeek-R1的發(fā)布正好一年。

這次發(fā)布的重點(diǎn)是代碼生成和處理能力。

根據(jù)DeepSeek內(nèi)部的基準(zhǔn)測(cè)試,V4在編程任務(wù)上的表現(xiàn)超過了目前市場(chǎng)上的主流競(jìng)品,包括Anthropic的Claude和OpenAI的GPT系列。

根據(jù)報(bào)道,在即將發(fā)布的新模型中,DeepSeek團(tuán)隊(duì)解決了許多長期困擾AI發(fā)展的技術(shù)難題。很可能會(huì)徹底改變Vibe Coding產(chǎn)業(yè)。

01

報(bào)道中提到一件事,“DeepSeek-V4模型在整個(gè)訓(xùn)練過程中理解數(shù)據(jù)模式的能力也有所改進(jìn),且性能未出現(xiàn)衰減!

這句話有些難以理解,我們不妨拆開來解讀。

首先是前半句,它指的是模型不再只是死記硬背數(shù)據(jù),而是能看透數(shù)據(jù)背后的規(guī)律和邏輯。

DeepSeek-R1有個(gè)具代表性的例子,就是讓模型數(shù)strawberry里有幾個(gè)r。

由于當(dāng)時(shí)的DeepSeek模型并不能理解“數(shù)”(count)這個(gè)概念,只能根據(jù)訓(xùn)練時(shí)的數(shù)據(jù)來輸出答案。可這個(gè)數(shù)據(jù)恰好又是錯(cuò)的,所以無論DeepSeek怎么思考,它給出的答案大多數(shù)情況都是2,而不是正確的3。



而DeepSeek-V4則會(huì)徹底杜絕這個(gè)情況,前提是在訓(xùn)練過程中,讓模型徹底理解某一件事情。

后半句的性能退化,指的是在AI訓(xùn)練中,隨著模型不斷學(xué)習(xí)新東西或訓(xùn)練時(shí)間加長,往往會(huì)出現(xiàn)“學(xué)了新的忘了舊的”或者模型變得不穩(wěn)定的情況。

這種現(xiàn)象在業(yè)內(nèi)被稱為“災(zāi)難性遺忘”(Catastrophic Forgetting)或“模型坍塌”(Model Collapse)。

因此,V4在不斷變聰明、變復(fù)雜的過程中,依然保持了極高的穩(wěn)定性和原有能力的完整性,沒有出現(xiàn)任何“副作用”或能力倒退。

這恰恰是構(gòu)建編程Agent的前置條件。

在現(xiàn)代軟件工程中,一個(gè)微小的修改可能波及數(shù)個(gè)文件、數(shù)千行代碼的依賴關(guān)系。

但是以往的模型往往受限于上下文窗口或注意力機(jī)制的衰減,從而沒辦法對(duì)于龐大的項(xiàng)目進(jìn)行修改。

V4極有可能是一個(gè)為“Agent時(shí)代”量身定制的模型。

一年前,DeepSeek-R1 的發(fā)布確實(shí)在行業(yè)內(nèi)引起了不小的波動(dòng)。那款主打推理能力的模型證明了低成本研發(fā)路徑的可行性。

然而一年后的今天,人工智能行業(yè)的關(guān)注焦點(diǎn)已經(jīng)發(fā)生了顯著轉(zhuǎn)移。單純的文本生成或邏輯推理已不再是唯一的競(jìng)爭(zhēng)高地,代碼生成正在演變?yōu)榇竽P湍芰Φ摹霸嚱鹗薄?/p>

在當(dāng)前的開發(fā)環(huán)境中,“Vibe Coding”成為新趨勢(shì),要求AI不僅能補(bǔ)全代碼,更能理解開發(fā)者的意圖流(Flow),實(shí)現(xiàn)從自然語言到復(fù)雜工程邏輯的無縫轉(zhuǎn)化。

DeepSeek似乎已經(jīng)準(zhǔn)備好在新賽道上狂飆了。

02

如果深入梳理DeepSeek團(tuán)隊(duì)以及核心人物梁文鋒在R1發(fā)布之后這一年里的學(xué)術(shù)軌跡,我們會(huì)發(fā)現(xiàn)一條清晰且扎實(shí)的技術(shù)演進(jìn)路線。

這些公開發(fā)表的論文與技術(shù)報(bào)告,不僅是對(duì)過去成果的總結(jié),更是V4強(qiáng)大能力的注腳與預(yù)演。

2025年9月,DeepSeek-R1的相關(guān)論文成功登上了頂級(jí)學(xué)術(shù)期刊《Nature》的封面,梁文鋒署名通訊作者。

面對(duì)審稿人關(guān)于是否使用了OpenAI模型輸出進(jìn)行蒸餾訓(xùn)練的尖銳質(zhì)疑,DeepSeek團(tuán)隊(duì)在回應(yīng)中給出了明確的否認(rèn),并首次公開了令人咋舌的低成本數(shù)據(jù):從V3-Base訓(xùn)練到R1,僅花費(fèi)了29.4萬美元。

當(dāng)然,這個(gè)成本僅指R1的后訓(xùn)練階段成本,不包含V3-Base基礎(chǔ)模型本身約600萬美元的訓(xùn)練投入。

數(shù)據(jù)公開后,以及《Nature》為此專門撰寫的社論,標(biāo)志著DeepSeek在學(xué)術(shù)嚴(yán)謹(jǐn)性和技術(shù)原創(chuàng)性上獲得了國際最高認(rèn)可,徹底洗刷了外界對(duì)于中國大模型“套殼”或“跟隨”的刻板印象。

不過,真正能佐證DeepSeek-V4在代碼方面有大幅突破的證據(jù),是2025年最后一天,DeepSeek團(tuán)隊(duì)發(fā)表的論文《mHC:流形約束超連接》。

代碼生成任務(wù)對(duì)模型的邏輯深度和上下文跨度有著極高的要求,這通常需要更大規(guī)模的模型參數(shù)和更深的網(wǎng)絡(luò)結(jié)構(gòu)。

然而,傳統(tǒng)的超連接(Hyper-Connections)架構(gòu)在模型規(guī)模擴(kuò)大時(shí),會(huì)面臨嚴(yán)重的信號(hào)增益問題,最終導(dǎo)致訓(xùn)練過程極不穩(wěn)定甚至崩潰。

為了解決這一阻礙模型擴(kuò)容的根本性物理難題,DeepSeek團(tuán)隊(duì)在這篇論文中提出了一種全新的架構(gòu)mHC。

簡(jiǎn)單來說,它給狂奔的信號(hào)加了一道精密的閥門,將信號(hào)增益嚴(yán)格控制在1.6倍左右。

論文數(shù)據(jù)顯示,在3B、9B乃至18B參數(shù)規(guī)模的模型測(cè)試中,應(yīng)用了mHC架構(gòu)的模型在BIG-BenchHard推理基準(zhǔn)上提升了2.1%。

這項(xiàng)由梁文鋒聯(lián)合署名的研究成果,實(shí)際上解決了大模型在“做大”和“做復(fù)雜”過程中的穩(wěn)定性難題。

這意味著V4模型極有可能采用了這種全新的架構(gòu),從而在擁有更龐大參數(shù)量和更深層推理能力的同時(shí),依然保持了高效的訓(xùn)練效率和極高的穩(wěn)定性。



不僅如此,在2026年1月初,DeepSeek悄無聲息地將arXiV上的R1論文從原本的22頁大幅擴(kuò)充至86頁。

這多出來的60多頁內(nèi)容,詳盡地披露了R1的完整訓(xùn)練管線,包括冷啟動(dòng)、推理導(dǎo)向的強(qiáng)化學(xué)習(xí)(RL)、拒絕采樣與再微調(diào)、以及對(duì)齊導(dǎo)向的強(qiáng)化學(xué)習(xí)這四個(gè)關(guān)鍵步驟。

業(yè)界普遍推測(cè),這種在春節(jié)前夕“清庫存”式的技術(shù)披露,往往預(yù)示著下一代更強(qiáng)大的技術(shù)已經(jīng)成熟。

既然R1的技術(shù)細(xì)節(jié)已經(jīng)不再是核心壁壘,那么即將到來的V4必然擁有了更高維度的護(hù)城河。

03

就在2026年的元旦,另一股來自量化界的力量也加入了戰(zhàn)局。

由九坤投資創(chuàng)始團(tuán)隊(duì)發(fā)起成立的至知?jiǎng)?chuàng)新研究院(IQuestResearch),發(fā)布了名為IQuest-Coder-V1的開源代碼大模型。我們?cè)谖恼隆队质橇炕穑诙䝼(gè)DeepSeek時(shí)刻到來了?》中對(duì)其進(jìn)行了報(bào)道。

這支同樣出身于量化背景的團(tuán)隊(duì),他們僅有40B參數(shù)的模型,在SWE-benchVerified測(cè)試中斬獲了81.4%的高分,一舉達(dá)到了Claude和ChatGPT的水平。

而在Vibe Coding的戰(zhàn)場(chǎng)上,國內(nèi)互聯(lián)網(wǎng)大廠的動(dòng)作同樣不容小覷。

字節(jié)跳動(dòng)的豆包在2025年初就推出了Trae編程工具,并在AI編程功能上實(shí)現(xiàn)了HTML預(yù)覽、Python運(yùn)行和完整項(xiàng)目生成等能力,讓開發(fā)者可以在一個(gè)界面內(nèi)完成從構(gòu)思到部署的全流程。

阿里的通義千問則在12月26日更新到了Qwen Code v0.5.0版本。

此次更新的最大亮點(diǎn)就是支持在終端窗口中同時(shí)運(yùn)行四個(gè)Qwen Code實(shí)例,可并行處理智能問答、實(shí)時(shí)翻譯、原型設(shè)計(jì)、創(chuàng)意繪圖等不同任務(wù),實(shí)現(xiàn)了AI編程“跳出命令行”的突破。

不過,真正引發(fā)行業(yè)震動(dòng)的,是豆包在硬件終端上的突破性嘗試。

2025年12月1日,字節(jié)跳動(dòng)與中興通訊合作推出了搭載豆包手機(jī)助手的努比亞M153工程樣機(jī),售價(jià)3499元,首批約3萬臺(tái)在當(dāng)天迅速售罄,甚至在二手市場(chǎng)炒出了高價(jià)。

這款手機(jī)助手的核心能力在于跨應(yīng)用操作。用戶只需用自然語言下達(dá)指令,AI就能自動(dòng)跳轉(zhuǎn)多個(gè)應(yīng)用完成點(diǎn)外賣、訂機(jī)票、比價(jià)購物等復(fù)雜任務(wù)。

這一系列動(dòng)作背后,折射出的是AI大模型從云端走向終端、從工具走向入口的戰(zhàn)略轉(zhuǎn)型。

說不定DeepSeek手機(jī)也不遠(yuǎn)了。



與此同時(shí),資本市場(chǎng)也迎來了大模型行業(yè)的收獲季。

曾經(jīng)歷過“百模大戰(zhàn)”喧囂的中國AI行業(yè),正在加速向頭部收斂。智譜AI和MiniMax這兩家公司均已成功上市。

智譜是1月8日在港交所敲的鐘,發(fā)行價(jià)定在116.2港元/股,上市第一天就給了市場(chǎng)一個(gè)驚喜 —— 開盤120港元,收盤131.5港元,第一天就漲了13.17%,市值一下子沖到578.9億港元,成了 “全球大模型第一股”。

第二天開盤直接137.2港元起,收盤158.6港元,較首日收盤價(jià)又漲了20.6%,市值也跟著漲到698.21億港元,兩天下來從發(fā)行價(jià)算已經(jīng)漲了快37%,完全沒給空頭機(jī)會(huì)。

MiniMax比智譜晚一天,但風(fēng)頭更勁。發(fā)行價(jià)165港元/股,而且是頂格定價(jià),上市前一天的暗盤就已經(jīng)漲了25%-29%,報(bào)205.60-212.60港元。

上市當(dāng)天開盤235.4港元,漲了42.7%,之后一路飆升,盤中最高到351.8港元,最終收盤345港元,較發(fā)行價(jià)暴漲 109.09%,市值來到1054億港元,成了千億市值俱樂部新成員。

雖然高額的研發(fā)投入使得兩家公司目前仍處于虧損狀態(tài),但強(qiáng)勁的增長曲線證明了市場(chǎng)對(duì)于高質(zhì)量AI模型的付費(fèi)意愿正在形成。

中國AI方興未艾,但當(dāng)全球目光已經(jīng)再次聚焦到DeepSeek身上。一年前那個(gè)用低成本路徑顛覆行業(yè)認(rèn)知的團(tuán)隊(duì),即將在春節(jié)期間交出新的答卷。

DeepSeek能否第二次“震驚全世界”,只要再等幾天就會(huì)知曉。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
15億項(xiàng)目落地后,首次會(huì)見!湖北省委書記王忠林與李東生共話產(chǎn)業(yè)升級(jí)

15億項(xiàng)目落地后,首次會(huì)見!湖北省委書記王忠林與李東生共話產(chǎn)業(yè)升級(jí)

天下潮商
2026-01-12 16:19:38
6年了,郭麒麟的反擊幾乎斷送了朱亞文的演藝生涯

6年了,郭麒麟的反擊幾乎斷送了朱亞文的演藝生涯

小熊侃史
2025-12-25 11:24:12
廣西一精神小妹結(jié)婚,身上多處紋身新郎小她10歲,網(wǎng)友:相當(dāng)炸裂

廣西一精神小妹結(jié)婚,身上多處紋身新郎小她10歲,網(wǎng)友:相當(dāng)炸裂

唐小糖說情感
2026-01-07 16:37:28
特朗普捅了馬蜂窩,英國主導(dǎo),28國將派兵丹麥,中方甩出一紙憲章

特朗普捅了馬蜂窩,英國主導(dǎo),28國將派兵丹麥,中方甩出一紙憲章

素年文史
2026-01-12 16:03:00
美女白色露臍T恤配藍(lán)色瑜伽褲,性感值拉滿,簡(jiǎn)直是行走的 荷爾蒙

美女白色露臍T恤配藍(lán)色瑜伽褲,性感值拉滿,簡(jiǎn)直是行走的 荷爾蒙

小喬古裝漢服
2025-09-24 07:20:03
笑發(fā)財(cái)了!用一張沒有孩子的照片證明你有孩子,評(píng)論區(qū)炸鍋!

笑發(fā)財(cái)了!用一張沒有孩子的照片證明你有孩子,評(píng)論區(qū)炸鍋!

另子維愛讀史
2026-01-11 20:29:18
千萬不要小看你遇到的每一個(gè)顧客!網(wǎng)友:不到1個(gè)小時(shí)店就被封了

千萬不要小看你遇到的每一個(gè)顧客!網(wǎng)友:不到1個(gè)小時(shí)店就被封了

夜深愛雜談
2025-12-06 21:39:08
輸球又輸人!皇馬決賽最慘之人:阿隆索親手將他打入冷宮

輸球又輸人!皇馬決賽最慘之人:阿隆索親手將他打入冷宮

瀾歸序
2026-01-12 05:35:15
馮小剛徐帆婚變實(shí)錘?密會(huì)陳思誠3小時(shí),養(yǎng)女成“托孤”籌碼

馮小剛徐帆婚變實(shí)錘?密會(huì)陳思誠3小時(shí),養(yǎng)女成“托孤”籌碼

未曾青梅
2026-01-10 18:26:19
撒切爾夫人在回憶錄中坦言:當(dāng)年并不想歸還香港,考慮過發(fā)動(dòng)戰(zhàn)爭(zhēng)

撒切爾夫人在回憶錄中坦言:當(dāng)年并不想歸還香港,考慮過發(fā)動(dòng)戰(zhàn)爭(zhēng)

泠泠說史
2025-12-15 18:05:17
關(guān)于李莉教授的一張圖火了

關(guān)于李莉教授的一張圖火了

關(guān)爾東
2026-01-11 16:32:35
全國統(tǒng)一體制內(nèi)口頭禪,一出口就知道,網(wǎng)友:味太正了!

全國統(tǒng)一體制內(nèi)口頭禪,一出口就知道,網(wǎng)友:味太正了!

另子維愛讀史
2025-12-18 16:59:41
合川千人殺豬后續(xù):事情已傳到國外 場(chǎng)面失控呆呆被嚇哭 民警出面

合川千人殺豬后續(xù):事情已傳到國外 場(chǎng)面失控呆呆被嚇哭 民警出面

鋭娛之樂
2026-01-12 17:17:44
國乒領(lǐng)導(dǎo)班子競(jìng)聘揭曉:秦志戩總教練 肖戰(zhàn)副總教練 馬琳王皓連任

國乒領(lǐng)導(dǎo)班子競(jìng)聘揭曉:秦志戩總教練 肖戰(zhàn)副總教練 馬琳王皓連任

好乒乓
2026-01-12 23:26:44
賭王的四太太梁安琪私人相冊(cè)曝光,穿搭既美又颯,美艷不可方物!

賭王的四太太梁安琪私人相冊(cè)曝光,穿搭既美又颯,美艷不可方物!

可樂談情感
2026-01-12 13:04:02
溥儀在“偽滿”的權(quán)力有多大?別被他裝孫子的一面給騙了

溥儀在“偽滿”的權(quán)力有多大?別被他裝孫子的一面給騙了

掠影后有感
2026-01-09 11:08:09
火箭是偽強(qiáng)隊(duì),連續(xù)輸給西部弱旅,這樣的球隊(duì)不可能奪冠!

火箭是偽強(qiáng)隊(duì),連續(xù)輸給西部弱旅,這樣的球隊(duì)不可能奪冠!

愛體育
2026-01-12 23:29:32
笑不活了,真是半大小子,吃窮老子,評(píng)論區(qū)笑翻我

笑不活了,真是半大小子,吃窮老子,評(píng)論區(qū)笑翻我

夜深愛雜談
2026-01-12 20:14:58
曝庫皮揚(yáng)斯克數(shù)百俄軍被包圍后投降!烏軍摧毀俄羅斯軍船

曝庫皮揚(yáng)斯克數(shù)百俄軍被包圍后投降!烏軍摧毀俄羅斯軍船

項(xiàng)鵬飛
2026-01-10 20:46:46
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報(bào)
2025-12-14 22:36:54
2026-01-13 00:24:49
字母榜 incentive-icons
字母榜
讓未來不止于大。
2162文章數(shù) 8036關(guān)注度
往期回顧 全部

科技要聞

面對(duì)SpaceX瘋狂“下餃子” 中國正面接招

頭條要聞

外媒問王毅調(diào)整索馬里行程是否出于安全考慮 中方回應(yīng)

頭條要聞

外媒問王毅調(diào)整索馬里行程是否出于安全考慮 中方回應(yīng)

體育要聞

一場(chǎng)安東尼奧式勝利,給中國足球帶來驚喜

娛樂要聞

蔡少芬結(jié)婚18周年,與張晉過二人世界

財(cái)經(jīng)要聞

倍輕松信披迷霧 實(shí)控人占用資金金額存疑

汽車要聞

增配不加價(jià) 北京現(xiàn)代 第五代 勝達(dá)2026款上市

態(tài)度原創(chuàng)

教育
手機(jī)
本地
時(shí)尚
公開課

教育要聞

勸退:英國挨罵率最高的專業(yè)!

手機(jī)要聞

魅族23殺瘋了!沖擊1.0mm窄邊天花板,驍龍8 Gen5加持要掀翻行業(yè)?

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

看了日本主婦的搭配才明白,年紀(jì)大了這么穿,優(yōu)雅又不油膩

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版