国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

編程表現(xiàn)超越Claude和GPT?DeepSeek準(zhǔn)備第二次震驚全世界

0
分享至



去年7月,由于DeepSeek下載量從高峰期的8000多萬暴跌至2000多萬,下滑72.2%,“DeepSeek跌落神壇”就成為了當(dāng)時(shí)互聯(lián)網(wǎng)最熱門的話題。

但據(jù)多位知情人士透露,DeepSeek即將重登王座。他們計(jì)劃在二月中旬發(fā)布新一代模型DeepSeek-V4。

也就是農(nóng)歷2026年新年期間,距離上一代模型DeepSeek-R1的發(fā)布正好一年。

這次發(fā)布的重點(diǎn)是代碼生成和處理能力。

根據(jù)DeepSeek內(nèi)部的基準(zhǔn)測(cè)試,V4在編程任務(wù)上的表現(xiàn)超過了目前市場(chǎng)上的主流競(jìng)品,包括Anthropic的Claude和OpenAI的GPT系列。

根據(jù)報(bào)道,在即將發(fā)布的新模型中,DeepSeek團(tuán)隊(duì)解決了許多長期困擾AI發(fā)展的技術(shù)難題。很可能會(huì)徹底改變Vibe Coding產(chǎn)業(yè)。

01

報(bào)道中提到一件事,“DeepSeek-V4模型在整個(gè)訓(xùn)練過程中理解數(shù)據(jù)模式的能力也有所改進(jìn),且性能未出現(xiàn)衰減?!?/p>

這句話有些難以理解,我們不妨拆開來解讀。

首先是前半句,它指的是模型不再只是死記硬背數(shù)據(jù),而是能看透數(shù)據(jù)背后的規(guī)律和邏輯。

DeepSeek-R1有個(gè)具代表性的例子,就是讓模型數(shù)strawberry里有幾個(gè)r。

由于當(dāng)時(shí)的DeepSeek模型并不能理解“數(shù)”(count)這個(gè)概念,只能根據(jù)訓(xùn)練時(shí)的數(shù)據(jù)來輸出答案。可這個(gè)數(shù)據(jù)恰好又是錯(cuò)的,所以無論DeepSeek怎么思考,它給出的答案大多數(shù)情況都是2,而不是正確的3。



而DeepSeek-V4則會(huì)徹底杜絕這個(gè)情況,前提是在訓(xùn)練過程中,讓模型徹底理解某一件事情。

后半句的性能退化,指的是在AI訓(xùn)練中,隨著模型不斷學(xué)習(xí)新東西或訓(xùn)練時(shí)間加長,往往會(huì)出現(xiàn)“學(xué)了新的忘了舊的”或者模型變得不穩(wěn)定的情況。

這種現(xiàn)象在業(yè)內(nèi)被稱為“災(zāi)難性遺忘”(Catastrophic Forgetting)或“模型坍塌”(Model Collapse)。

因此,V4在不斷變聰明、變復(fù)雜的過程中,依然保持了極高的穩(wěn)定性和原有能力的完整性,沒有出現(xiàn)任何“副作用”或能力倒退。

這恰恰是構(gòu)建編程Agent的前置條件。

在現(xiàn)代軟件工程中,一個(gè)微小的修改可能波及數(shù)個(gè)文件、數(shù)千行代碼的依賴關(guān)系。

但是以往的模型往往受限于上下文窗口或注意力機(jī)制的衰減,從而沒辦法對(duì)于龐大的項(xiàng)目進(jìn)行修改。

V4極有可能是一個(gè)為“Agent時(shí)代”量身定制的模型。

一年前,DeepSeek-R1 的發(fā)布確實(shí)在行業(yè)內(nèi)引起了不小的波動(dòng)。那款主打推理能力的模型證明了低成本研發(fā)路徑的可行性。

然而一年后的今天,人工智能行業(yè)的關(guān)注焦點(diǎn)已經(jīng)發(fā)生了顯著轉(zhuǎn)移。單純的文本生成或邏輯推理已不再是唯一的競(jìng)爭(zhēng)高地,代碼生成正在演變?yōu)榇竽P湍芰Φ摹霸嚱鹗薄?/p>

在當(dāng)前的開發(fā)環(huán)境中,“Vibe Coding”成為新趨勢(shì),要求AI不僅能補(bǔ)全代碼,更能理解開發(fā)者的意圖流(Flow),實(shí)現(xiàn)從自然語言到復(fù)雜工程邏輯的無縫轉(zhuǎn)化。

DeepSeek似乎已經(jīng)準(zhǔn)備好在新賽道上狂飆了。

02

如果深入梳理DeepSeek團(tuán)隊(duì)以及核心人物梁文鋒在R1發(fā)布之后這一年里的學(xué)術(shù)軌跡,我們會(huì)發(fā)現(xiàn)一條清晰且扎實(shí)的技術(shù)演進(jìn)路線。

這些公開發(fā)表的論文與技術(shù)報(bào)告,不僅是對(duì)過去成果的總結(jié),更是V4強(qiáng)大能力的注腳與預(yù)演。

2025年9月,DeepSeek-R1的相關(guān)論文成功登上了頂級(jí)學(xué)術(shù)期刊《Nature》的封面,梁文鋒署名通訊作者。

面對(duì)審稿人關(guān)于是否使用了OpenAI模型輸出進(jìn)行蒸餾訓(xùn)練的尖銳質(zhì)疑,DeepSeek團(tuán)隊(duì)在回應(yīng)中給出了明確的否認(rèn),并首次公開了令人咋舌的低成本數(shù)據(jù):從V3-Base訓(xùn)練到R1,僅花費(fèi)了29.4萬美元。

當(dāng)然,這個(gè)成本僅指R1的后訓(xùn)練階段成本,不包含V3-Base基礎(chǔ)模型本身約600萬美元的訓(xùn)練投入。

數(shù)據(jù)公開后,以及《Nature》為此專門撰寫的社論,標(biāo)志著DeepSeek在學(xué)術(shù)嚴(yán)謹(jǐn)性和技術(shù)原創(chuàng)性上獲得了國際最高認(rèn)可,徹底洗刷了外界對(duì)于中國大模型“套殼”或“跟隨”的刻板印象。

不過,真正能佐證DeepSeek-V4在代碼方面有大幅突破的證據(jù),是2025年最后一天,DeepSeek團(tuán)隊(duì)發(fā)表的論文《mHC:流形約束超連接》。

代碼生成任務(wù)對(duì)模型的邏輯深度和上下文跨度有著極高的要求,這通常需要更大規(guī)模的模型參數(shù)和更深的網(wǎng)絡(luò)結(jié)構(gòu)。

然而,傳統(tǒng)的超連接(Hyper-Connections)架構(gòu)在模型規(guī)模擴(kuò)大時(shí),會(huì)面臨嚴(yán)重的信號(hào)增益問題,最終導(dǎo)致訓(xùn)練過程極不穩(wěn)定甚至崩潰。

為了解決這一阻礙模型擴(kuò)容的根本性物理難題,DeepSeek團(tuán)隊(duì)在這篇論文中提出了一種全新的架構(gòu)mHC。

簡單來說,它給狂奔的信號(hào)加了一道精密的閥門,將信號(hào)增益嚴(yán)格控制在1.6倍左右。

論文數(shù)據(jù)顯示,在3B、9B乃至18B參數(shù)規(guī)模的模型測(cè)試中,應(yīng)用了mHC架構(gòu)的模型在BIG-BenchHard推理基準(zhǔn)上提升了2.1%。

這項(xiàng)由梁文鋒聯(lián)合署名的研究成果,實(shí)際上解決了大模型在“做大”和“做復(fù)雜”過程中的穩(wěn)定性難題。

這意味著V4模型極有可能采用了這種全新的架構(gòu),從而在擁有更龐大參數(shù)量和更深層推理能力的同時(shí),依然保持了高效的訓(xùn)練效率和極高的穩(wěn)定性。



不僅如此,在2026年1月初,DeepSeek悄無聲息地將arXiV上的R1論文從原本的22頁大幅擴(kuò)充至86頁。

這多出來的60多頁內(nèi)容,詳盡地披露了R1的完整訓(xùn)練管線,包括冷啟動(dòng)、推理導(dǎo)向的強(qiáng)化學(xué)習(xí)(RL)、拒絕采樣與再微調(diào)、以及對(duì)齊導(dǎo)向的強(qiáng)化學(xué)習(xí)這四個(gè)關(guān)鍵步驟。

業(yè)界普遍推測(cè),這種在春節(jié)前夕“清庫存”式的技術(shù)披露,往往預(yù)示著下一代更強(qiáng)大的技術(shù)已經(jīng)成熟。

既然R1的技術(shù)細(xì)節(jié)已經(jīng)不再是核心壁壘,那么即將到來的V4必然擁有了更高維度的護(hù)城河。

03

就在2026年的元旦,另一股來自量化界的力量也加入了戰(zhàn)局。

由九坤投資創(chuàng)始團(tuán)隊(duì)發(fā)起成立的至知?jiǎng)?chuàng)新研究院(IQuestResearch),發(fā)布了名為IQuest-Coder-V1的開源代碼大模型。我們?cè)谖恼隆队质橇炕?,第二個(gè)DeepSeek時(shí)刻到來了?》中對(duì)其進(jìn)行了報(bào)道。

這支同樣出身于量化背景的團(tuán)隊(duì),他們僅有40B參數(shù)的模型,在SWE-benchVerified測(cè)試中斬獲了81.4%的高分,一舉達(dá)到了Claude和ChatGPT的水平。

而在Vibe Coding的戰(zhàn)場(chǎng)上,國內(nèi)互聯(lián)網(wǎng)大廠的動(dòng)作同樣不容小覷。

字節(jié)跳動(dòng)的豆包在2025年初就推出了Trae編程工具,并在AI編程功能上實(shí)現(xiàn)了HTML預(yù)覽、Python運(yùn)行和完整項(xiàng)目生成等能力,讓開發(fā)者可以在一個(gè)界面內(nèi)完成從構(gòu)思到部署的全流程。

阿里的通義千問則在12月26日更新到了Qwen Code v0.5.0版本。

此次更新的最大亮點(diǎn)就是支持在終端窗口中同時(shí)運(yùn)行四個(gè)Qwen Code實(shí)例,可并行處理智能問答、實(shí)時(shí)翻譯、原型設(shè)計(jì)、創(chuàng)意繪圖等不同任務(wù),實(shí)現(xiàn)了AI編程“跳出命令行”的突破。

不過,真正引發(fā)行業(yè)震動(dòng)的,是豆包在硬件終端上的突破性嘗試。

2025年12月1日,字節(jié)跳動(dòng)與中興通訊合作推出了搭載豆包手機(jī)助手的努比亞M153工程樣機(jī),售價(jià)3499元,首批約3萬臺(tái)在當(dāng)天迅速售罄,甚至在二手市場(chǎng)炒出了高價(jià)。

這款手機(jī)助手的核心能力在于跨應(yīng)用操作。用戶只需用自然語言下達(dá)指令,AI就能自動(dòng)跳轉(zhuǎn)多個(gè)應(yīng)用完成點(diǎn)外賣、訂機(jī)票、比價(jià)購物等復(fù)雜任務(wù)。

這一系列動(dòng)作背后,折射出的是AI大模型從云端走向終端、從工具走向入口的戰(zhàn)略轉(zhuǎn)型。

說不定DeepSeek手機(jī)也不遠(yuǎn)了。



與此同時(shí),資本市場(chǎng)也迎來了大模型行業(yè)的收獲季。

曾經(jīng)歷過“百模大戰(zhàn)”喧囂的中國AI行業(yè),正在加速向頭部收斂。智譜AI和MiniMax這兩家公司均已成功上市。

智譜是1月8日在港交所敲的鐘,發(fā)行價(jià)定在116.2港元/股,上市第一天就給了市場(chǎng)一個(gè)驚喜 —— 開盤120港元,收盤131.5港元,第一天就漲了13.17%,市值一下子沖到578.9億港元,成了 “全球大模型第一股”。

第二天開盤直接137.2港元起,收盤158.6港元,較首日收盤價(jià)又漲了20.6%,市值也跟著漲到698.21億港元,兩天下來從發(fā)行價(jià)算已經(jīng)漲了快37%,完全沒給空頭機(jī)會(huì)。

MiniMax比智譜晚一天,但風(fēng)頭更勁。發(fā)行價(jià)165港元/股,而且是頂格定價(jià),上市前一天的暗盤就已經(jīng)漲了25%-29%,報(bào)205.60-212.60港元。

上市當(dāng)天開盤235.4港元,漲了42.7%,之后一路飆升,盤中最高到351.8港元,最終收盤345港元,較發(fā)行價(jià)暴漲 109.09%,市值來到1054億港元,成了千億市值俱樂部新成員。

雖然高額的研發(fā)投入使得兩家公司目前仍處于虧損狀態(tài),但強(qiáng)勁的增長曲線證明了市場(chǎng)對(duì)于高質(zhì)量AI模型的付費(fèi)意愿正在形成。

中國AI方興未艾,但當(dāng)全球目光已經(jīng)再次聚焦到DeepSeek身上。一年前那個(gè)用低成本路徑顛覆行業(yè)認(rèn)知的團(tuán)隊(duì),即將在春節(jié)期間交出新的答卷。

DeepSeek能否第二次“震驚全世界”,只要再等幾天就會(huì)知曉。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
歐冠一夜4場(chǎng):全是生死大戰(zhàn)!16強(qiáng)將出爐 意甲雙雄命懸一線

歐冠一夜4場(chǎng):全是生死大戰(zhàn)!16強(qiáng)將出爐 意甲雙雄命懸一線

葉青足球世界
2026-02-25 09:58:56
歐冠16強(qiáng)出爐!1/8決賽抽簽將于2月27日19時(shí)進(jìn)行

歐冠16強(qiáng)出爐!1/8決賽抽簽將于2月27日19時(shí)進(jìn)行

懂球帝
2026-02-26 07:06:03
120抵達(dá)40分鐘后病人才上救護(hù)車,老人搶救無效死亡急救中心被判賠17萬余元 急救搬抬如何破局?|紅星深度

120抵達(dá)40分鐘后病人才上救護(hù)車,老人搶救無效死亡急救中心被判賠17萬余元 急救搬抬如何破局?|紅星深度

紅星新聞
2026-02-25 21:05:18
公司市值近百億!“關(guān)鍵先生”除夕前去世,享年61歲……5天前還在開會(huì)

公司市值近百億!“關(guān)鍵先生”除夕前去世,享年61歲……5天前還在開會(huì)

上觀新聞
2026-02-25 14:12:07
馬筱梅兒子被質(zhì)疑不是新生兒,疑在大S忌日出生,行程被扒惹爭(zhēng)議

馬筱梅兒子被質(zhì)疑不是新生兒,疑在大S忌日出生,行程被扒惹爭(zhēng)議

古希臘掌管月桂的神
2026-02-25 12:42:43
廣東1歲男童家門口走失,當(dāng)?shù)鼗貞?yīng):在家附近的魚塘中發(fā)現(xiàn)該兒童,已無生命體征

廣東1歲男童家門口走失,當(dāng)?shù)鼗貞?yīng):在家附近的魚塘中發(fā)現(xiàn)該兒童,已無生命體征

瀟湘晨報(bào)
2026-02-25 22:07:19
繼父摟腰親吻女童引爭(zhēng)議,當(dāng)時(shí)生母就在現(xiàn)場(chǎng)

繼父摟腰親吻女童引爭(zhēng)議,當(dāng)時(shí)生母就在現(xiàn)場(chǎng)

天涯社區(qū)
2026-02-25 17:08:18
許家印身后,江蘇包工頭黃裕輝被恒大拖欠360億,82個(gè)項(xiàng)目停工

許家印身后,江蘇包工頭黃裕輝被恒大拖欠360億,82個(gè)項(xiàng)目停工

復(fù)轉(zhuǎn)小能手
2026-02-25 23:39:49
2-1!巴爾韋德獨(dú)造2球,熊皇破門制勝,皇馬雙殺晉級(jí),或再戰(zhàn)曼城

2-1!巴爾韋德獨(dú)造2球,熊皇破門制勝,皇馬雙殺晉級(jí),或再戰(zhàn)曼城

我的護(hù)球最獨(dú)特
2026-02-26 06:08:37
歐冠史詩級(jí)臥底!本塞拜尼單場(chǎng)解鎖失誤全成就,把多特坑出歐冠

歐冠史詩級(jí)臥底!本塞拜尼單場(chǎng)解鎖失誤全成就,把多特坑出歐冠

阿錯(cuò)田間生活
2026-02-26 06:47:45
跨省掛職!王明穎任中山市副市長

跨省掛職!王明穎任中山市副市長

南方都市報(bào)
2026-02-25 20:26:10
別再存定期了!央行釋放重要信號(hào):普通人的財(cái)富保衛(wèi),主戰(zhàn)場(chǎng)已變

別再存定期了!央行釋放重要信號(hào):普通人的財(cái)富保衛(wèi),主戰(zhàn)場(chǎng)已變

復(fù)轉(zhuǎn)小能手
2026-02-24 17:31:33
抓捕馬杜羅的飛行員雙腿被子彈打穿,被授予最高榮譽(yù)——國會(huì)榮譽(yù)勛章

抓捕馬杜羅的飛行員雙腿被子彈打穿,被授予最高榮譽(yù)——國會(huì)榮譽(yù)勛章

大洛杉磯LA
2026-02-26 01:08:17
造不出就買!260 億吞下美國打印機(jī)巨頭,珠海破解暴利壟斷

造不出就買!260 億吞下美國打印機(jī)巨頭,珠海破解暴利壟斷

知識(shí)TNT
2026-02-24 12:30:09
皇馬沒有在本菲卡身上再掉鏈子,但這已經(jīng)是某種成功了嗎?

皇馬沒有在本菲卡身上再掉鏈子,但這已經(jīng)是某種成功了嗎?

寫球的牧子
2026-02-26 06:51:36
中國幣圈富豪孫宇晨:快刪除所有90后之前出生人的聯(lián)系方式 停用微信換豆包

中國幣圈富豪孫宇晨:快刪除所有90后之前出生人的聯(lián)系方式 停用微信換豆包

快科技
2026-02-25 18:52:04
硅谷養(yǎng)老夢(mèng)碎!OpenAI深夜突發(fā):不接受996的就走,AGI不養(yǎng)閑人

硅谷養(yǎng)老夢(mèng)碎!OpenAI深夜突發(fā):不接受996的就走,AGI不養(yǎng)閑人

新智元
2026-02-25 09:23:15
破紀(jì)錄,湖人隊(duì)輸凱爾特人隊(duì)的比賽創(chuàng)造了2000年以來的收視紀(jì)錄

破紀(jì)錄,湖人隊(duì)輸凱爾特人隊(duì)的比賽創(chuàng)造了2000年以來的收視紀(jì)錄

好火子
2026-02-26 06:57:17
永久停業(yè)!天津這家22年老店也干黃了?

永久停業(yè)!天津這家22年老店也干黃了?

天津人
2026-02-25 17:46:07
伴隨著孫穎莎3-1晉級(jí)!女單16強(qiáng)全部誕生,中國8人日本6人韓國1人

伴隨著孫穎莎3-1晉級(jí)!女單16強(qiáng)全部誕生,中國8人日本6人韓國1人

曹說體育
2026-02-25 23:41:40
2026-02-26 07:16:49
字母榜 incentive-icons
字母榜
讓未來不止于大。
2246文章數(shù) 8044關(guān)注度
往期回顧 全部

科技要聞

“機(jī)器人只跳舞,沒什么用”

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

體育要聞

勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財(cái)經(jīng)要聞

上海樓市放大招,地產(chǎn)預(yù)期別太大

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

游戲
時(shí)尚
健康
教育
手機(jī)

《如龍極3》中文配音訪談:中文配音與本地化并非易事

“復(fù)古甜心”穿搭突然大火!春天穿時(shí)髦又減齡

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

教育要聞

專業(yè)調(diào)劑不懂就虧大了!3招避免入坑

手機(jī)要聞

谷歌官方“豆包手機(jī)”來了,安卓旗艦迎來AI操控功能

無障礙瀏覽 進(jìn)入關(guān)懷版