国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeek-R2要來(lái)了?

0
分享至


新智元報(bào)道

編輯:Aeneas KingHZ

【新智元導(dǎo)讀】DeepSeek-R1發(fā)布一周年之際,核心算法庫(kù)驚現(xiàn)MODEL1,是V4還是R2?

2025年1月20日,DeepSeek-R1正式發(fā)布。從此,國(guó)產(chǎn)大模型第一次走到了全球舞臺(tái)的核心位置,開(kāi)啟了開(kāi)源時(shí)代。

而就在今天深夜,開(kāi)發(fā)者社區(qū)沸騰了:DeepSeek的一個(gè)存儲(chǔ)庫(kù)進(jìn)行更新,引用了一個(gè)全新的「model 1」模型。


DeepSeek-R1一年了,但DeepSeek-R2還沒(méi)來(lái)。

而這個(gè)被爆出的MODEL1,極有可能就是R2!

在DeepSeek的開(kāi)源項(xiàng)目FlashMLA庫(kù)代碼片段明確引用了「MODEL1」,并且伴隨針對(duì)KV緩存的新優(yōu)化,和576B步幅的稀疏FP8解碼支持。


FlashMLA是DeepSeek的優(yōu)化注意力內(nèi)核庫(kù),為DeepSeek-V3和DeepSeek-V3.2-Exp模型提供支持。


項(xiàng)目里,大約有28處提到model 1。















這可以被解讀為新模型即將發(fā)布的明確信號(hào)。

巧的是,這個(gè)爆料正好趕在DeepSeek-R1發(fā)布一周年(2025年1月20日)。

R1作為開(kāi)源推理模型,曾匹敵OpenAI o1并登頂iOS App Store,此后徹底改變了開(kāi)源AI社區(qū)。

MODEL1即便不是R2,也意義非凡,畢竟FlashMLA是DeepSeek優(yōu)化的注意力核心算法庫(kù)。

FlashMLA是DeepSeek為Hopper架構(gòu)GPU(如H800)優(yōu)化的MLA(Multi-head Latent Attention)解碼內(nèi)核。

在推理層代碼中提及新模型ID,往往意味著該新模型(代號(hào)為Model1)將繼續(xù)復(fù)用或改進(jìn)現(xiàn)有的MLA架構(gòu)。

這表明 DeepSeek 團(tuán)隊(duì)正緊鑼密鼓地推進(jìn)新模型的推理適配工作,F(xiàn)lashMLA 作為其核心推理優(yōu)化的地位依然穩(wěn)固。

過(guò)去,DeepSeek的確遇到了一些麻煩。

本月15日,國(guó)外媒體報(bào)道,去年在研發(fā)其新一代旗艦?zāi)P蜁r(shí),DeepSeek在算力上碰到了一點(diǎn)麻煩。但DeepSeek及時(shí)調(diào)整了策略,取得了進(jìn)展,并正準(zhǔn)備在「未來(lái)幾周內(nèi)」推出這款新模型。

HuggingFace:

DeepSeek如何改變開(kāi)源AI

HuggingFace在DeepSeek R1發(fā)布一周年之際,發(fā)文解釋了DeepSeek如何改變了開(kāi)源AI。


R1并不是當(dāng)時(shí)最強(qiáng)的模型,真正意義而在于它如何降低了三重壁壘。

首先是技術(shù)壁壘。

通過(guò)公開(kāi)分享其推理路徑和后訓(xùn)練方法,R1將曾經(jīng)封閉在API背后的高級(jí)推理能力,轉(zhuǎn)變?yōu)榭上螺d、可蒸餾、可微調(diào)的工程資產(chǎn)。

許多團(tuán)隊(duì)不再需要從頭訓(xùn)練大模型就能獲得強(qiáng)大的推理能力。推理開(kāi)始表現(xiàn)得像一個(gè)可復(fù)用的模塊,在不同的系統(tǒng)中反復(fù)應(yīng)用。這也推動(dòng)行業(yè)重新思考模型能力與計(jì)算成本之間的關(guān)系,這種轉(zhuǎn)變?cè)谥袊?guó)這樣算力受限的環(huán)境中尤為有意義。

其次是采用壁壘。

R1以MIT許可證發(fā)布,使其使用、修改和再分發(fā)變得簡(jiǎn)單直接。原本依賴閉源模型的公司開(kāi)始直接將R1投入生產(chǎn)。蒸餾、二次訓(xùn)練和領(lǐng)域適應(yīng)變成了常規(guī)的工程工作,而非特殊項(xiàng)目。

隨著分發(fā)限制的解除,模型迅速擴(kuò)散到云平臺(tái)和工具鏈中,社區(qū)討論的重點(diǎn)也從「哪個(gè)模型分?jǐn)?shù)更高」轉(zhuǎn)向了「如何部署它、降低成本并將其集成到實(shí)際系統(tǒng)中」。

久而久之,R1超越了研究產(chǎn)物的范疇,成為了可復(fù)用的工程基礎(chǔ)。

第三個(gè)變化是心理層面的。

當(dāng)問(wèn)題從「我們能做這個(gè)嗎?」轉(zhuǎn)變?yōu)椤肝覀內(nèi)绾巫龊眠@個(gè)?」時(shí),許多公司的決策都發(fā)生了變化。

對(duì)中國(guó)AI社區(qū)而言,這也是一個(gè)難得的、獲得全球持續(xù)關(guān)注的時(shí)刻,對(duì)于一個(gè)長(zhǎng)期被視為跟隨者的生態(tài)系統(tǒng)來(lái)說(shuō),這一點(diǎn)至關(guān)重要。


這三個(gè)壁壘的降低共同意味著,生態(tài)系統(tǒng)開(kāi)始獲得了自我復(fù)制的能力。

DeepSeek-R1一周年

今天,讓我們回到原點(diǎn),回顧DeepSeek-R1誕生的一年。

在R1之前,大模型的進(jìn)化方向幾乎只有一個(gè),更大的參數(shù)規(guī)模、更多的數(shù)據(jù)……

但是,模型真的在思考嗎?

這個(gè)問(wèn)題,就是DeepSeek-R1的起點(diǎn)。

它不是讓讓模型回答得更快,而是刻意讓它慢下來(lái),慢在推理鏈條的展開(kāi),慢在中間狀態(tài)的顯式表達(dá)。

從技術(shù)上看,DeepSeek-R1的關(guān)鍵突破,并不在某一個(gè)單點(diǎn)技巧,而在一整套系統(tǒng)性設(shè)計(jì)。


推理優(yōu)先的訓(xùn)練目標(biāo)

在傳統(tǒng)SFT/RLHF體系中,最終答案的「正確性」是唯一目標(biāo)。R1 則引入了更細(xì)粒度的信號(hào)。這也是第一次,模型

高密度推理數(shù)據(jù),而非高密度知識(shí)

R1的訓(xùn)練數(shù)據(jù),不追求百科全書式的覆蓋,而是高度聚焦在數(shù)學(xué)與邏輯推導(dǎo)、可驗(yàn)證的復(fù)雜任務(wù)。

總之,答案不重要,過(guò)程才重要。因此,R1才在數(shù)學(xué)、代碼、復(fù)雜推理上,呈現(xiàn)出「跨尺度躍遷」。

推理過(guò)程的內(nèi)化,而不是復(fù)讀模板

一個(gè)常見(jiàn)誤解是:R1只是「更會(huì)寫CoT」。

但真正的變化在于:模型并不是在復(fù)讀訓(xùn)練中見(jiàn)過(guò)的推理模板,而是在內(nèi)部形成了穩(wěn)定的推理狀態(tài)轉(zhuǎn)移結(jié)構(gòu)。

從此,推理不再是外掛,而是內(nèi)生能力。

一年之后:R1改變了什么?

首先,它改變了對(duì)「對(duì)齊」的理解。

R1之后,我們開(kāi)始意識(shí)到,對(duì)齊不僅是價(jià)值對(duì)齊,也是認(rèn)知過(guò)程的對(duì)齊。

第二,它改變了我們對(duì)開(kāi)源模型的想象空間。

R1證明:在推理維度,開(kāi)源模型不是追隨者,而可以成為范式定義者。這極大激活了社區(qū)對(duì)「Reasoning LLM」的探索熱情。

第三,它改變了工程師與模型的協(xié)作方式。

當(dāng)模型開(kāi)始「展示思路」,人類就不再是提問(wèn)者,而是合作者。

回到今天:R1仍然是一條未走完的路。

一周年,并不是終點(diǎn)。

我們?nèi)匀磺宄刂溃和评砟芰有明顯上限,長(zhǎng)鏈路思考仍然昂貴

但正如一年前做出 R1 的那個(gè)選擇一樣——真正重要的,不是已經(jīng)解決了什么,而是方向是否正確。

DeepSeek-R1的故事,還在繼續(xù)。

而這一年,只是序章。

參考資料:

https://huggingface.co/blog/huggingface/one-year-since-the-deepseek-moment%20

https://x.com/testingcatalog/status/2013588515271962678%20

https://x.com/nopainkiller/status/2013522059662614653


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
GE 旋轉(zhuǎn)爆轟引擎試車成功,美軍導(dǎo)彈要告別 “笨重助推器”?

GE 旋轉(zhuǎn)爆轟引擎試車成功,美軍導(dǎo)彈要告別 “笨重助推器”?

航空之家Aviation
2026-01-20 18:55:15
南京除雪工作引來(lái)全網(wǎng)吐槽!今年為何如此遲緩,往年堪稱標(biāo)兵!

南京除雪工作引來(lái)全網(wǎng)吐槽!今年為何如此遲緩,往年堪稱標(biāo)兵!

和平聲浪
2026-01-21 10:44:32
歐洲危險(xiǎn)轉(zhuǎn)向,歐爾班公開(kāi)示警

歐洲危險(xiǎn)轉(zhuǎn)向,歐爾班公開(kāi)示警

陸棄
2026-01-20 10:46:58
浙江包工頭多器官衰竭,醫(yī)院一直沒(méi)找出病因,母親煮餃子察覺(jué)蹊蹺

浙江包工頭多器官衰竭,醫(yī)院一直沒(méi)找出病因,母親煮餃子察覺(jué)蹊蹺

二十一號(hào)故事鋪
2024-10-18 19:35:03
視頻女博主怒撕嫣然醫(yī)院房東!完全就是謊話連篇,你真的是找抽

視頻女博主怒撕嫣然醫(yī)院房東!完全就是謊話連篇,你真的是找抽

小徐講八卦
2026-01-20 13:28:43
邵佳一迎開(kāi)門紅 國(guó)足首秀2-0取勝 國(guó)安雙星建功 兩套陣容各踢半場(chǎng)

邵佳一迎開(kāi)門紅 國(guó)足首秀2-0取勝 國(guó)安雙星建功 兩套陣容各踢半場(chǎng)

我愛(ài)英超
2026-01-20 23:41:13
真有戲!切爾西關(guān)注門將李昊:20年內(nèi)已看中第3名中國(guó)球員!

真有戲!切爾西關(guān)注門將李昊:20年內(nèi)已看中第3名中國(guó)球員!

邱澤云
2026-01-20 17:52:51
梁洛施罕見(jiàn)談離開(kāi)李澤楷原因:他很富有,是一生摯愛(ài),也不后悔

梁洛施罕見(jiàn)談離開(kāi)李澤楷原因:他很富有,是一生摯愛(ài),也不后悔

素素娛樂(lè)
2026-01-21 09:55:35
驚人的兩倍電力鴻溝,讓所有制裁成了笑話

驚人的兩倍電力鴻溝,讓所有制裁成了笑話

李榮茂
2026-01-20 08:45:13
局長(zhǎng)被免職后去世,全局只有我去吊唁,后來(lái)他的妻子擔(dān)任市委書記

局長(zhǎng)被免職后去世,全局只有我去吊唁,后來(lái)他的妻子擔(dān)任市委書記

秋風(fēng)專欄
2025-12-29 16:32:49
田樸珺送書給段永平教他賺錢!王石那個(gè)捂臉的動(dòng)作,勝過(guò)千言萬(wàn)語(yǔ)

田樸珺送書給段永平教他賺錢!王石那個(gè)捂臉的動(dòng)作,勝過(guò)千言萬(wàn)語(yǔ)

火山詩(shī)話
2026-01-19 06:54:12
嫣然眾籌超2000萬(wàn),噩耗傳來(lái)!律師曝猛料,再多錢也恐難保住醫(yī)院

嫣然眾籌超2000萬(wàn),噩耗傳來(lái)!律師曝猛料,再多錢也恐難保住醫(yī)院

阿纂看事
2026-01-20 12:03:39
奔馳:新一代S級(jí)不是常規(guī)中期改款,從內(nèi)到外都是史上最大革新

奔馳:新一代S級(jí)不是常規(guī)中期改款,從內(nèi)到外都是史上最大革新

IT之家
2026-01-21 08:03:17
越南U23門將:中國(guó)隊(duì)踢得和之前完全不一樣,這讓我們很意外

越南U23門將:中國(guó)隊(duì)踢得和之前完全不一樣,這讓我們很意外

懂球帝
2026-01-21 03:05:10
俄柬菲免簽了,明星們卻扎堆北海道

俄柬菲免簽了,明星們卻扎堆北海道

生活時(shí)尚導(dǎo)刊
2026-01-19 22:00:12
斷崖式下跌!中國(guó)人突然不愛(ài)喝酒了?真相太扎心!

斷崖式下跌!中國(guó)人突然不愛(ài)喝酒了?真相太扎心!

達(dá)文西看世界
2026-01-18 20:56:11
馬曉春回應(yīng)缺席聶衛(wèi)平告別儀式,感嘆世間再無(wú)“聶馬雙龍會(huì)”

馬曉春回應(yīng)缺席聶衛(wèi)平告別儀式,感嘆世間再無(wú)“聶馬雙龍會(huì)”

米修體育
2026-01-20 15:14:15
10月大男嬰全身被扎針孔后就醫(yī)?各方急尋;昆明市衛(wèi)健委:警方已介入;墨江縣多部門核查

10月大男嬰全身被扎針孔后就醫(yī)?各方急尋;昆明市衛(wèi)健委:警方已介入;墨江縣多部門核查

大風(fēng)新聞
2026-01-20 20:33:04
2026年1月車市涼透了!銷量暴跌67%,到底是誰(shuí)按下了暫停鍵?

2026年1月車市涼透了!銷量暴跌67%,到底是誰(shuí)按下了暫停鍵?

老特有話說(shuō)
2026-01-20 21:55:30
睡下屬泡學(xué)妹,深扒劉強(qiáng)東的五個(gè)女人和六個(gè)孩子,章澤天地位不穩(wěn)

睡下屬泡學(xué)妹,深扒劉強(qiáng)東的五個(gè)女人和六個(gè)孩子,章澤天地位不穩(wěn)

科學(xué)發(fā)掘
2026-01-21 00:12:49
2026-01-21 13:16:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14375文章數(shù) 66521關(guān)注度
往期回顧 全部

科技要聞

中芯國(guó)際等巨頭集體提價(jià),8英寸芯片最高漲20%

頭條要聞

夫妻吵架丈夫放話"不想活了"后離家出走 警察找了一宿

頭條要聞

夫妻吵架丈夫放話"不想活了"后離家出走 警察找了一宿

體育要聞

只會(huì)防守反擊?不好意思,我們要踢決賽了

娛樂(lè)要聞

李亞鵬2天獲1291萬(wàn)網(wǎng)友力挺

財(cái)經(jīng)要聞

拆解涉稅黑中介虛開(kāi)套路

汽車要聞

新一代理想L9電池加碼體型加大 重奪高端話語(yǔ)權(quán)

態(tài)度原創(chuàng)

游戲
親子
藝術(shù)
房產(chǎn)
數(shù)碼

等15年了!神鬼寓言新作將亮相Xbox直面會(huì)粉絲狂歡

親子要聞

最近元元迷上了看手機(jī),幫我想想怎么辦?

藝術(shù)要聞

一百多年前的中國(guó),太雄偉震撼了!

房產(chǎn)要聞

那個(gè)砸下400億的綠地,又要?dú)⒒睾D狭耍?/h3>

數(shù)碼要聞

神舟戰(zhàn)神T10 Pro/T11 Pro新品發(fā)布:最高i9-14900HX + RTX 5080

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版