国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

新發(fā)代碼藏彩蛋!114個文件泄密 DeepSeek新模型為“MODEL1”?

0
分享至

作者|子川

來源|AI先鋒官

作為明星產(chǎn)品,必須得用放大鏡看!

正值DeepSeek-R1 發(fā)布一周年之際,DeepSeek 在 GitHub 上悄悄更新了一波代碼。

結(jié)果,眼尖的開發(fā)者在 DeepSeek 核心的推理優(yōu)化庫FlashMLA中,發(fā)現(xiàn)了一個此前從未公開過的神秘代號:“MODEL1”。


目前,行業(yè)內(nèi)普遍猜測,這極有可能就是DeepSeek即將發(fā)布的下一代旗艦?zāi)P汀?/p>

而這次曝光的“MODEL1”,到底是什么來頭?

首先,我們要知道它是怎么被發(fā)現(xiàn)的。

這次泄露的源頭,來自DeepSeek的一個開源項目——FlashMLA。

可能大家對FlashMLA不太熟悉,這里給大家簡單介紹一下。

這是DeepSeek自研工具,專門為英偉達GPU做深度優(yōu)化。

正是有了它,DeepSeek才能在模型架構(gòu)層面減少內(nèi)存占用,把GPU硬件的性能榨干到極致,從而實現(xiàn)了“低成本高性能”。

而在最近更新的代碼中,開發(fā)者們發(fā)現(xiàn)在橫跨114個文件中,有28處都明確提到了“MODEL1”這個新標識符。

在代碼邏輯里,“MODEL1”是與“V32”(也就是DeepSeek-V3.2)并列存在的。


這意味著,它絕不是V3版本的簡單修補,而是一個采用了全新架構(gòu)的獨立模型。

根據(jù)技術(shù)大神的深度分析,“MODEL1”的核心變化主要體現(xiàn)在“回歸標準”和“極致效率”上。

以前的V3模型,為了追求極致性能,采用了一種比較特殊的576維設(shè)計,而“MODEL1”則切換回了512維的標準配置。

這樣做的好處非常明顯:它能更好地適配英偉達下一代Blackwell(SM100)芯片。

不僅如此,“MODEL1”還引入了更高級的“稀疏化”技術(shù)。

在代碼中,出現(xiàn)了大量針對FP8(8位浮點數(shù))數(shù)據(jù)格式的解碼支持,以及鍵值(KV)緩存的優(yōu)化。

它能在處理極長內(nèi)容時,智能地跳過不重要的計算步驟,同時利用FP8格式把記憶內(nèi)容進行高保真壓縮。

這直接帶來的結(jié)果就是:內(nèi)存占用大幅降低,計算效率成倍提升。

這意味著,可以用更便宜的顯卡,就能跑得動更強的模型。

那么,這個“MODEL1”到底是傳說中的V4,還是推理模型R2?

目前行業(yè)內(nèi)主要有兩種看法。

一種觀點認為,它是DeepSeek V4。

按照 DeepSeek 的命名慣例,在 V3.2 之后的旗艦級架構(gòu)跨越,邏輯上即為 V4。

并且此前就有外媒報道,DeepSeek計劃在2月(春節(jié)前后)發(fā)布新一代旗艦?zāi)P蚔4,且內(nèi)部測試顯示其編程能力已經(jīng)超越了市場上的頂級模型。

另一種觀點則認為,它是DeepSeek R2。

最近一個月,DeepSeek團隊連續(xù)發(fā)布了兩篇重磅技術(shù)論文,介紹了一種名為“優(yōu)化殘差連接(mHC)”的新訓練方法,以及一種模仿生物大腦的“AI記憶模塊(Engram)”。

如果“MODEL1”整合了這些最新的黑科技,讓AI擁有了類似人類的記憶機制,那它極有可能就是備受期待的“推理之王”R2。

不論是V4還是R2,至少有一點可以確定,DeepSeek的新模型快發(fā)布了!

結(jié)合目前模型文件結(jié)構(gòu)來看,“MODEL1”很可能已接近訓練完成或推理部署階段,正等待最終的權(quán)重凍結(jié)和測試驗證。

這意味著,新模型的上線時間越來越近了。

那個曾在全球掀起波瀾的“DeepSeek時刻”還會在今年重現(xiàn)嗎?我們拭目以待!

掃碼邀請進群,我們帶你一起來玩轉(zhuǎn)ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
古代講究血脈傳承,五代十國時期為何流行收義子,盛行假子繼位

古代講究血脈傳承,五代十國時期為何流行收義子,盛行假子繼位

長風文史
2026-01-26 20:05:39
拒絕回歸曼城!除非瓜帥下課!英超mvp太高調(diào),還在記恨當年替補

拒絕回歸曼城!除非瓜帥下課!英超mvp太高調(diào),還在記恨當年替補

阿泰希特
2026-01-27 12:24:53
伊朗內(nèi)部傳出消息:哈梅內(nèi)伊躲入地堡,三兒子出面與外界聯(lián)系

伊朗內(nèi)部傳出消息:哈梅內(nèi)伊躲入地堡,三兒子出面與外界聯(lián)系

阿器談史
2026-01-26 02:58:44
馬斯克最擔心的事情來了,阿里投資了核電站!

馬斯克最擔心的事情來了,阿里投資了核電站!

花朵財經(jīng)
2026-01-27 18:28:55
河南一國企老總曝雷人雷語:ZF第一不擔當,國企第二不擔當!

河南一國企老總曝雷人雷語:ZF第一不擔當,國企第二不擔當!

兵叔評說
2026-01-27 11:27:18
紫金礦業(yè)成交額創(chuàng)上市以來新高

紫金礦業(yè)成交額創(chuàng)上市以來新高

證券時報
2026-01-27 14:43:05
不到48小時,特朗普身體傳噩耗,34國軍方高官集合,對英緊急改口

不到48小時,特朗普身體傳噩耗,34國軍方高官集合,對英緊急改口

通鑒史智
2026-01-27 19:58:50
收受21名老板現(xiàn)金、黃金、書畫等賄賂,來者不拒、大小通吃!武華太懺悔:“害了家人,害了親屬,害了下屬,害了一大堆人……”

收受21名老板現(xiàn)金、黃金、書畫等賄賂,來者不拒、大小通吃!武華太懺悔:“害了家人,害了親屬,害了下屬,害了一大堆人……”

每日經(jīng)濟新聞
2026-01-27 18:34:50
投資20億!同程中心總部大廈開工,蘇州未來新地標!

投資20億!同程中心總部大廈開工,蘇州未來新地標!

GA環(huán)球建筑
2026-01-26 18:02:24
逝者 | 前山東泰山主帥去世,曾自薦執(zhí)教國足

逝者 | 前山東泰山主帥去世,曾自薦執(zhí)教國足

天津廣播
2026-01-27 20:21:35
就在今天!申京打破塵封46年紀錄,登頂火箭隊史第一

就在今天!申京打破塵封46年紀錄,登頂火箭隊史第一

籃球大視野
2026-01-27 17:16:47
澳網(wǎng)男單四強決出兩席:阿卡解鎖全四強,半決賽戰(zhàn)茲維列夫

澳網(wǎng)男單四強決出兩席:阿卡解鎖全四強,半決賽戰(zhàn)茲維列夫

全景體育V
2026-01-27 19:57:57
特斯拉Model 3銷售:七成客戶只買23.55萬元入門款

特斯拉Model 3銷售:七成客戶只買23.55萬元入門款

CNMO科技
2026-01-27 10:26:03
10中2!正負值-20!勇士神射手徹底沒救了

10中2!正負值-20!勇士神射手徹底沒救了

籃球教學論壇
2026-01-27 18:39:36
紀實:女子強迫情夫老公三人同床,逼丈夫看兩人茍合,結(jié)局釀慘案

紀實:女子強迫情夫老公三人同床,逼丈夫看兩人茍合,結(jié)局釀慘案

談史論天地
2026-01-23 10:04:14
驚天大瓜,全民都在吃

驚天大瓜,全民都在吃

我是歷史其實挺有趣
2026-01-27 18:21:33
近3戰(zhàn)場均10助2斷!火箭找到控衛(wèi)答案?范甘迪:本賽季的DPOY熱門

近3戰(zhàn)場均10助2斷!火箭找到控衛(wèi)答案?范甘迪:本賽季的DPOY熱門

你的籃球頻道
2026-01-27 13:57:49
1月25日起正式實施;日本涉島法案通過,中國加速增兵,奉陪到底

1月25日起正式實施;日本涉島法案通過,中國加速增兵,奉陪到底

通文知史
2026-01-26 18:15:03
《白鹿原》里的兩家大戶,日常只吃油潑面,首富就這種水準?

《白鹿原》里的兩家大戶,日常只吃油潑面,首富就這種水準?

收藏大視界
2026-01-25 17:56:42
后悔也晚了!大批F35逼到家門口,伊朗卻發(fā)現(xiàn)紅旗9和殲10還未到位

后悔也晚了!大批F35逼到家門口,伊朗卻發(fā)現(xiàn)紅旗9和殲10還未到位

文雅筆墨
2026-01-25 03:11:20
2026-01-27 20:59:00
AI先鋒官 incentive-icons
AI先鋒官
AIGC大模型及應(yīng)用精選與評測
421文章數(shù) 40關(guān)注度
往期回顧 全部

科技要聞

馬化騰3年年會講話透露了哪些關(guān)鍵信息

頭條要聞

回擊特朗普 印度與歐盟達成"史上最大規(guī)模協(xié)議"

頭條要聞

回擊特朗普 印度與歐盟達成"史上最大規(guī)模協(xié)議"

體育要聞

冒充職業(yè)球員,比賽規(guī)則還和對手現(xiàn)學?

娛樂要聞

張雨綺被曝代孕,春晚被拒,代言跑路

財經(jīng)要聞

多地對壟斷行業(yè)"近親繁殖"出手了

汽車要聞

標配華為乾崑ADS 4/鴻蒙座艙5 華境S體驗車下線

態(tài)度原創(chuàng)

藝術(shù)
本地
旅游
游戲
公開課

藝術(shù)要聞

日本東京國立博物館中的100幅宋畫

本地新聞

云游中國|撥開云霧,巫山每幀都是航拍大片

旅游要聞

香港將舉辦新春國際匯演之夜活動

LPL春季賽:野輔是真的菜,滔搏野輔狂送,WBG三局戰(zhàn)勝TES

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版