国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

全村人都在等著DeepSeek上桌吃飯了

0
分享至

上個周末,包括英國《金融時報》在內的一些外媒報道稱:DeepSeek V4將在本周一(3月2日)發(fā)布。還有報道宣稱,V4將針對國產芯片進行優(yōu)化,是該系列大模型當中第一個完全基于國產算力生態(tài)的云云。這一消息很快被大量國內媒體轉載,大家都期待著V4早日露出真容——可是什么都沒有發(fā)生。

大家盼望DeepSeek V4發(fā)布,已經有一個多月了。之前很多人預測它將于春節(jié)期間發(fā)布,不過也有消息稱,春節(jié)還太早了一點。其實,春節(jié)期間,豆包、千問、GLM……等競爭對手爭先恐后地發(fā)布新版本,在一定程度上可以視為對DeepSeek的一種“預防性競爭行為”:只要V4發(fā)布,其光芒就會過于強大,遮蓋一切競品;所以競品必須趕緊也拿出高水平的新版本才行。

春節(jié)前不久,DeepSeek做了一次更新,擴大了上下文窗口,并一度被誤傳為“V4已經開始灰度測試”。那段時間,我的朋友圈到處有人在問:“你被V4灰度到了嗎?怎么拿邀請碼?”事實證明那次更新并不是V4,雖然被廣泛稱為"V4Lite",但畢竟不是正式版V4;它的跑分處于國產大模型的第一梯隊,但更新尚未達到讓人眼睛一亮的程度。

我在AI圈的朋友,普遍對DeepSeek V4仍然抱有很大希望,其原因有二:

從梁文鋒署名的一系列論文看,DeepSeek團隊在基礎研發(fā)方面是有想法的,正在力圖進行創(chuàng)新,其站位高于大部分大模型創(chuàng)業(yè)團隊;

今年1月底,梁文鋒曾頗有自信地預告過不久后的新版本,“根據他的性格,沒有把握的事情是不會事先宣傳的”。



從DeepSeek團隊發(fā)表的論文看,最近一段時間它的研發(fā)似乎聚焦于兩個方向:一個是編程,一個是多模態(tài)。前者非常自然,因為AI編程是發(fā)展最快、成熟度最高的大模型應用,今年以來發(fā)布的Claude Code with Opus 4.6以及ChatGPT-5.3-Codex再次刷新了AI編程的上限。這是一條已經被證實的坦途,DeepSeek的前幾個小版本在這方面進步也很大,V4再次取得巨大進展是可以理解的。

后者則是在補齊軟肋——DeepSeek迄今最大的弱點就是沒有多模態(tài)功能,這一點不但限制了它的C端應用,而且限制了它的B端應用。因為B端收入的來源是客戶對Token的消耗,多模態(tài)的Token消耗比傳統的文本生成高了一個、甚至好幾個數量級。不久前Seedance 2.0的發(fā)布,再次證明了優(yōu)秀的多模態(tài)大模型具備多高的用戶基礎和商業(yè)潛力。從已發(fā)表的論文看,DeepSeek肯定不滿足做一個“文生文”大模型,已經在多模態(tài)方面下了不少工夫。

現在全村人都在等著DeepSeek V4上桌吃飯了,究竟什么時候才能真正開飯呢?我認為,這里有一個非常重要的因素:V3/R1是當時全世界最出色的開源大模型,尤其在推理成本控制方面取得了巨大進展,所以震驚了世界;此時此刻,V4必須也成為全世界最出色的開源大模型(至少是之一),才能再次震驚世界。這是成功者必須面臨的問題:成功的標桿越抬越高,每一次的挑戰(zhàn)都更大。

還有一個重要因素:當初震驚世界的主要是R1,也就是深度推理大模型。如果沒有深度推理功能,至少對于一般用戶而言,DeepSeek不會顯得那么特殊。假設DeepSeek先推出“普通版本”的V4,過一段時間再推出“深度推理”的R2,市場是否會覺得解渴?當然,有一種更穩(wěn)妥的方式,就是同時推出V4和R2,不過這需要更多的資源,對于一家仍處于創(chuàng)業(yè)級別的公司而言,未必合適。我相信,在決定新版本大模型上線節(jié)奏的時候,DeepSeek團隊肯定考慮到了上述全部因素。

還有一個問題:大模型開發(fā),比拼的既是基礎研發(fā),也是工程執(zhí)行。我們目前能看到的公開信息,主要是基礎研發(fā)層面的,例如DeepSeek團隊發(fā)布的學術論文;我們對于背后的工程課題、工程瓶頸,知之甚少。迄今為止,關于DeepSeek新版本訓練過程的一切媒體報道,其實都是捕風捉影,沒有得到官方的任何承認,也缺乏第三方信源參考。舉個例子:谷歌在大模型基礎研發(fā)方面一直保持領先,但是在Bard以及Gemini早期,工程執(zhí)行方面犯下了很多錯誤,直到2024年下半年才趕上來。如果DeepSeek過去一段時間致力于解決一些工程環(huán)節(jié)的細節(jié)問題,我不會感到奇怪。

假設DeepSeek V4真的像英國《金融時報》報道的那樣,全面擁抱國產算力體系的話,在工程方面的挑戰(zhàn)就更大了。要知道,哪怕同樣是在英偉達框架之內,硅谷大廠把訓練任務從Hopper架構轉向Blackwell架構,也需要花一段時間;何況是在兩個完全不同的框架之間調整?這樣的工程問題注定難以在短期內得到解決,能解決就不錯了,無法強求。

但是,需要強調的是:目前關于V4訓練細節(jié)的報道,無論來自外媒還是國內媒體,基本都是根據間接渠道的猜測、整合,從未得到官方的任何認可。真正的訓練細節(jié),只有在新版本發(fā)布的那一刻才會被外界得知,而且也不可能是全部細節(jié)。只能說:一切皆有可能,但不是每種可能性都值得現在就討論。

話說回來,哪怕在長達一年多沒有大版本更新(中間有2-3次小版本更新)的情況下,而且是在極少做市場活動的情況下,DeepSeek APP的MAU仍然超過1億,在國內AI應用中位居第四或第五名,哪怕是在春節(jié)期間砸了重金的元寶也無法超過它(這在一定程度上要感謝V4Lite的更新)。假如現在推出V4,那么DeepSeek仍然有希望一波沖到全國AI前三的水平;假如再晚一些,就不好說了,因為互聯網大廠圍繞AI的軍備競賽愈演愈烈,DeepSeek在今年面對的競爭密度遠高于去年,國內如此,國外也是如此。

不管怎么說,既然市場上頻繁傳出“DeepSeek V4即將發(fā)布”的消息,至少說明新版本發(fā)布已經不再遙遠了。我非常希望能盡快看到V4,因為迄今為止,DeepSeek仍是我使用頻率最高的四個大模型之一(另外三個是GPT、Gemini、Grok),也是我使用頻率最高的國產大模型。我一定會在發(fā)布之日立即嘗試,并且詢問AI圈的朋友的使用體驗。希望我們都不會失望!

本文沒有得到DeepSeek或其任何競爭對手的資助或背書。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
Altman發(fā)感謝信,16000名被裁程序員集體破防

Altman發(fā)感謝信,16000名被裁程序員集體破防

Ping值焦慮
2026-03-25 17:02:40
楊瀚森降維打擊!9中9轟20+9,定位逐漸清晰,難怪球隊16順位選他

楊瀚森降維打擊!9中9轟20+9,定位逐漸清晰,難怪球隊16順位選他

你的籃球頻道
2026-03-26 10:19:18
中國移動官宣!4月30日起全國統一執(zhí)行,事關所有手機號

中國移動官宣!4月30日起全國統一執(zhí)行,事關所有手機號

Thurman在昆明
2026-03-26 13:35:46
人社部明確:事業(yè)編制改革啟動,3100萬人的“鐵飯碗”要變了

人社部明確:事業(yè)編制改革啟動,3100萬人的“鐵飯碗”要變了

慧眼看世界哈哈
2026-03-24 06:36:05
黃巢雖然殘忍,卻做了件好事:為我國破除了危害近600年的禍根

黃巢雖然殘忍,卻做了件好事:為我國破除了危害近600年的禍根

銘記歷史呀
2026-03-26 11:26:09
過分!一大V諷刺張雪峰:稱少一個鼓吹戰(zhàn)爭的瘋子,對世界更美好

過分!一大V諷刺張雪峰:稱少一個鼓吹戰(zhàn)爭的瘋子,對世界更美好

談史論天地
2026-03-26 07:56:52
“鳥面媽媽”王小妞:不聽勸阻生二胎,兒子遺傳其外貌,現如何

“鳥面媽媽”王小妞:不聽勸阻生二胎,兒子遺傳其外貌,現如何

觀察者海風
2026-03-24 23:04:30
巨乳性感綁帶渾圓大腿!日本格斗游戲勁爆手辦預告

巨乳性感綁帶渾圓大腿!日本格斗游戲勁爆手辦預告

游民星空
2026-03-25 19:48:32
2026QS世界大學學科排名,發(fā)布!

2026QS世界大學學科排名,發(fā)布!

EOL教育在線
2026-03-26 10:21:35
張雪峰母親:下崗擺攤育子上學,四年內喪夫又喪子,有錢又如何?

張雪峰母親:下崗擺攤育子上學,四年內喪夫又喪子,有錢又如何?

游戲收藏指南
2026-03-25 23:03:52
63歲阿姨說:和再婚老伴同居后才懂得,男人老了還要找老伴的原因

63歲阿姨說:和再婚老伴同居后才懂得,男人老了還要找老伴的原因

烙任情感
2026-03-25 13:16:34
“貞潔是女孩最高貴的嫁妝”,公交廣告別變公害廣告|新京報快評

“貞潔是女孩最高貴的嫁妝”,公交廣告別變公害廣告|新京報快評

新京報
2026-03-25 13:18:07
迪拜崩了!伊朗美國大戰(zhàn),迪拜40年的造富神話,11天就崩了!

迪拜崩了!伊朗美國大戰(zhàn),迪拜40年的造富神話,11天就崩了!

澳洲紅領巾
2026-03-19 14:27:38
張雪峰8億遺產如何分?法定繼承vs遺囑繼承,妻子女兒份額大不同

張雪峰8億遺產如何分?法定繼承vs遺囑繼承,妻子女兒份額大不同

別人都叫我阿螫
2026-03-25 17:35:23
突發(fā)!上海最大商場砸的62億懸了!

突發(fā)!上海最大商場砸的62億懸了!

新浪財經
2026-03-26 00:14:57
40集古裝權謀劇《莫離》空降,戲骨云集看著拉滿

40集古裝權謀劇《莫離》空降,戲骨云集看著拉滿

手工制作阿殲
2026-03-26 11:19:03
王毅判斷沒錯,短短三天中方見識了:比利時的虛偽、西班牙的真誠

王毅判斷沒錯,短短三天中方見識了:比利時的虛偽、西班牙的真誠

快看張同學
2026-03-26 10:19:39
很多中字頭工程局都發(fā)不出工資了!

很多中字頭工程局都發(fā)不出工資了!

黯泉
2026-03-25 21:14:53
世乒賽選拔落幕,國乒8人確定,王藝迪梁靖崑溫瑞博無緣

世乒賽選拔落幕,國乒8人確定,王藝迪梁靖崑溫瑞博無緣

格斗聯盟
2026-03-26 13:01:14
《雍正王朝》演員現狀:有人住千萬豪宅,有人晚節(jié)不保,有人離世

《雍正王朝》演員現狀:有人住千萬豪宅,有人晚節(jié)不保,有人離世

小徐講八卦
2026-03-24 17:10:05
2026-03-26 14:27:00
互聯網怪盜團丶 incentive-icons
互聯網怪盜團丶
互聯網行業(yè)觀察者
401文章數 374關注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權,700名員工卻下崗

頭條要聞

伊朗議長和外長暫被移出美以清除名單 時限4到5天

頭條要聞

伊朗議長和外長暫被移出美以清除名單 時限4到5天

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰家人首發(fā)聲 不設追思會喪事從簡

財經要聞

黃仁勛:芯片公司的時代已經結束了

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

親子
數碼
家居
藝術
軍事航空

親子要聞

躺平的孩子意外覺醒了,在父母學會當“烏龜”!

數碼要聞

Intel史上最先進!酷睿Ultra 300系列vPro平臺發(fā)布

家居要聞

傍海而居 靜觀蝴蝶海

藝術要聞

哪一座橋不是風景?

軍事要聞

擔心特朗普突然停戰(zhàn) 以總理下令48小時盡力摧毀伊設施

無障礙瀏覽 進入關懷版