国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

給 DeepSeek 的最后一封催更信

0
分享至

當(dāng)"中國(guó)團(tuán)""中國(guó)鏈""中國(guó)環(huán)"三重?cái)⑹陆豢棾尚危?dāng)編程、多模態(tài)、Agent、OpenClaw四波浪潮過(guò)去而無(wú)DeepSeek身影,當(dāng)Anthropic按$0.08/小時(shí)出租"數(shù)字勞動(dòng)力"重構(gòu)商業(yè)邏輯,開(kāi)源生態(tài)與Token經(jīng)濟(jì)都在等待DeepSeek V4的第三次助推。人民想念的不僅是更便宜的Token,更是那個(gè)能用萬(wàn)億參數(shù)基座、原生多模態(tài)、超強(qiáng)Agent能力"搞個(gè)大的"的破局者,來(lái)定義中國(guó)AI的下一步。

———— / BEGIN / ————

前段時(shí)間,刷屏,文章提到一點(diǎn)——DeepSeek推動(dòng)了全球大模型的降本,讓用戶和行業(yè)得以享受更便宜的Token。

關(guān)鍵的問(wèn)題是,“小龍蝦”這類智能體應(yīng)用的瘋狂“燒Token”,再次推高用戶的使用成本,這種情況下,推動(dòng)全行業(yè)降本增效的重任又落到了DeepSeek的肩上。

算算時(shí)間,DeepSeek V3、R1發(fā)布已一年有余,外界原本預(yù)期DeepSeek V4今年春節(jié)會(huì)來(lái)炸場(chǎng),但最終希望落空。不過(guò),從近期宕機(jī)、專家模式上線等一系列動(dòng)態(tài)來(lái)看,感覺(jué)DeepSeek V4有可能離我們?cè)絹?lái)越近了。

所以,這可能也是最后一次“催更”DeepSeek。

在這封催更信里面,我想和那些想念DeepSeek的朋友,聊聊中國(guó)AI的敘事、技術(shù)進(jìn)化的浪潮、生態(tài)競(jìng)爭(zhēng)、Token經(jīng)濟(jì)學(xué)這些話題。

中國(guó)AI敘事已變

2025年春節(jié),DeepSeek R1以低成本+高性能+開(kāi)源亮相,發(fā)布即巔峰。不僅在國(guó)產(chǎn)大模型領(lǐng)域一騎絕塵,而且風(fēng)靡世界,互聯(lián)網(wǎng)平臺(tái)、IT巨頭、各行各業(yè)紛紛接入,且擁抱開(kāi)源,形形色色的DeepSeek一體機(jī)都嘗試著搶?xiě)颉?/p>

在那段時(shí)間,談及中國(guó)AI,言必稱DeepSeek,毫不夸張的說(shuō),街頭的爺爺奶奶都可能在談?wù)?,甚至使用這款國(guó)產(chǎn)AI助手。

只是,過(guò)去一年人工智能產(chǎn)業(yè)和中國(guó)的AI敘事,早已不是一重天:圍繞人工智能的“中國(guó)團(tuán)”“中國(guó)鏈”“中國(guó)環(huán)”——三重?cái)⑹陆豢棾尚巍eepSeek獨(dú)撐的AI中國(guó)敘事,失去了色彩。

所以,在這個(gè)角度看大模型和人工智能,大家缺的不光是算力、電力,缺的也是時(shí)間窗口。

關(guān)于“中國(guó)團(tuán)”,我把它概括為“(3+1)+6+N”,其中“3+1”是四大廠,對(duì)應(yīng)字節(jié)、阿里、騰訊和百度,后面三家是互聯(lián)網(wǎng)時(shí)代的三巨頭,大家熟知的BAT。而數(shù)字“6”對(duì)應(yīng)的是大模型時(shí)代的“六小虎”——Kimi、智譜、MiniMax、階躍星辰、百川、面壁智能,主要幾家在DeepSeek埋頭自研的時(shí)候,完成了上市或者在沖刺上市。

“六小虎”里面原來(lái)是有李開(kāi)復(fù)的零一萬(wàn)物的,但在第一次百模大戰(zhàn)中,零一萬(wàn)物開(kāi)始掉隊(duì),所以這里我們把面壁智能放了進(jìn)來(lái),但其實(shí)百川過(guò)去一年多,聲量也逐漸微弱。

“N”其實(shí)不單只某一家,它對(duì)應(yīng)的是其他垂類模型和專業(yè)市場(chǎng)的AI企業(yè)。

總計(jì)10家/類企業(yè)構(gòu)成了中國(guó)大模型產(chǎn)業(yè)頭部態(tài)勢(shì),他們已不是散兵游勇,而是一個(gè)具有集群競(jìng)爭(zhēng)力的產(chǎn)業(yè)軍團(tuán),也是DeepSeek再次封神之路上,必須要逾越的對(duì)手。

與“中國(guó)團(tuán)”同步成長(zhǎng)的也包括“中國(guó)鏈”——從芯片算力、集群/云、數(shù)據(jù)語(yǔ)料、算法/模型、智能體、AI應(yīng)用開(kāi)發(fā)生態(tài),已經(jīng)完成了全鏈貫通,成為全球范圍內(nèi)唯二的智能科技全產(chǎn)業(yè)鏈國(guó)家,有希望為全球智能基礎(chǔ)設(shè)施多提供一種選擇,也有希望以能力經(jīng)濟(jì)的能力輸出為全球智能普惠提供新的公共品。

這一點(diǎn)大家不要懷疑,DeepSeek R1當(dāng)年的確打出了中國(guó)模型在海外的品牌,但現(xiàn)在MiniMax這些廠商,在海外的業(yè)務(wù)一樣做得有聲有色。

而關(guān)于“中國(guó)環(huán)”,覆蓋了產(chǎn)業(yè)、應(yīng)用和投資三個(gè)方面——從AI到AI4S再到現(xiàn)代產(chǎn)業(yè)群的產(chǎn)業(yè)閉環(huán),從AI科技到千行百業(yè)、億萬(wàn)家庭的市場(chǎng)應(yīng)用閉環(huán),從早期投資到上市退出的資本閉環(huán)。閉環(huán)初步成形不僅意味著人工智能在中國(guó)跑通,更意味著智能經(jīng)濟(jì)不同層面的大循環(huán)小循環(huán)由此貫通。

從團(tuán)、鏈到環(huán),中國(guó)的AI敘事已然發(fā)生改變。

不考慮企業(yè)免費(fèi)的營(yíng)銷策略,2026年初以來(lái),六小虎的模型在OpenRouter等國(guó)際平臺(tái)上的Token消耗量占比接連領(lǐng)先,且總體份額過(guò)半,主要是海外用戶。

概括來(lái)說(shuō),2025年中國(guó)的開(kāi)源力量改變了全球人工智能發(fā)展格局。到了2026年,中國(guó)人工智能發(fā)展進(jìn)入向外能力輸出階段。

從全球大模型和人工智能產(chǎn)業(yè)的視角來(lái)看,技術(shù)路徑的多元化,增強(qiáng)了人才流動(dòng)活力,有利于供應(yīng)鏈韌性。對(duì)于下游的應(yīng)用開(kāi)發(fā)者而言,多家可選供應(yīng)商的存在意味著更強(qiáng)的議價(jià)能力和更低的鎖定風(fēng)險(xiǎn)。

在中國(guó)的AI敘事里面,還有一個(gè)比較好的現(xiàn)象在于,市場(chǎng)還沒(méi)有被少數(shù)寡頭壟斷,這對(duì)于競(jìng)爭(zhēng)創(chuàng)新和人才生態(tài)建設(shè)是好事,也有利于在中美AI競(jìng)爭(zhēng)中形成集群優(yōu)勢(shì)。

四波浪潮已經(jīng)過(guò)去

中國(guó)古典神話總說(shuō)“天上一天,人間一年”,DeepSeek“斷更”的這一年,人工智能已經(jīng)過(guò)去了四次浪潮——編程、多模態(tài)、智能體、OpenClaw(小龍蝦)。

當(dāng)GitHub Copilot、Cursor、Claude Code等AI編程工具席卷開(kāi)發(fā)者社區(qū)時(shí),在Vibe Coding的故事中,人們很難記得起DeepSeek的存在,盡管它也會(huì)被用到編程場(chǎng)景。

編程,這個(gè)人工智能席卷一切行業(yè)的底層驅(qū)動(dòng)、開(kāi)發(fā)者最剛需的場(chǎng)景,如今在國(guó)外被Anthropic等牢牢占據(jù),在國(guó)內(nèi)成了Kimi們跑馬圈地的戰(zhàn)場(chǎng)。

而在多模態(tài)這波浪潮中,Gemini 3 Pro等在視覺(jué)理解、圖像生成領(lǐng)域均有不俗表現(xiàn),大家能夠記得的是Nano Banana,而在視頻生成領(lǐng)域,是字節(jié)的Seedance 2.0。

DeepSeek像是一個(gè)慢熱的選手,直到V3.2才開(kāi)始灰度測(cè)試百萬(wàn)Token上下文,多模態(tài)能力更是還沒(méi)到來(lái)。

有人說(shuō),在大模型領(lǐng)域,一旦一代產(chǎn)品技術(shù)路線錯(cuò)了,就會(huì)錯(cuò)過(guò)一個(gè)時(shí)代?DeepSeek是卡在這里了嗎,也很難說(shuō)。

第三波浪潮是Agent-多Agent-蜂群智能。相比AI助手的理解和對(duì)話能力,Agent已經(jīng)進(jìn)化到了執(zhí)行層面,從“答題”轉(zhuǎn)向“解題”——過(guò)去是“被動(dòng)應(yīng)答”,現(xiàn)在則是“主動(dòng)執(zhí)行”。在這波浪潮中,Manus等產(chǎn)品的涌現(xiàn),標(biāo)志著AI Agent正在從概念走向落地,Kimi Agent Swarm則將這一波推向高潮。

DeepSeek在這一波浪潮中,更多只是作為模型被調(diào)用,不是Agent生態(tài)的構(gòu)建者,模型本身對(duì)Agent、工具、代碼的支持水準(zhǔn)也比較有限。

時(shí)間來(lái)到2026年,以O(shè)penClaw等各類Claw、Claude Code、Claude Cowork等為代表的行動(dòng)智能浪潮開(kāi)始出現(xiàn),它們的能力實(shí)際已經(jīng)超越Agent層面,成為接管型應(yīng)用操作系統(tǒng)——應(yīng)用AI OS。

只不過(guò),OpenClaw這類產(chǎn)品也被戲稱為“Token黑洞”,其單任務(wù)的Token消耗量是傳統(tǒng)對(duì)話AI的幾十倍甚至上百倍。這種高投入低產(chǎn)出的模式,在產(chǎn)業(yè)規(guī)?;瘧?yīng)用中面臨可持續(xù)性難題,產(chǎn)品本身的粗糙、不穩(wěn)定和多次破壞性的版本迭代,像極了毛坯房。

所以有人在喊“人民想念DeepSeek”也不奇怪,畢竟幾波浪潮,都沒(méi)了它的影子,畢竟人民需要它來(lái)推動(dòng)中國(guó)大模型的降本增效。

但必須要說(shuō)的是,OpenClaw確認(rèn)應(yīng)用AI OS、通用行動(dòng)智能體的邏輯是成立的,而且時(shí)機(jī)到了。它告訴所有人,AI不再只是工具,而可以是全能的接管型代理。

所以3月“全民養(yǎng)蝦”大潮里面,你看大家抄作業(yè)速度多快,為了推廣本土產(chǎn)品,大家都開(kāi)始送起了“賽博雞蛋”,因?yàn)镺penClaw讓包括Anthropic在內(nèi)的大廠瞬間看明白,原來(lái)包打一切的應(yīng)用OS、行動(dòng)智能就近在眼前,腦子都有了,任務(wù)也能執(zhí)行,長(zhǎng)出個(gè)手腳變成通用智能體還不容易!

也是因?yàn)檫@個(gè)原因,Anthropic反應(yīng)、反制都是最快的,也是對(duì)Claw沖擊最大的。Claude Code包抄OpenClaw后路,其它大廠又紛紛快速抄Claude Code和OpenClaw的作業(yè)。這就是眼前正在發(fā)生的事。

之所以兵家必爭(zhēng),是因?yàn)檫@件事的入口地位、巨大價(jià)值以及未來(lái)的生態(tài)支配地位,不亞于模型,不亞于前三波浪潮。

如果說(shuō)大模型在積蓄力量,多模態(tài)是拓寬場(chǎng)景,Agent代表撒種子,那么對(duì)生態(tài)進(jìn)行大面積收割要靠應(yīng)用AI OS、通用行動(dòng)智能體,現(xiàn)在已經(jīng)多多少少有些終局的意味和終極形態(tài)的影子。到了EI內(nèi)生智能、II自主智能階段,可能要另當(dāng)別論。

不過(guò),就今天OpenClaw的投入產(chǎn)出比來(lái)說(shuō),能占據(jù)AI OS、通用行動(dòng)智能體生態(tài)位的可能不是它。

所以在這最后一份致DeepSeek的催更信里面,我們也想提一個(gè)問(wèn)題:沒(méi)有第一時(shí)間跳進(jìn)這四條河流的DeepSeek,是不是在選擇蓄力,希望通過(guò)V4以及之后的基座模型“搞個(gè)大的”?

只是,市場(chǎng)從不等待,用戶的注意力、開(kāi)發(fā)者的熱情、資本的流向,都在一波又一波的浪潮中被分流。這四波浪潮所在的領(lǐng)域,競(jìng)爭(zhēng)門(mén)檻都已急劇抬高,生態(tài)化成本也大幅度增加。

DeepSeek的故事,只能停留在2025年的春節(jié)嗎?

全生態(tài)競(jìng)爭(zhēng)到來(lái)

之前我的看法是,頭部企業(yè)已經(jīng)到了全生態(tài)競(jìng)爭(zhēng)階段。在這個(gè)階段,全棧AI能力是接下來(lái)巨頭角力的基礎(chǔ),最好的例子就是Google。

Google之所以在Gemini 3 Pro那一波受到高度關(guān)注,源于他們?cè)谒膫€(gè)方面累積的“厚度”優(yōu)勢(shì)逐步顯現(xiàn):模型原理原力持久進(jìn)化度(Evolutionary Index)、數(shù)據(jù)深度(Data Index)、全鏈生態(tài)廣度(Ecological Index)、智能連接度(Connectivity Index)。

谷歌CEO皮查伊在任差不多10年了,在剛剛的訪談中,他回憶了Transformer被ChatGPT搶跑的這段意難平的往事,但是他不認(rèn)為失去先發(fā)優(yōu)勢(shì)就會(huì)輸,他把谷歌的優(yōu)勢(shì)總結(jié)為全棧垂直整合。

所以到了Gemini 3 Pro,基于這種全棧整合,谷歌打了一個(gè)漂亮的翻身仗。

可以大膽的預(yù)判一下,2026年,美國(guó)人工智能產(chǎn)業(yè)頭部的競(jìng)爭(zhēng),可能的節(jié)奏是Anthropic先拔得頭籌,Google緊接著全線壓上,而搶跑的OpenAI面臨左右包夾的局面,最終四強(qiáng)變?nèi)龔?qiáng),掉隊(duì)的那一強(qiáng)是被進(jìn)一步拉開(kāi)差距的Grok。

2026年的GTC,在前期預(yù)熱環(huán)節(jié),黃仁勛少有的寫(xiě)了一篇文章,提出了“五層蛋糕理論”:能源 → 芯片 → AI基礎(chǔ)設(shè)施 → 模型 → 應(yīng)用。

但如果要拆得更細(xì),人工智能的競(jìng)爭(zhēng)也體現(xiàn)在芯片算力、數(shù)據(jù)語(yǔ)料、模型基座、開(kāi)發(fā)工具與開(kāi)發(fā)者、智能體與工具技能、應(yīng)用服務(wù)這些環(huán)節(jié),每一個(gè)環(huán)節(jié)的失位都可能導(dǎo)致整體競(jìng)爭(zhēng)力下降,而競(jìng)爭(zhēng)、投資的門(mén)檻,已經(jīng)成為了百億、千億美元級(jí)的重資產(chǎn)游戲。

創(chuàng)新,不再限于“彎道超車(chē)”,更在于系統(tǒng)比拼、體系對(duì)抗。尤其是大模型所依賴的資本、算力、算法和數(shù)據(jù)等要素,成為決定性的關(guān)鍵因素,吃一顆大力丸,吃一碗海參,解決不了太多問(wèn)題。

全生態(tài)競(jìng)爭(zhēng)的格局中的DeepSeek,原理產(chǎn)生原力——底層突破——雖然還有優(yōu)勢(shì),但短板也同樣明顯:缺乏IT巨頭的產(chǎn)業(yè)生態(tài)鏈支持,產(chǎn)品應(yīng)用功能相對(duì)單薄,多模態(tài)與Agent生態(tài)建設(shè)有待加強(qiáng)。

Token經(jīng)濟(jì)崛起

Token經(jīng)濟(jì)新年起勢(shì),Token經(jīng)濟(jì)是智能經(jīng)濟(jì)作為能力經(jīng)濟(jì)的價(jià)值閉環(huán),這是我在央廣網(wǎng)采訪中的觀點(diǎn)。

過(guò)去,在工業(yè)時(shí)代,能源單位是千瓦時(shí),在數(shù)字時(shí)代的流量單位是GB,智能時(shí)代的能力產(chǎn)品的供給單位就是Token,Token讓AI的“能力”成為可計(jì)量、可定價(jià)、可交易的商品。

你可以這樣理解:Token成為了連接技術(shù)與商業(yè)的“結(jié)算單位”,進(jìn)而使得能力經(jīng)濟(jì)的商業(yè)閉環(huán)正在形成。

Token的消耗量,正在以幾何級(jí)增長(zhǎng)速度膨脹——中國(guó)日均Token調(diào)用量從2024年初的1000億躍升至2026年3月的140萬(wàn)億,兩年增長(zhǎng)超千倍,消耗的越多,就代表著能力經(jīng)濟(jì)的蓬勃發(fā)展。

對(duì)于企業(yè)來(lái)說(shuō),通過(guò)價(jià)格杠桿實(shí)現(xiàn)毛利率提升,這意味著它的盈利模式局部已經(jīng)跑通。

只不過(guò),Token是計(jì)量單位,不是計(jì)質(zhì)單位。產(chǎn)業(yè)界不能只看Token數(shù)量,更要關(guān)注背后的“能力質(zhì)量”。所以,我覺(jué)得未來(lái)Token經(jīng)濟(jì)的分化會(huì)很明顯——能力水準(zhǔn)高的Token賺錢(qián),能力水準(zhǔn)低的Token虧錢(qián),后者甚至被淘汰。

所以,小米的羅福莉在給MiMo大模型套餐“帶貨”的時(shí)候說(shuō):“當(dāng)前全球算力供給已經(jīng)跟不上Agent創(chuàng)造的token需求。真正的出路不是更便宜的token,而是共同進(jìn)化——更省token的Agent框架與更強(qiáng)大、更高效的模型的協(xié)同。”

今年有一個(gè)很典型性的趨勢(shì),用戶一邊在喊Token貴,一邊又在給Token付費(fèi),本質(zhì)上是消耗的一部分Token轉(zhuǎn)化為了生產(chǎn)力,而當(dāng)Token付費(fèi)成為潮流,企業(yè)就可以獲得營(yíng)收才能投入研發(fā)更高水準(zhǔn)模型,這是在為智能經(jīng)濟(jì)造血。

模型、智能體企業(yè)商業(yè)化最直接的兩條路:要么靠付費(fèi)訂閱回血,要么通過(guò)API以Token資費(fèi)套餐造血。OpenAI在AI助手的對(duì)話下面關(guān)聯(lián)廣告這種做法,存在著太多的不確定性,行業(yè)里還沒(méi)有第二家跟著出牌。

我認(rèn)為,在推理驅(qū)動(dòng)的Token經(jīng)濟(jì)時(shí)代,率先跑通的場(chǎng)景我認(rèn)為有三類:高價(jià)值高密度場(chǎng)景(如金融風(fēng)控、醫(yī)療診斷,客戶愿為“不出錯(cuò)”支付溢價(jià));高頻高剛需場(chǎng)景(如智能客服、代碼生成,靠規(guī)模攤薄成本);以及Agent智能體廣泛應(yīng)用的場(chǎng)景。

未來(lái),Token會(huì)像水像電一樣成為基礎(chǔ)服務(wù),薄利、普惠、泛在。單位Token成本會(huì)持續(xù)下降,但Token經(jīng)濟(jì)會(huì)分層:常規(guī)能力水準(zhǔn)的Token趨向薄利,以量取勝;高能力水準(zhǔn)、高價(jià)值的Token可能持續(xù)保持溢價(jià)。

更具象地說(shuō),能夠構(gòu)建場(chǎng)景+數(shù)據(jù)+平臺(tái)+模型閉環(huán)、提供高價(jià)值智能體服務(wù)的企業(yè)將獲得溢價(jià)。

量化投資出身的DeepSeek雖不差錢(qián),但從可持續(xù)發(fā)展角度來(lái)看,也需要擁抱Token經(jīng)濟(jì)。

開(kāi)源生態(tài)等待第三次轉(zhuǎn)折

過(guò)去一年多時(shí)間,開(kāi)源生態(tài)格局變了。

2025年初,DeepSeek對(duì)開(kāi)源生態(tài)完成了第一次引爆。今年初,OpenClaw完成了對(duì)開(kāi)源生態(tài)的第二次神助攻。第一次引爆使得一些閉源模型也向開(kāi)源靠攏,國(guó)內(nèi)如百度等巨頭加入開(kāi)源陣營(yíng),海外如OpenAI、Google等也在加大開(kāi)源力度。

根據(jù)OpenRouter平臺(tái)對(duì)100萬(wàn)億Token調(diào)用數(shù)據(jù)的分析,開(kāi)源模型的市場(chǎng)份額已攀升至33%。中國(guó)開(kāi)源模型的異軍突起尤為引人注目,OpenRouter平臺(tái)前六位當(dāng)中一度有五家是中國(guó)的開(kāi)源模型。

開(kāi)源模型的崛起,是由技術(shù)迭代、用戶需求和經(jīng)濟(jì)因素共同驅(qū)動(dòng)的結(jié)果。企業(yè)選擇開(kāi)源模型的核心動(dòng)因變得非?,F(xiàn)實(shí):閉源API成本與調(diào)用規(guī)模強(qiáng)相關(guān),邊際成本不可控;自托管開(kāi)源模型在高并發(fā)、長(zhǎng)上下文、Agent場(chǎng)景中,單位成本顯著下降。

用直白的話說(shuō),只要能力在線,開(kāi)源模型在私有化部署場(chǎng)景下,用得越多,就越便宜。作為開(kāi)源模型生態(tài)的攪局者,DeepSeek在2026年,大概率還會(huì)對(duì)開(kāi)源業(yè)態(tài)再次助推一波。

這種預(yù)想中的推動(dòng)涵蓋了算力成本的產(chǎn)業(yè)沖擊效應(yīng)、用戶市場(chǎng)的引爆效應(yīng)、開(kāi)源生態(tài)的激發(fā)效應(yīng),以及對(duì)于市場(chǎng)信心的提振效應(yīng)等,可能會(huì)再次出現(xiàn)。

這是人民想念DeepSeek的底層邏輯,價(jià)格只是一個(gè)表象。

開(kāi)源雖好,但建設(shè)仍然任重道遠(yuǎn)。

對(duì)DeepSeek來(lái)說(shuō),它還需要盡快形成開(kāi)發(fā)者生態(tài),支持Agent開(kāi)發(fā)生態(tài),建立Apps以及類似Skills的技能封裝與分發(fā)渠道,以提升開(kāi)放性、靈活性,同時(shí)吸引更多開(kāi)發(fā)者參與其中。

期待DeepSeek再次成為開(kāi)源生態(tài)的關(guān)鍵一推。

對(duì)V4的期待不是過(guò)去的標(biāo)準(zhǔn)

大洋彼岸的懸念是,OpenAI和Anthropic的下一代模型能打到什么程度,Super App能不能像正在生態(tài)化的Claude Code一樣成為應(yīng)用OS和通用行動(dòng)智能體,以及Coding這把生態(tài)底層尖刀誰(shuí)最快,這三件事會(huì)影響今年的大風(fēng)向。

從現(xiàn)在的局勢(shì)來(lái)看,Anthropic的火已經(jīng)快燒到OpenAI的大本營(yíng)了,這一點(diǎn)可以翻閱華爾街日?qǐng)?bào)披露的兩家財(cái)務(wù)數(shù)據(jù),Anthropic有可能搶在OpenAI之前扭虧為盈。

在這種背景下,我們期待DeepSeek的什么呢?

把前文的這些觀點(diǎn)總結(jié)一下,它應(yīng)該包括V4、R2實(shí)現(xiàn)代際跨越、100萬(wàn)Token的上下文窗口(剛剛開(kāi)始灰度測(cè)試)、原生多模態(tài)能力、萬(wàn)億參數(shù)級(jí)別的基礎(chǔ)模型應(yīng)該是最基本的起點(diǎn)。

可是,這些都是過(guò)去的標(biāo)準(zhǔn),不應(yīng)該是V4、R2的能力上限。站在今天這個(gè)時(shí)間段,DeepSeek需要的是在多Agent能力、工具使用、電腦操作以及背后超強(qiáng)的代碼能力上實(shí)現(xiàn)突破。

大家也不用過(guò)度焦慮,AI Agent雖大熱,但目前仍處于已有能力整合的階段,離真正意義上的自主智能體尚有距離。

未來(lái),AI Agent可能會(huì)出現(xiàn)四種路徑:云端虛擬機(jī)整合、本地與云協(xié)同的端側(cè)混合模式、通過(guò)協(xié)議實(shí)現(xiàn)智能互聯(lián),或以“超級(jí)OS”形式重構(gòu)所有高頻應(yīng)用入口。不管哪一種路徑,它最終都將成為個(gè)人智能服務(wù)的樞紐,成為未來(lái)競(jìng)爭(zhēng)的戰(zhàn)略制高點(diǎn)。

舊的標(biāo)準(zhǔn)已不匹配DeepSeek V4,所以在這封催更信里面,我對(duì)它的期待不僅是一個(gè)更強(qiáng)大的語(yǔ)言模型,更是一個(gè)能夠自主執(zhí)行復(fù)雜任務(wù)、整合多種工具、與外部環(huán)境高效交互的智能體基座。

就像前面說(shuō)的,期待它“搞個(gè)大的”,而DeepSeek實(shí)際進(jìn)行的模型原理探索與產(chǎn)品技術(shù)進(jìn)展,似乎也在印證這個(gè)“大”節(jié)奏。

去年10月以來(lái),DeepSeek在大模型領(lǐng)域的論文發(fā)布與產(chǎn)品局部更新動(dòng)作持續(xù)加速,形成了密集的創(chuàng)新節(jié)奏。

從2025年12月發(fā)布DeepSeek-V3.2,到2026年1月集中放出mHC、Engram、DualPath等三項(xiàng)核心架構(gòu)論文并大幅更新和擴(kuò)展之前發(fā)布的R1技術(shù)報(bào)告,整體研發(fā)呈現(xiàn)出覆蓋架構(gòu)創(chuàng)新、推理效率、多模態(tài)、智能體能力的立體化推進(jìn)態(tài)勢(shì)。這一系列工作被普遍視為下一代旗艦?zāi)P虳eepSeek-V4的技術(shù)前奏。

DeepSeek并未正式確認(rèn)這些創(chuàng)新將如何融入V4最終架構(gòu),但論文的作者署名(包括創(chuàng)始人梁文鋒)、代碼泄露以及平臺(tái)可見(jiàn)的變化均指向這一方向。

2025年10月的DeepSeek-OCR系列探索了將文本信息通過(guò)視覺(jué)表征進(jìn)行壓縮的可能性,顛覆了“文本token比視覺(jué)token更高效”的傳統(tǒng)假設(shè)。OCR 2的視覺(jué)因果流機(jī)制進(jìn)一步讓模型能夠像人一樣依據(jù)版面邏輯“看懂”文檔,而非機(jī)械掃描。這為多模態(tài)模型理解和處理極其冗長(zhǎng)的文檔(如整本書(shū)、整份財(cái)報(bào))提供了全新的思路,有望將大模型的上下文窗口擴(kuò)展至數(shù)千萬(wàn)token量級(jí),而無(wú)需承受平方級(jí)的計(jì)算復(fù)雜度增長(zhǎng)。

mHC技術(shù)針對(duì)的是萬(wàn)億參數(shù)級(jí)模型訓(xùn)練中的根本性難題:信號(hào)爆炸,突破“深層網(wǎng)絡(luò)穩(wěn)定性”這一規(guī)?;l(fā)展的瓶頸,為萬(wàn)億參數(shù)級(jí)開(kāi)源模型的訓(xùn)練鋪平道路。也有助于在不依賴先進(jìn)制程芯片的情況下,通過(guò)架構(gòu)創(chuàng)新實(shí)現(xiàn)模型深度擴(kuò)展。

Engram面向長(zhǎng)上下文與持續(xù)學(xué)習(xí)的工程化解決,其條件記憶機(jī)制理論上支持跨會(huì)話的持久化記憶,突破當(dāng)前大模型“無(wú)狀態(tài)”推理的限制,推理效率不再被知識(shí)密度所拖累。它挑戰(zhàn)了傳統(tǒng)Transformer“以計(jì)算換記憶”的設(shè)計(jì)范式。該方法將靜態(tài)知識(shí)存儲(chǔ)在外部稀疏表中,使模型前饋網(wǎng)絡(luò)專注于動(dòng)態(tài)推理。這種“神經(jīng)-符號(hào)”混合架構(gòu)使模型在保持百萬(wàn)token級(jí)上下文的同時(shí),有希望顯著降低推理成本。

2025年12月的V3.2版本已經(jīng)初步展現(xiàn)出“跨工具記憶保持”能力,解決了傳統(tǒng)AI Agent在多工具調(diào)用時(shí)丟失推理鏈的問(wèn)題,并且通過(guò)稀疏注意力機(jī)制使128K長(zhǎng)上下文推理成本降低數(shù)倍,內(nèi)存占用減少70%。

另外,DeepSeek聯(lián)合北大、清華發(fā)布新論文推出的智能體推理框架DualPath,針對(duì)智能體大模型推理的存儲(chǔ)帶寬瓶頸,創(chuàng)新雙路徑KV-Cache加載機(jī)制,讓數(shù)據(jù)讀取與GPU計(jì)算并行,徹底解決傳統(tǒng)架構(gòu)算力空轉(zhuǎn)問(wèn)題。實(shí)測(cè)離線推理吞吐量最高提升1.87倍,在線Agent運(yùn)行效率提升1.96倍,用純軟件優(yōu)化實(shí)現(xiàn)性能翻倍,堪稱AI基礎(chǔ)設(shè)施的顛覆性突破,提高成本效率的風(fēng)格非常DeepSeek。

種種跡象表明,即將發(fā)布的新一代旗艦?zāi)P虳eepSeek-V4大概率將整合文本、圖像、視頻生成能力,并采用原生多模態(tài)預(yù)訓(xùn)練而非后期拼接,模型參數(shù)在萬(wàn)億以上,并且具有較強(qiáng)的記憶、工具、代碼、學(xué)習(xí)能力和對(duì)智能體的良好支持。

國(guó)產(chǎn)模型與國(guó)產(chǎn)算力的雙劍合璧

模型之外,對(duì)DeepSeek V4的另一個(gè)期待,是希望與國(guó)產(chǎn)算力經(jīng)過(guò)磨合探索之后雙劍合璧。

現(xiàn)在已經(jīng)有不少報(bào)道在討論,DeepSeek在發(fā)布V4之前,未向英偉達(dá)、AMD等美系芯片商提供預(yù)覽,而是選擇提前數(shù)周向包括華為在內(nèi)的中國(guó)芯片供應(yīng)商開(kāi)放訪問(wèn)權(quán)限,以確保模型在國(guó)產(chǎn)算力平臺(tái)上完成深度適配與優(yōu)化。

這也是外界認(rèn)為DeepSeek V4晚點(diǎn)的一個(gè)關(guān)鍵原因。

適配國(guó)產(chǎn)算力,這條路對(duì)國(guó)產(chǎn)模型來(lái)說(shuō)非常艱難,但從更長(zhǎng)遠(yuǎn)的時(shí)間來(lái)看又不得不做。一件不得不做的事情,總要有起點(diǎn),或許DeepSeek V4就是那個(gè)起點(diǎn)。

當(dāng)模型伸出橄欖枝,壓力就給到了國(guó)產(chǎn)算力,它要求效能到產(chǎn)能再到有效供給,都要能夠進(jìn)一步跟上,與模型、智能體發(fā)展形成生態(tài)協(xié)同。

如果DeepSeek V4和R2被實(shí)證從訓(xùn)練到推理能夠在國(guó)產(chǎn)芯片上跑出世界一流的水平,并且成本更低,就有希望大幅度擺脫對(duì)海外算力的依賴,打破黃仁勛借SemiAnalysis給自己貼的那張“Token之王”的標(biāo)簽。

如果大家還有印象,DeepSeek R1問(wèn)世那一夜,英偉達(dá)暴跌近17%,單日最大市值蒸發(fā)紀(jì)錄5890億美元。

英偉達(dá)暴跌對(duì)科技股投資者來(lái)說(shuō)不是一件好事,但如果是DeepSeek推動(dòng)的,那么我們喜聞樂(lè)見(jiàn)這樣的情況再次發(fā)生。

糖水智能與原力智能分層

在這封信的尾聲,如果還要提一個(gè)期待——DeepSeek能夠在另一個(gè)Scaling Law上做出突破。

這種突破不是傳統(tǒng)意義上的“模型越大能力越強(qiáng)”,而是小體量模型不斷Scaling大體量模型的能力。

基于“原理-算法-訓(xùn)練-思考與推理能力的進(jìn)化”以及“智能的壓縮-蒸餾-內(nèi)化”這兩個(gè)技術(shù)路線,每個(gè)階段的小體量模型不斷達(dá)到上一個(gè)階段大體量模型的能力水準(zhǔn),乃至于不斷接近和達(dá)到日常高可用水平,然后在此基礎(chǔ)上能力-應(yīng)用-場(chǎng)景-價(jià)值逐步分層。

小模型、常規(guī)智能服務(wù)于簡(jiǎn)單基礎(chǔ)日常,以量見(jiàn)長(zhǎng),開(kāi)放、端側(cè)、邊緣部署和成本效率更優(yōu)——這是“糖水智能”,是Token經(jīng)濟(jì)里的喝湯部分。

大模型、超級(jí)智能服務(wù)于企業(yè)行業(yè)商業(yè)-生產(chǎn)力-專業(yè)科技-重型任務(wù),高水準(zhǔn)產(chǎn)生高溢價(jià)——這是“原力智能”,是Token經(jīng)濟(jì)里的吃肉部分。

關(guān)于小模型的能力進(jìn)化,Google Gemma 4是一個(gè)不錯(cuò)的參照系,它包含了2B、4B、26B和31B四個(gè)版本,覆蓋手機(jī)到工作站全場(chǎng)景。其中31B Dense模型在Arena AI開(kāi)源排行榜排名第三,26B A4B MoE模型排名第六。四款模型均支持圖像和視頻輸入,支持140多種語(yǔ)言,內(nèi)置可開(kāi)關(guān)的思考模式。這不是簡(jiǎn)單的參數(shù)壓縮,而是智能的蒸餾與內(nèi)化——通過(guò)更高效的知識(shí)遷移、更精密的量化剪枝、更先進(jìn)的蒸餾技術(shù),讓小模型擁有大智慧。

期待DeepSeek能在30B-70B-120B這三檔高質(zhì)量模型,蓋過(guò)Gemma-4,企業(yè)級(jí)部署能夠以萬(wàn)億參數(shù)的開(kāi)源模型超越“六小虎”曾經(jīng)達(dá)到的水平,開(kāi)創(chuàng)新的格局。

而在端側(cè),也期待DeepSeek在1B-8B這一檔的輕量化模型上實(shí)現(xiàn)同樣的突破。當(dāng)端側(cè)模型能夠在消費(fèi)級(jí)顯卡甚至手機(jī)上流暢運(yùn)行,當(dāng)個(gè)人手機(jī)、電腦里的端側(cè)模型數(shù)以億計(jì),當(dāng)每一個(gè)普通用戶都能擁有較強(qiáng)的AI能力,便是智能平權(quán)、智能經(jīng)濟(jì)的普惠形態(tài)。

2026年是新一代前沿模型和接管型智能體的“跳變式發(fā)展”之年,每家AI企業(yè)都將打出自己的王牌,引發(fā)新一輪的產(chǎn)業(yè)洗牌。

“中國(guó)團(tuán)”需要DeepSeek的回歸,開(kāi)源生態(tài)需要DeepSeek的推動(dòng),Token經(jīng)濟(jì)需要DeepSeek的深度原力智能,國(guó)產(chǎn)算力需要DeepSeek的驗(yàn)證。

現(xiàn)在,中美模型能力在日常問(wèn)答的常規(guī)智能部分幾乎已經(jīng)沒(méi)有差距,但在長(zhǎng)程復(fù)雜任務(wù)的深度智能方面還有差距。這種差距,使得大家對(duì)DeepSeek心生期待。

這是最后一次催更,也是最后的召喚。V4與R2身上,肩負(fù)的期待不僅是模型的迭代,更是一個(gè)年代的發(fā)展進(jìn)階。從模型之戰(zhàn)到全生態(tài)之戰(zhàn),從單點(diǎn)突破到全棧AI競(jìng)爭(zhēng),從跟隨模仿到自主創(chuàng)新——DeepSeek的下一步,是不是能夠定義中國(guó)人工智能的下一步?

希望DeepSeek這一年多的“沉寂”,是為了更好的爆發(fā)。

本文來(lái)自公眾號(hào):騰訊科技 作者:胡延平 編輯:蘇楊

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
巴基斯坦外長(zhǎng):美伊雙方必須繼續(xù)恪守?;鸪兄Z;伊朗:將就伊美談判一事舉行新聞發(fā)布會(huì),繼續(xù)和巴基斯坦聯(lián)系磋商

巴基斯坦外長(zhǎng):美伊雙方必須繼續(xù)恪守停火承諾;伊朗:將就伊美談判一事舉行新聞發(fā)布會(huì),繼續(xù)和巴基斯坦聯(lián)系磋商

揚(yáng)子晚報(bào)
2026-04-12 12:12:50
楊舒予中國(guó)女籃隊(duì)長(zhǎng),拒絕宮魯鳴集訓(xùn),遠(yuǎn)赴澳大利亞年薪令人唏噓

楊舒予中國(guó)女籃隊(duì)長(zhǎng),拒絕宮魯鳴集訓(xùn),遠(yuǎn)赴澳大利亞年薪令人唏噓

楓塵余往逝
2026-04-12 07:18:38
小貓不舍出嫁的小主人,每天跑幾公里探望八百遍…老公笑了:娘家來(lái)人啦!

小貓不舍出嫁的小主人,每天跑幾公里探望八百遍…老公笑了:娘家來(lái)人啦!

拜見(jiàn)喵主子
2026-04-11 11:24:45
恒大集團(tuán)許家印坑的最慘的9位大佬

恒大集團(tuán)許家印坑的最慘的9位大佬

地產(chǎn)微資訊
2026-03-29 19:08:15
雷暴周一!15股迎天量解禁,37股遭減持,這50家別碰

雷暴周一!15股迎天量解禁,37股遭減持,這50家別碰

慧眼看世界哈哈
2026-04-12 06:23:18
百萬(wàn)豪車(chē)被陪葬后續(xù):死者身份披露,官方通報(bào)處理結(jié)果,家屬回應(yīng)

百萬(wàn)豪車(chē)被陪葬后續(xù):死者身份披露,官方通報(bào)處理結(jié)果,家屬回應(yīng)

小娛樂(lè)悠悠
2026-04-11 10:05:05
女大學(xué)生吐槽“普信男”視頻火了,卻因長(zhǎng)相被嘲:你也照照鏡子吧

女大學(xué)生吐槽“普信男”視頻火了,卻因長(zhǎng)相被嘲:你也照照鏡子吧

妍妍教育日記
2026-04-11 07:35:08
遼陽(yáng)奔馳車(chē)陪葬后續(xù):主家原因曝光,車(chē)被挖出,村民透露全村第一

遼陽(yáng)奔馳車(chē)陪葬后續(xù):主家原因曝光,車(chē)被挖出,村民透露全村第一

奇思妙想草葉君
2026-04-11 14:56:58
東契奇最新動(dòng)態(tài):在斯洛文尼亞陪女兒 下階段治療結(jié)束與湖人會(huì)合

東契奇最新動(dòng)態(tài):在斯洛文尼亞陪女兒 下階段治療結(jié)束與湖人會(huì)合

羅說(shuō)NBA
2026-04-12 06:24:57
正式達(dá)標(biāo)!你好,倫納德!戰(zhàn)神卡重現(xiàn)NBA

正式達(dá)標(biāo)!你好,倫納德!戰(zhàn)神卡重現(xiàn)NBA

籃球?qū)崙?zhàn)寶典
2026-04-11 16:54:45
伊朗代表團(tuán)離開(kāi)巴基斯坦

伊朗代表團(tuán)離開(kāi)巴基斯坦

極目新聞
2026-04-12 12:11:50
30分鐘直撲東北!美國(guó)調(diào)48架F-35兵臨城下,解放軍:敢動(dòng)就全殲!

30分鐘直撲東北!美國(guó)調(diào)48架F-35兵臨城下,解放軍:敢動(dòng)就全殲!

論事的老樞
2026-04-11 20:37:25
進(jìn)入聯(lián)盟兩年,消失的狀元里薩謝

進(jìn)入聯(lián)盟兩年,消失的狀元里薩謝

只關(guān)于籃球
2026-04-12 12:32:11
求復(fù)合?馬伊琍官宣兩大喜訊,前夫文章也傳來(lái)好消息,這是鬧哪出

求復(fù)合?馬伊琍官宣兩大喜訊,前夫文章也傳來(lái)好消息,這是鬧哪出

林雁飛
2026-04-11 19:04:39
續(xù)航100公里僅跑30公里 充電31秒電量猛漲10% 東莞網(wǎng)約車(chē)司機(jī):深藍(lán)SL03虛到不敢接單

續(xù)航100公里僅跑30公里 充電31秒電量猛漲10% 東莞網(wǎng)約車(chē)司機(jī):深藍(lán)SL03虛到不敢接單

信網(wǎng)
2026-04-11 17:05:04
瑜伽褲外穿引發(fā)爭(zhēng)議,穿著不當(dāng)或致尷尬局面

瑜伽褲外穿引發(fā)爭(zhēng)議,穿著不當(dāng)或致尷尬局面

特約前排觀眾
2026-03-24 00:15:04
廣東一公司花500萬(wàn)拍下張雪冠軍復(fù)刻賽車(chē),創(chuàng)始人:車(chē)將放商場(chǎng)供粉絲打卡,500萬(wàn)已捐嫣然醫(yī)院,和張雪一樣從湖南走出來(lái),當(dāng)年也是一窮二白

廣東一公司花500萬(wàn)拍下張雪冠軍復(fù)刻賽車(chē),創(chuàng)始人:車(chē)將放商場(chǎng)供粉絲打卡,500萬(wàn)已捐嫣然醫(yī)院,和張雪一樣從湖南走出來(lái),當(dāng)年也是一窮二白

大風(fēng)新聞
2026-04-12 11:23:03
各國(guó)不吃的食物:韓國(guó)人不吃香菜,俄羅斯人不吃海參,中國(guó)人呢?

各國(guó)不吃的食物:韓國(guó)人不吃香菜,俄羅斯人不吃海參,中國(guó)人呢?

阿纂看事
2026-04-11 19:24:41
60%民調(diào)反轉(zhuǎn)!賴清德想不到,鄭麗文大陸行,扭轉(zhuǎn)國(guó)民黨10年頹勢(shì)

60%民調(diào)反轉(zhuǎn)!賴清德想不到,鄭麗文大陸行,扭轉(zhuǎn)國(guó)民黨10年頹勢(shì)

一口娛樂(lè)
2026-04-12 10:11:28
原來(lái)他就是鄭麗文丈夫,戀愛(ài)24年才結(jié)婚,不要孩子老婆事業(yè)排第一

原來(lái)他就是鄭麗文丈夫,戀愛(ài)24年才結(jié)婚,不要孩子老婆事業(yè)排第一

往史過(guò)眼云煙
2026-04-11 19:39:59
2026-04-12 12:43:00
人人都是產(chǎn)品經(jīng)理社區(qū) incentive-icons
人人都是產(chǎn)品經(jīng)理社區(qū)
想要成為大牛先從學(xué)做產(chǎn)品開(kāi)始
64622文章數(shù) 311584關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

媒體:伊朗新領(lǐng)袖"冒死接班"1個(gè)月未露面 突然全面亮劍

頭條要聞

媒體:伊朗新領(lǐng)袖"冒死接班"1個(gè)月未露面 突然全面亮劍

體育要聞

五大聯(lián)賽首冠出爐?拜仁或提前4輪衛(wèi)冕德甲

娛樂(lè)要聞

46歲趙達(dá)官宣結(jié)婚!曾與殷桃談婚論嫁

財(cái)經(jīng)要聞

三輪磋商談至深夜 美伊談判三大議題仍待解

汽車(chē)要聞

煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

態(tài)度原創(chuàng)

教育
房產(chǎn)
數(shù)碼
本地
健康

教育要聞

大鵬老師《初中數(shù)學(xué)全套課程》詳細(xì)介紹!

房產(chǎn)要聞

土地供應(yīng)突然暴跌!2026??跇鞘?,格局大變!

數(shù)碼要聞

小米電視桌面4.0重磅升級(jí)來(lái)了!流暢度大提升 多賽事同屏播放

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版