網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

中國(guó)開(kāi)源模型，如何超越2025年

2025-11-14 00:14:02　來(lái)源: 未盡研究

上海舉報(bào)

分享至

臨近年底，全球大模型競(jìng)爭(zhēng)已提前拉開(kāi)2026年序幕。

在中國(guó)，MiniMax與月之暗面相繼開(kāi)源旗艦?zāi)Ｐ�，百度高達(dá)2.4萬(wàn)億參數(shù)規(guī)模的文心5.0正式登場(chǎng)，社區(qū)還在等待阿里的Qwen以及DeepSeek的下一步。在美國(guó)，OpenAI的GPT-5.1今日發(fā)布，谷歌的Gemini 3已經(jīng)拉滿預(yù)期，馬斯克也曾預(yù)告Grok 5年底登場(chǎng)。

短短一年，中國(guó)開(kāi)源模型從不為世界所知，崛起至讓硅谷倍感壓力。“價(jià)廉物美”是今年中國(guó)開(kāi)源模型主調(diào)，甚至，部分模型可以打著“發(fā)布時(shí)間差”，宣告在選定測(cè)試基準(zhǔn)上后發(fā)制人的超越。但隨著商業(yè)化壓力劇增，明年，開(kāi)源與閉源相互攻防，將圍繞著token經(jīng)濟(jì)學(xué)展開(kāi)。

基準(zhǔn)飽和，擴(kuò)展不靈

過(guò)去一年，中國(guó)開(kāi)源模型參與的全球AI競(jìng)爭(zhēng)，核心敘事就是在訓(xùn)練與推理上花更少的錢，接近前沿模型的水平。隨著內(nèi)部混亂不已的Meta逐步退出競(jìng)爭(zhēng)，開(kāi)源AI的競(jìng)賽；明年的目標(biāo)是進(jìn)一步縮小與最領(lǐng)先的閉源模型之間的性能差距。

市場(chǎng)對(duì)中國(guó)開(kāi)源模型在部分基準(zhǔn)測(cè)試中取得短暫領(lǐng)先感到興奮。但這種“錯(cuò)覺(jué)”不會(huì)一直持續(xù)下去。一方面，開(kāi)源模型更新頻率更高，追趕差距往往只是發(fā)布時(shí)間的錯(cuò)位；另一方面，擴(kuò)展定律邊際放緩，也在為中國(guó)短期內(nèi)逼近前沿打開(kāi)了時(shí)間窗口。追趕者天然具備成本優(yōu)勢(shì)。

基準(zhǔn)測(cè)試已經(jīng)飽和。大模型的真實(shí)進(jìn)步，越來(lái)越難被基準(zhǔn)捕捉。行業(yè)正在吸取Meta在Llama4上的教訓(xùn)，拒絕以打榜基準(zhǔn)為目標(biāo)而主動(dòng)“作弊”，但很多時(shí)候，模型被測(cè)試集“污染”的情況仍然難以避免。當(dāng)模型在基準(zhǔn)分?jǐn)?shù)上差距越來(lái)越難以分辨，各家公司開(kāi)始靠營(yíng)銷來(lái)“差異化”自己，進(jìn)一步降低了基準(zhǔn)公信力。這又放大了外界對(duì)開(kāi)源模型測(cè)試成績(jī)的質(zhì)疑。某些情況下，第三方配置環(huán)境與參數(shù)的不同也會(huì)導(dǎo)致測(cè)試水平波動(dòng)。

行業(yè)需要更新驗(yàn)證創(chuàng)新的基準(zhǔn)，也需要重新探索創(chuàng)新的路徑。硅谷大神卡帕西，只依賴最終獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)，往往會(huì)誤獎(jiǎng)中間的錯(cuò)誤步驟，也錯(cuò)過(guò)過(guò)程中的靈光一閃。中國(guó)研究團(tuán)隊(duì)也質(zhì)疑，可驗(yàn)證獎(jiǎng)勵(lì)強(qiáng)化學(xué)習(xí)（RLVR）并未真正涌現(xiàn)超出預(yù)訓(xùn)練的推理能力。大模型對(duì)這個(gè)世界的理解，仍然是預(yù)訓(xùn)練數(shù)據(jù)集“分布內(nèi)”的知識(shí)，但是，大模型預(yù)訓(xùn)練擴(kuò)展定律卻已經(jīng)“死亡”。

行業(yè)正在探索新的可能。Transformer八子中的Ashish Vaswani，批評(píng)業(yè)界對(duì)后訓(xùn)練的沉迷是短期驅(qū)動(dòng)，掩蓋了預(yù)訓(xùn)練創(chuàng)新的長(zhǎng)期改進(jìn)空間；Llion Jones正在重新審視那些可以追溯到Transformer之前的想法。傳言離開(kāi)Meta的楊立昆，醞釀在世界模型領(lǐng)域創(chuàng)業(yè)，加入與李飛飛團(tuán)隊(duì)的競(jìng)爭(zhēng)。但這些嘗試都仍處于早期，解不了近憂。

創(chuàng)新“停滯”倒逼著商業(yè)變現(xiàn)，對(duì)AI泡沫的。明年，開(kāi)源模型與閉源模型的性能競(jìng)爭(zhēng)，最終將落在token經(jīng)濟(jì)學(xué)之上。它與當(dāng)前絕大多數(shù)評(píng)測(cè)基準(zhǔn)沒(méi)有直接關(guān)系。這次，OpenAI發(fā)布GPT-5.1，就已經(jīng)跳出了這個(gè)數(shù)字游戲。一切，最終用戶說(shuō)了算，在工作場(chǎng)景中創(chuàng)造價(jià)值說(shuō)了算。

token經(jīng)濟(jì)學(xué)

這一輪AI創(chuàng)新的基本元素是token。它的單位成本與消耗量決定了任務(wù)成本，任務(wù)的經(jīng)濟(jì)價(jià)值又決定了token的價(jià)值。當(dāng)然，經(jīng)濟(jì)還涉及“周轉(zhuǎn)率”。吞吐這些token的速度，決定著單位時(shí)間能創(chuàng)造多少價(jià)值。

中國(guó)開(kāi)源模型仍在以極致性價(jià)比，向美國(guó)閉源陣營(yíng)施壓。目前，在Artificial Analysis的榜單中，最新發(fā)布的MiniMax-M2與Kimi-K2-Thinking，都處于性能表現(xiàn)略遜于GPT-5（high），但單位成本優(yōu)勢(shì)明顯的象限內(nèi)。其他處于這一象限模型，也大多出自中國(guó)企業(yè)之手。價(jià)廉物美是中國(guó)開(kāi)源模型今年崛起的基調(diào)，明年也將如此。

中國(guó)的這一優(yōu)勢(shì)，來(lái)自算力“卡脖子”的倒逼創(chuàng)新。為了突破算力限制，中國(guó)開(kāi)源大模型普遍將自注意力機(jī)制等優(yōu)化作為創(chuàng)新重點(diǎn)，盡可能地。DeepSeek與智譜還，以應(yīng)對(duì)越來(lái)越長(zhǎng)的上下文窗口。今年，DeepSeek帶動(dòng)了中國(guó)，也引發(fā)了一波又一波的價(jià)格戰(zhàn)。明年，中國(guó)開(kāi)源模型會(huì)不會(huì)進(jìn)一步卷到自研模型的歐美企業(yè)數(shù)量進(jìn)一步收斂？

但并非只有算法才會(huì)影響的token單位成本。AI芯片與內(nèi)存、通信硬件的性能及其能效，也發(fā)揮重要作用。黃仁勛一直鼓吹“買得越多，省得越多”，就是從硬件與基礎(chǔ)設(shè)施層面優(yōu)化能效，降低運(yùn)營(yíng)成本的邏輯。這是美國(guó)的強(qiáng)項(xiàng)。

今年以來(lái)，中國(guó)開(kāi)源模型已經(jīng)開(kāi)始推進(jìn)。螞蟻集團(tuán)在國(guó)產(chǎn)異構(gòu)集群上完成了對(duì)2900億規(guī)模參數(shù)Ling-Plus的訓(xùn)練，成本較H800降低20%；DeepSeek“指導(dǎo)”芯片與基礎(chǔ)設(shè)施廠商針對(duì)性地優(yōu)化，尤其是DeepSeek V3.2-Exp發(fā)布后，華為昇騰和寒武紀(jì)均。明年，中國(guó)開(kāi)源模型是否會(huì)交付一款完全基于國(guó)產(chǎn)算力技術(shù)棧的前沿開(kāi)源模型？

但token的單位成本不是決定token經(jīng)濟(jì)學(xué)的一切。甚至，完成一項(xiàng)任務(wù)的總token成本，都不是上述因素所能完全左右的。

如果算力一定，那么，大模型的速度、性能與成本在實(shí)際工作負(fù)載中需要權(quán)衡。大模型的速度，包括延遲（Latency，即首個(gè)token的生成時(shí)間）與吞吐率（Throughput，即每個(gè)token的生成速度）等。中國(guó)開(kāi)源模型在算力資源有限的情況下，要追平性能，價(jià)格更低，不得不犧牲部分速度優(yōu)先級(jí)，這直接影響用戶體驗(yàn)。事實(shí)上，很長(zhǎng)一段時(shí)間，這也是Anthropic所面對(duì)的問(wèn)題，直至今年它與亞馬遜、谷歌深度綁定，賬面投入數(shù)百億美元，補(bǔ)上與OpenAI的算力差距。

此外，token單位成本優(yōu)勢(shì)還可能被“冗長(zhǎng)思考”侵蝕。很多用戶和開(kāi)發(fā)者已經(jīng)注意到，似乎DeepSeek-R1等開(kāi)源模型，在回答問(wèn)題時(shí)往往缺乏“節(jié)制”，使用了過(guò)多的token。尤其是簡(jiǎn)單問(wèn)題，它。Kimi-K2-Thinking也犯了這個(gè)毛病，影響了用戶體驗(yàn)，削弱了成本優(yōu)勢(shì)。月之暗面創(chuàng)始人楊植麟解釋，現(xiàn)階段該模型優(yōu)先考慮絕對(duì)性能，token效率會(huì)在后續(xù)得到改善。

未來(lái)，在多智能體協(xié)作中，冗余消耗和記憶占用，短板效應(yīng)會(huì)更加明顯。OpenAI就非常重視這一問(wèn)題，即使初期體驗(yàn)不佳，被用戶指責(zé)“黑箱”，還是堅(jiān)持讓，根據(jù)對(duì)話類型、復(fù)雜度、所需工具和明確意圖快速?zèng)Q定調(diào)用哪個(gè)模型。這次的GPT-5.1也不例外，它能更精準(zhǔn)地根據(jù)問(wèn)題調(diào)整思考時(shí)間。

聲勢(shì)強(qiáng)，商業(yè)弱

中國(guó)的開(kāi)源模型正在贏得硅谷的青睞。無(wú)論AI基礎(chǔ)設(shè)施層還是應(yīng)用層的企業(yè)，都樂(lè)意在合適場(chǎng)景下部署或調(diào)用這些“夠好用又夠便宜”的模型。懸念在于，它們能否在不斷增長(zhǎng)的市場(chǎng)中，分得更大的一塊。

中國(guó)開(kāi)源模型確實(shí)能夠創(chuàng)造價(jià)值。月初，在多模型API聚合平臺(tái)OpenRouter上，對(duì)中國(guó)開(kāi)源模型的API的調(diào)用，占據(jù)了20%以上的市場(chǎng)份額。它還沒(méi)算上用戶私有部署的開(kāi)源模型。今年8月，中國(guó)開(kāi)源模型的全球累計(jì)下載量就已經(jīng)超越了美國(guó)。對(duì)于成本敏感的全球南方國(guó)家而言更是如此。上個(gè)月，彭博社驚呼中國(guó)AI模型正在非洲崛起，當(dāng)?shù)仄髽I(yè)家齊聚一堂，聆聽(tīng)華為云撒哈拉以南非洲地區(qū)首席架構(gòu)師宣講DeepSeek。

中國(guó)開(kāi)源模型往往會(huì)針對(duì)某些細(xì)分應(yīng)用場(chǎng)景迭代。它們往往是基于業(yè)務(wù)數(shù)據(jù)積累與實(shí)際需求的微創(chuàng)新。今年，騰訊、阿里、字節(jié)跳動(dòng)幾乎同時(shí)開(kāi)源了自己的翻譯模型Hunyuan-MT-7B、Qwen3-MT與Seed-X-7B。針對(duì)特定市場(chǎng)的翻譯問(wèn)題遠(yuǎn)未解決，而且需求巨大，社交、電商等場(chǎng)景下高頻調(diào)用，值得做到像編碼模型這樣專。共享民宿巨頭Airbnb的CEO布萊恩·切斯基（Brian Chesky）就說(shuō)，他們使用OpenAI的最新版本，但很大程度上更依賴于Qwen模型。非洲企業(yè)也反饋歐美模型對(duì)非洲語(yǔ)言的token切分并不合理。

但是，從看，中國(guó)開(kāi)源模型仍然無(wú)法與美國(guó)前沿模型相匹敵，也難以撼動(dòng)硅谷巨頭的生態(tài)。開(kāi)源模型的市場(chǎng)份額，并沒(méi)有體現(xiàn)為這些企業(yè)的收入份額。年底，OpenAI的ARR或達(dá)200億美元，Anthropic則有望實(shí)現(xiàn)90億美元。沒(méi)有一家中國(guó)初創(chuàng)企業(yè)可以達(dá)到這一體量，它們面臨投資者的壓力。

越來(lái)越多中國(guó)開(kāi)源模型已經(jīng)，這次Kimi-K2-Thinking就強(qiáng)化了工具調(diào)用能力。中國(guó)SaaS企業(yè)先天不足，明年，開(kāi)源模型加持的智能體能否打開(kāi)中國(guó)企業(yè)服務(wù)的市場(chǎng)？

事實(shí)上，規(guī)模就是創(chuàng)新。開(kāi)源模型初創(chuàng)企業(yè)并不直接占有ChatGPT那樣的海量用戶數(shù)據(jù)，同時(shí)缺乏集中、持續(xù)的用戶反饋機(jī)制，在長(zhǎng)尾需求、細(xì)節(jié)優(yōu)化與真實(shí)交互方面存在劣勢(shì)。阿里巴巴與字節(jié)跳動(dòng)等具備全棧技術(shù)、垂直整合能力與龐大用戶生態(tài)的互聯(lián)網(wǎng)巨頭，可以通過(guò)賦能內(nèi)部業(yè)務(wù)形成閉環(huán)，而初創(chuàng)企業(yè)很難逾越這一壁壘。

此外，盡管大模型在基準(zhǔn)測(cè)試中考得越來(lái)越好，但，它嵌入實(shí)際工作流的效果仍然不佳。Anthropic、OpenAI和Cohere正在招聘“前沿部署工程師”，以應(yīng)對(duì)定制服務(wù)挑戰(zhàn)。而開(kāi)源模型廠商對(duì)此的響應(yīng)更為困難。

2026年，開(kāi)源仍然是中國(guó)的確定敘事。它意味著國(guó)產(chǎn)算力生態(tài)協(xié)同，也意味著科技普惠與自立自強(qiáng)。但是，開(kāi)源模型的陣容或?qū)㈦S著商業(yè)閉環(huán)的推進(jìn)而改寫，美團(tuán)、小米、螞蟻等公司可能頻繁地露臉。競(jìng)爭(zhēng)品類的激增，將讓更多歐美模型廠商承受價(jià)格壓力，不斷構(gòu)建差異化體驗(yàn)，或者擠破泡沫。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.