網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

100萬億Token畫出AI版圖｜Claude吃掉編程60%，DeepSeek吃掉開源一半

2025-12-05 22:51:09　來源: 賽博禪心

北京舉報

分享至

OpenRouter 和 a16z 剛剛聯(lián)合發(fā)布了一份報告：
《State of AI：An Empirical 100 Trillion Token Study》

https://openrouter.ai/state-of-ai

這份報告，基于來自全球的真實請求：
100 萬億 token，300 多個模型，60 多個提供方

這是 AI 領域，迄今最大規(guī)模用數(shù)據(jù)研究

最核心的三個信息：

? 推理模型已經(jīng)吃掉了全體 token 的一半
? 開源模型穩(wěn)定在三成，中國開源抬頭
? 編程和角色扮演是最真實的兩條主線

這份報告信息非常多，容我慢慢道來

*十分注意：本報告僅代表經(jīng)由 OpenRouter 的算力調(diào)用

開源 vs 閉源

先說一個數(shù)字
閉源模型，占有約 70% 的 token

開源 vs 閉源比例

在這張圖中，淺藍色是開源（分中國和其他地區(qū)），深藍色是閉源
豎線標注了DeepSeek V3等重要發(fā)布節(jié)點

在過去的一年中，中國的開源崛起，是一大敘事

開源 vs 閉源模型分布

2024 年底，中國開源模型的周用量只有1.2%
到 2025 年底，抬到單周接近30%，全年平均約13%

中國的開源模型，占據(jù)了穩(wěn)定位置

中國模型的崛起

在這份報告中，對于開源模型，列了一個排行

24年11月-25年11月的 OpenRouter 調(diào)用情況

DeepSeek 遙遙領先，14.37 萬億 token。Qwen 第二，5.59 萬億。Meta LLaMA 3.96 萬億，Mistral AI 2.92 萬億

后面還有 OpenAI 的開源系列、Minimax、Z-AI、TNGTech、月之暗面、Google

這里還有一份變化曲線

Top 15 開源模型走勢

早期幾乎是 DeepSeek 雙核壟斷
DeepSeek V3 和 R1 兩條帶子加起來，長期占 OSS 使用的一半以上

從 2025 年夏天開始，市場格局完全變了
Qwen、GLM、Moonshot、Minimax、GPT-OSS系列迅速抬頭
到 2025 年底，沒有任何單個模型超過 25% 的份額

這是一個從寡頭到多元的轉(zhuǎn)變

模型尺寸：小型退潮，中型起勢

報告把 OSS 按參數(shù)規(guī)模分成三檔

? 小于 15B
? 15–70B
? 大于等于 70B

不同大小模型使用占比

結(jié)論還算明顯：

? 小模型的數(shù)量在持續(xù)增加，但使用占比在下降
? 中模型和大模型的使用占比在提升

中檔市場基本是從Qwen2.5 Coder 32B發(fā)布后被“做”出來的

后面Mistral Small 3、GPT-OSS 20B等一批中型模型，把這個帶變成了一個穩(wěn)定選項

不同大小模型數(shù)量變化

現(xiàn)在的開源市場，大致可以這么看

? 小模型是試驗場
? 中模型是性價比區(qū)
? 大模型是高復雜度區(qū)

開源模型被用于什么

這是一份反直覺的發(fā)現(xiàn)，開源模型的使用如下

?第一大場景是角色扮演，占超過 50%
? 編程則是第二，占約 20%
? 其他翻譯、知識問答、教育等都在后面

OSS 模型任務類別趨勢

對此，報告給的解釋是：
開源模型的內(nèi)容過濾更少，可以更自由地用于創(chuàng)意場景，故事續(xù)寫、角色扮演、游戲場景

對于角色扮演，這里的也有個細分

Roleplay 子標簽結(jié)構(gòu)

58% 是 Role-Playing Game 場景
另外有寫作資源、成人相關(guān)內(nèi)容

國產(chǎn)模型：主要是編程

但如果單看中國開源模型，畫面又不一樣了

中國 OSS 任務類別趨勢

Roleplay 仍然是最大類，但只有約33%，編程和技術(shù)合計約39%

這說明一件事
中國模型在開源世界里，更偏技術(shù)生產(chǎn)力使用

編程場景：閉源吃大頭，開源靠中國

報告單獨把 Programming 拎出來看

編程場景，在不同模型源的份額

編程這個品類里，閉源模型（主要是 Claude）還是主力

但開源部分，中國模型則是主流選擇

Roleplay 場景：五五開

同樣方式看 Roleplay
閉源和開源已經(jīng)是可替代關(guān)系

Roleplay場景，在不同模型源的份額推理模型占一半

都說今年是 Agent 的元年
AI 不再是「給個問題，出個答案」
而是：開始規(guī)劃、調(diào)用工具、多步推理、在長上下文中迭代

報告用四個指標來追蹤這個趨勢

第一，推理模型的用量占比
推理 vs 非推理 token 趨勢

2025 年初，推理模型的用量幾乎可以忽略
現(xiàn)在，這個數(shù)字已經(jīng)超過了 50%

供給側(cè)
GPT-5、Claude 4.5、Gemini 3 這些新模型都強調(diào)多步推理

需求側(cè)
用戶開始偏好能夠管理任務狀態(tài)、執(zhí)行多步邏輯、支持 agent 工作流的模型

下面這個圖，則是頭部推理模型的份額

Top 推理模型 token 份額

之前 Gemini 2.5 Pro 還是第一
然后是 xAI 的 Grok Code Fast 1 領先，Gemini 2.5 Pro 和 Flash 緊隨其后，OpenAI 的 gpt-oss-120b 也在前列

第二，工具調(diào)用的使用率
工具調(diào)用占比

整體趨勢向上，5 月的尖峰是個別大客戶導致的
這意味著更多的請求不只是問答，而是讓模型去執(zhí)行外部操作

讓我們再看看工具的使用

按模型看工具調(diào)用量

最開始主要是gpt-4o-mini 和 Claude 3.5、3.7

到 9 月之后，Claude 4.5 Sonnet 迅速階梯，然后 Grok Code Fast、GLM 4.5 也開始出現(xiàn)

第三，Prompt 長度的增長
Prompt token 數(shù)增長

平均 prompt 長度翻了 4 倍，從約 1,500 token 漲到 6,000+ token

Completion token 數(shù)增長

輸出長度也漲了近 3 倍，從約 150 token 到 400 token

不同類別下 Prompt 長度變化

Prompt 長度的增長主要來自編程類任務。代碼理解、調(diào)試、生成這些任務經(jīng)常需要 20K+ 的輸入 token

第四，整體序列長度
平均序列長度變化

過去 20 個月，平均序列長度漲了 2.7 倍

編程 vs 全體序列長度

現(xiàn)在的典型請求不再是“寫一段東西”
而是“給你一大堆代碼 / 文檔，你幫我分析、推理、修改”

報告的判斷是：
Agentic Inference 很快就會（如果還沒有的話）超過人類推理的用量

模型任務的使用場景

報告用 GoogleTagClassifier 把請求分成 12 個類別
Programming、Roleplay、Technology、Science、Translation、Health 等

編程是最大的增長品類
編程成為主導類別

2025 年初，編程相關(guān)請求占 token 約 11%
最近幾周，這個數(shù)字已超過 50%

這條線對應的是

? AI 輔助開發(fā)在 IDE 里的深度集成
? 內(nèi)部平臺對 LLM 的接入
? 以及調(diào)試、日志分析、數(shù)據(jù)腳本等長上下文場景

不同提供方在編程類別的份額

在編程盤子里

? Anthropic Claude 長期吃掉超過 60% 的支出
? Google 穩(wěn)在 15% 左右，OpenAI 從 2% 爬到約 8%
? MiniMax 最近幾周明顯抬頭，是增長最快的新玩家

其他品類的內(nèi)部構(gòu)成

報告給了兩張“Top 6 類別”和“Next 6 類別”的子標簽分布

前六大類別的子標簽結(jié)構(gòu)

有幾個點值得留意

Roleplay
約 60% 是 Games/Roleplaying Games
另外有 Writers Resources 和 Adult 的不小占比

Programming
超過三分之二被打在 “Programming/Other” 標簽下
說明它是廣義編程需求，不是單一語言的垂直場景

Translation
幾乎平均分布在語言資源和其他
是一個“工具型”長期需求

Science
80% 是 Machine Learning & AI 自身相關(guān)
典型的“問 AI 關(guān)于 AI”

Health
是所有大類里最分散的
沒有任何一個子標簽超過 25%

次六大類別的子標簽結(jié)構(gòu)

健康是最分散的品類，沒有任何子標簽超過 25%
金融、學術(shù)、法律也都很分散，可能是因為這些領域的 LLM 工作流還不成熟

各家廠商的使用畫像

報告把Anthropic、Google、OpenAI、xAI、DeepSeek、Qwen這幾家抽出來，看它們各自的任務分布

Anthropic 使用結(jié)構(gòu)

Anthropic高度集中在編程和技術(shù)任務。角色扮演和閑聊只是一小部分

Google 使用結(jié)構(gòu)

Google使用分布更均勻。翻譯、科學、技術(shù)、知識問答都有份額。編程占比在 2025 年底降到了 18% 左右

xAI 使用結(jié)構(gòu)

xAI大部分時間 80% 以上是編程。但 11 月突然變了，技術(shù)、角色扮演、學術(shù)都漲起來了。報告推測這和 xAI 通過某些消費應用免費分發(fā)有關(guān)，帶來了大量非開發(fā)者用戶

OpenAI 使用結(jié)構(gòu)

OpenAI2025 年初超過一半是科學類任務，到年底降到 15% 以下。編程和技術(shù)各占 29% 左右

DeepSeek 使用結(jié)構(gòu)

DeepSeek角色扮演、閑聊、娛樂占了大頭，經(jīng)常超過 2/3。編程和科學只占一小部分

Qwen 使用結(jié)構(gòu)

Qwen編程長期維持在 40–60% 區(qū)間，Science、Technology、Roleplay 份額波動較大

每個廠商都有自己的定位，沒有誰能通吃所有場景

地理分布

LLM 使用越來越全球化，OpenRouter 的亞洲請求持續(xù)增多

區(qū)域結(jié)構(gòu)：亞洲份額翻倍
按地區(qū)的支出占比

亞洲份額從 13% 漲到 31%，翻了一倍多

北美還是最大的，占 47.22%，但已經(jīng)不到一半了。亞洲 28.61%，歐洲 21.32%。大洋洲、南美、非洲加起來不到 3%

按國家看，美國 47.17%，新加坡 9.21%，德國 7.51%，中國 6.01%，韓國 2.88%，荷蘭 2.65%，英國 2.52%，加拿大 1.90%，日本 1.77%，印度 1.62%，其他 60+ 國家合計 16.76%

語言結(jié)構(gòu)：英文第一，中文第二

語言分布很直白

? 英語 82.87%
? 簡體中文 4.95%
? 俄語 2.47%
? 西班牙語 1.43%
? 泰語 1.03%

英文仍然是絕對統(tǒng)治地位，但中文已經(jīng)是第二大單語種

需要注意：這個數(shù)據(jù)只代表 OpenRouter 的訪問請求

用戶留存：灰姑娘的玻璃鞋

這是很意思的發(fā)現(xiàn)
早期用戶的留存遠遠好于后來的用戶
他們把這叫做「灰姑娘的玻璃鞋」

灰姑娘的玻璃鞋 Cinderella Glass Slipper 當一個新模型發(fā)布時，最早嘗試的那批用戶，如果發(fā)現(xiàn)這個模型剛好能解決他們的問題（「鞋子剛好合腳」），他們就會留下來，而且留存時間非常長

第一個解決用戶真實痛點的模型，會建立起深度、粘性的使用
用戶會圍繞這個模型建立工作流和習慣，切換成本很高

對于模型開發(fā)者和投資人來說，要看的不是增長曲線，而是留存曲線，那些「基礎性群組」的形成

這里先放幾個留存曲線，大家感受下

Claude 4 Sonnet 留存Gemini 2.5 Pro 留存OpenAI GPT-4o Mini 留存DeepSeek R1 留存

對此，讓我們來看看這幾組模型

OpenAI GPT-4o Mini的水晶鞋

2024 年 7 月的曲線明顯高出其他時期
后面所有曲線幾乎都在底部貼著走

OpenAI GPT-4o Mini 留存

如果某個模型在發(fā)布時就抓住了需求
對應的用戶就會成為基礎性群組

后面再進來的用戶
要么已經(jīng)有主力模型
要么只是輕度使用
窗口只有一次，錯過就沒有

Gemini 2.0 Flash沒有水晶鞋

Gemini 2.0 Flash的留存，則非常貼合
每條曲線都差不多
沒有任何一條明顯高出

OpenAI GPT-4o Mini 留存

這是啥意思呢？
這模型來的太遲了，也沒有足夠的性能優(yōu)勢
所以，并不會某個高價值工作負載視為“第一選擇”
它們從一開始就被當作“夠用”的替代品

DeepSeek的先跌后升

DeepSeek V3/R1則比較特殊
留存曲線都出現(xiàn)了「先跌后升」

DeepSeek V3 留存DeepSeek R1 留存

報告把這個叫boomerang effect
就是用戶離開以后又回來
說明對比了其他模型后
確認 DeepSeek 在性能 + 成本 + 特性組合上仍然最合適

就只能說牛逼了

定價與用量：四種關(guān)系

在報告的最后，有這么一張圖
不同模型的定價策略

開源 vs 閉源模型成本 vs 使用

再看提供方視角

模型成本 vs 使用市場圖

對此，就有了四象限分類：效率巨頭、高端領導者、長尾、高端專家

Efficient giants/效率巨頭
低價高量如 Gemini 2.0 Flash、DeepSeek V3 0324

Premium leaders/高端領導者
高價高量如 Claude 3.7 Sonnet、Claude Sonnet 4

Long tail/長尾
低價低量如 Qwen 2 7B Instruct、IBM Granite 4.0 Micro

Premium specialists/高端專家
極高單價如 GPT-4、GPT-5 Pro

進而的，又多了一些結(jié)論

? 企業(yè)愿意為關(guān)鍵任務付高價，開發(fā)者和愛好者會涌向便宜的模型
? 便宜的模型消耗了更多 token，但不會帶來深度集成
? Claude 和 GPT-4 雖然貴，但用量依然大，因為它們更可靠、信任度更高
? 光便宜沒用：很多接近零成本的開源模型用量也很小

收尾：報告的六個核心結(jié)論

報告最后給了六個判斷

第一，多模型生態(tài)是常態(tài)
沒有誰能通吃，用戶會根據(jù)任務選模型，開發(fā)者沒有忠誠度

第二，使用場景很多元
角色扮演和娛樂用量巨大，不只是生產(chǎn)力工具。

第三，Agentic 推理正在成為主流
單輪問答的時代在過去，多步推理、工具調(diào)用、長上下文迭代，這些才是現(xiàn)在的主戰(zhàn)場

第四，地理格局在去中心化
亞洲份額翻倍，中國既是消費者也是供應商。LLM 必須是全球可用的

第五，價格不是唯一變量
用戶會在質(zhì)量、可靠性、能力廣度之間做權(quán)衡

第六，留存是真正的護城河
第一個解決用戶痛點的模型，會建立深度粘性

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

又一國產(chǎn)大模型剛剛開源！能使喚機器狗拿水

智東西 2025-12-26 20:40:18
0 跟貼 0
氛圍編程，可能是2025年最大的AI騙局

新智元 2025-12-27 13:15:55
2 跟貼 2

一份沒有標準答案的AI考卷，頂尖模型集體失靈

DeepTech深科技 2025-12-25 19:00:40
1 跟貼 1

2025年的14個AI熱詞

DeepTech深科技 2025-12-26 15:05:18
0 跟貼 0
推理成本打到1元/百萬token，浪潮撬動Agent規(guī)?；白詈笠还铩?/a>

量子位 2025-12-26 14:36:33
2 跟貼 2

揭秘Agent落地困局！93%企業(yè)項目卡在POC到生產(chǎn)最后一公里

量子位 2025-12-25 17:29:29
0 跟貼 0

從智能搜索工具到AI代理電商模式先驅(qū)，四年估值200億美元，Perplexity面臨怎樣的困境？

鈦媒體APP 2025-12-25 11:00:27
0 跟貼 0
Notion CEO長文刷屏：AI將把知識工作帶入“無限心智”時代

DeepTech深科技 2025-12-26 18:24:53
0 跟貼 0

一片錄音卡，重寫大廠硬件故事

36氪 2025-12-25 14:56:13
1 跟貼 1
金魚損失隨機剔除token，讓AI不再死記硬背

量子位 2025-09-03 17:37:23
0 跟貼 0
RLinf v0.2嘗鮮版發(fā)布，像使用GPU一樣使用你的機器人！

機器之心Pro 2025-12-26 14:02:06
0 跟貼 0
谷歌創(chuàng)始人布林：當年發(fā)完Transformer論文，我們太不當回事了

機器之心Pro 2025-12-15 10:18:00
36 跟貼 36
SOLO Coder 在現(xiàn)有項目基礎上繼續(xù)完善功能、修復問題

機器之心Pro 2025-11-13 14:18:40
0 跟貼 0
清華唐杰：領域大模型，偽命題

量子位 2025-12-26 17:05:53
3 跟貼 3
安卓之父重返機器人賽道：這次，他要在東京造真正的Android

DeepTech深科技 2025-11-13 21:33:55
0 跟貼 0
成本0.3美元，耗時26分鐘！CudaForge：顛覆性低成本CUDA優(yōu)化框架

機器之心Pro 2025-11-17 18:45:03
0 跟貼 0
別被“莽夫邏輯”帶偏！為啥美國敢出兵，中國卻要克制？

唐尼二愛生活 2025-12-24 08:57:46
0 跟貼 0
黑老大2名表超5千萬成交深圳原政法委書記是其保護傘

每日經(jīng)濟新聞 2025-12-26 20:34:51
2418 跟貼 2418
殲-36尾部改造，疑似換裝渦扇15，揭示航發(fā)“過渡期”策略

星落山間 2025-12-26 02:09:11
0 跟貼 0
M+框架來了，增加LLM隱空間記憶，不再受上下文窗口限制

機器之心Pro 2025-07-15 17:07:00
0 跟貼 0
魔獸時光服雙采腳本外掛猖獗，希望官方早做處理

我在右 2025-12-24 18:15:20
0 跟貼 0
首仿藥、原研藥、仿制藥怎么選？藥企工程師帶你揭秘背后邏輯

沙果嘮生活 2025-12-27 11:56:31
0 跟貼 0
天塹變通途！極氪001車隊首批穿越天山勝利隧道，南北疆從此邁入“一日往返”時代

魯中晨報 2025-12-26 19:16:51
15321 跟貼 15321
華為諾亞&港中文發(fā)布SCOPE：Prompt自我進化，讓HLE成功率翻倍

機器之心Pro 2025-12-26 14:16:31
0 跟貼 0
首富馬斯克最新身家7519億美元超第二近5000億美元

魯中晨報 2025-12-26 17:05:03
2705 跟貼 2705
克萊：我希望庫里別穿著我的KT11贏獨行俠，但他穿就挺棒的了

懂球帝 2025-12-26 17:35:07
81 跟貼 81
【ai agent智能體架構(gòu)躍遷】1小時吃透 Agent 核心（設計模式全解析+代碼實戰(zhàn)）新手也能

盧菁老師 2025-12-24 17:13:20
0 跟貼 0
不亞于軟件編程，一個是實物一個是代碼，邏輯思維也一樣！

麥滋生活說 2025-12-27 08:37:09
0 跟貼 0
寶馬網(wǎng)紅銷冠推行"一口價"賣車:來回談價累 8天賣11輛

瀟湘晨報 2025-12-26 20:17:50
1039 跟貼 1039
一只大頭機器狗供不應求，打響了消費級具身智能第一槍

量子位 2025-12-26 21:30:15
0 跟貼 0
Deepseek+中級會計=王炸

會計人 2025-12-27 12:08:07
0 跟貼 0
最后的依靠不是任何人：40歲后，請安裝這套“清醒力操作系統(tǒng)”

月影說職場 2025-12-24 18:33:49
0 跟貼 0
拜登平安夜發(fā)了一張"奇怪的全家福" 還被"好大兒"背刺

澎湃新聞 2025-12-26 22:59:31
377 跟貼 377
中方對20家美國軍工相關(guān)企業(yè)及高管采取反制措施

央視新聞客戶端 2025-12-26 17:04:30
1961 跟貼 1961
《獻血法》頒布實施至今全國無償獻血累計3.08億人次保障獻血者權(quán)益從多個維度持續(xù)發(fā)力

每日經(jīng)濟新聞 2025-12-26 18:08:17
204 跟貼 204
【DeepSeek談藝】王輝·風景油畫 | 形與意相諧，營造出詩意畫境

文化視界網(wǎng) 2025-12-26 17:07:51
0 跟貼 0
“漲到可怕了！”有人一覺醒來賺了18萬

都市快報橙柿互動 2025-12-27 13:41:17
0 跟貼 0
男子徒手打開滅火毯，雙手刺痛扎滿玻璃纖維

學申論的談妹 2025-12-27 04:40:56
320 跟貼 320
2026年全國兩會召開時間來了

央視新聞客戶端 2025-12-27 09:14:00
66 跟貼 66
中國航發(fā)集團原董事長曹建國已從中國工程院院士名單中撤下

澎湃新聞 2025-12-27 09:54:26
0 跟貼 0

賽博禪心

拜AI古佛，修賽博禪心

225文章數(shù) 12關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

游戲

親子

藝術(shù)

家居

手機 / 數(shù)碼

房產(chǎn) / 家居

100萬億Token畫出AI版圖｜Claude吃掉編程60%，DeepSeek吃掉開源一半

小米也漲價了！業(yè)界稱終端再不漲明年必虧

男子戒毒后隨領導出差被警察帶走驗尿 回家后工作沒了

男子戒毒后隨領導出差被警察帶走驗尿 回家后工作沒了

NBA教練圈的布朗尼，花了22年證明自己

張昊唯逃稅涉黃風波落幕：法院認定朋友造謠

注意，開始拉物價了！

好音響比大屏更重要？車企開始“聽”用戶的

態(tài)度原創(chuàng)

這些新療法，讓化療不再那么痛苦

索尼被騎臉！獨占神作被抄襲 PS商店竟然給過審了

父母為了孩子連夜驅(qū)車趕來武漢，為了方便換藥在武漢租房等待

砸50億！廣東驚現(xiàn)“全球最大爛尾醫(yī)院”，連窗框都沒裝完

格調(diào)時尚 智慧品質(zhì)居所

100萬億Token畫出AI版圖｜Claude吃掉編程60%，DeepSeek吃掉開源一半

小米也漲價了！業(yè)界稱終端再不漲明年必虧

男子戒毒后隨領導出差被警察帶走驗尿回家后工作沒了

男子戒毒后隨領導出差被警察帶走驗尿回家后工作沒了

NBA教練圈的布朗尼，花了22年證明自己

注意，開始拉物價了！

好音響比大屏更重要？車企開始“聽”用戶的

這些新療法，讓化療不再那么痛苦

索尼被騎臉！獨占神作被抄襲 PS商店竟然給過審了

砸50億！廣東驚現(xiàn)“全球最大爛尾醫(yī)院”，連窗框都沒裝完

格調(diào)時尚智慧品質(zhì)居所