国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

100萬億Token畫出AI版圖|Claude吃掉編程60%,DeepSeek吃掉開源一半

0
分享至

OpenRouter 和 a16z 剛剛聯(lián)合發(fā)布了一份報告:
《State of AI:An Empirical 100 Trillion Token Study》


https://openrouter.ai/state-of-ai

這份報告,基于來自全球的真實請求:
100 萬億 token,300 多個模型,60 多個提供方

這是 AI 領域,迄今最大規(guī)模用數(shù)據(jù)研究

最核心的三個信息:

  • ? 推理模型已經(jīng)吃掉了全體 token 的一半

  • ? 開源模型穩(wěn)定在三成,中國開源抬頭

  • ? 編程和角色扮演是最真實的兩條主線

這份報告信息非常多,容我慢慢道來

*十分注意:本報告僅代表經(jīng)由 OpenRouter 的算力調(diào)用

開源 vs 閉源

先說一個數(shù)字
閉源模型,占有約 70% 的 token


開源 vs 閉源比例

在這張圖中,淺藍色是開源(分中國和其他地區(qū)),深藍色是閉源
豎線標注了DeepSeek V3等重要發(fā)布節(jié)點

在過去的一年中,中國的開源崛起,是一大敘事


開源 vs 閉源模型分布

2024 年底,中國開源模型的周用量只有1.2%
到 2025 年底,抬到單周接近30%,全年平均約13%

中國的開源模型,占據(jù)了穩(wěn)定位置

中國模型的崛起

在這份報告中,對于開源模型,列了一個排行


24年11月-25年11月的 OpenRouter 調(diào)用情況

DeepSeek 遙遙領先,14.37 萬億 token。Qwen 第二,5.59 萬億。Meta LLaMA 3.96 萬億,Mistral AI 2.92 萬億

后面還有 OpenAI 的開源系列、Minimax、Z-AI、TNGTech、月之暗面、Google

這里還有一份變化曲線


Top 15 開源模型走勢

早期幾乎是 DeepSeek 雙核壟斷
DeepSeek V3 和 R1 兩條帶子加起來,長期占 OSS 使用的一半以上

從 2025 年夏天開始,市場格局完全變了
Qwen、GLMMoonshotMinimax、GPT-OSS系列迅速抬頭
到 2025 年底,沒有任何單個模型超過 25% 的份額

這是一個從寡頭到多元的轉(zhuǎn)變

模型尺寸:小型退潮,中型起勢

報告把 OSS 按參數(shù)規(guī)模分成三檔

  • ? 小于 15B

  • ? 15–70B

  • ? 大于等于 70B

不同大小模型使用占比

結(jié)論還算明顯:

  • ? 小模型的數(shù)量在持續(xù)增加,但使用占比在下降

  • ? 中模型和大模型的使用占比在提升

中檔市場基本是從Qwen2.5 Coder 32B發(fā)布后被“做”出來的

后面Mistral Small 3、GPT-OSS 20B等一批中型模型,把這個帶變成了一個穩(wěn)定選項


不同大小模型數(shù)量變化

現(xiàn)在的開源市場,大致可以這么看

  • ? 小模型是試驗場

  • ? 中模型是性價比區(qū)

  • ? 大模型是高復雜度區(qū)

開源模型被用于什么

這是一份反直覺的發(fā)現(xiàn),開源模型的使用如下

  • ?第一大場景是角色扮演,占超過 50%

  • ? 編程則是第二,占約 20%

  • ? 其他翻譯、知識問答、教育等都在后面

OSS 模型任務類別趨勢

對此,報告給的解釋是:
開源模型的內(nèi)容過濾更少,可以更自由地用于創(chuàng)意場景,故事續(xù)寫、角色扮演、游戲場景

對于角色扮演,這里的也有個細分


Roleplay 子標簽結(jié)構(gòu)

58% 是 Role-Playing Game 場景
另外有寫作資源、成人相關(guān)內(nèi)容

國產(chǎn)模型:主要是編程

但如果單看中國開源模型,畫面又不一樣了


中國 OSS 任務類別趨勢

Roleplay 仍然是最大類,但只有約33%,編程和技術(shù)合計約39%

這說明一件事
中國模型在開源世界里,更偏技術(shù)生產(chǎn)力使用

編程場景:閉源吃大頭,開源靠中國

報告單獨把 Programming 拎出來看


編程場景,在不同模型源的份額

編程這個品類里,閉源模型(主要是 Claude)還是主力

但開源部分,中國模型則是主流選擇

Roleplay 場景:五五開

同樣方式看 Roleplay
閉源和開源已經(jīng)是可替代關(guān)系


Roleplay場景,在不同模型源的份額 推理模型占一半

都說今年是 Agent 的元年
AI 不再是「給個問題,出個答案」
而是:開始規(guī)劃、調(diào)用工具、多步推理、在長上下文中迭代

報告用四個指標來追蹤這個趨勢

第一,推理模型的用量占比
推理 vs 非推理 token 趨勢

2025 年初,推理模型的用量幾乎可以忽略
現(xiàn)在,這個數(shù)字已經(jīng)超過了 50%

供給側(cè)
GPT-5、Claude 4.5、Gemini 3 這些新模型都強調(diào)多步推理

需求側(cè)
用戶開始偏好能夠管理任務狀態(tài)、執(zhí)行多步邏輯、支持 agent 工作流的模型

下面這個圖,則是頭部推理模型的份額


Top 推理模型 token 份額

之前 Gemini 2.5 Pro 還是第一
然后是 xAI 的 Grok Code Fast 1 領先,Gemini 2.5 Pro 和 Flash 緊隨其后,OpenAI 的 gpt-oss-120b 也在前列

第二,工具調(diào)用的使用率
工具調(diào)用占比

整體趨勢向上,5 月的尖峰是個別大客戶導致的
這意味著更多的請求不只是問答,而是讓模型去執(zhí)行外部操作

讓我們再看看工具的使用


按模型看工具調(diào)用量

最開始主要是gpt-4o-mini 和 Claude 3.5、3.7

到 9 月之后,Claude 4.5 Sonnet 迅速階梯,然后 Grok Code Fast、GLM 4.5 也開始出現(xiàn)

第三,Prompt 長度的增長
Prompt token 數(shù)增長

平均 prompt 長度翻了 4 倍,從約 1,500 token 漲到 6,000+ token


Completion token 數(shù)增長

輸出長度也漲了近 3 倍,從約 150 token 到 400 token


不同類別下 Prompt 長度變化

Prompt 長度的增長主要來自編程類任務。代碼理解、調(diào)試、生成這些任務經(jīng)常需要 20K+ 的輸入 token

第四,整體序列長度
平均序列長度變化

過去 20 個月,平均序列長度漲了 2.7 倍


編程 vs 全體 序列長度

現(xiàn)在的典型請求不再是“寫一段東西”
而是“給你一大堆代碼 / 文檔,你幫我分析、推理、修改”

報告的判斷是:
Agentic Inference 很快就會(如果還沒有的話)超過人類推理的用量

模型任務的使用場景

報告用 GoogleTagClassifier 把請求分成 12 個類別
Programming、Roleplay、Technology、Science、Translation、Health 等

編程是最大的增長品類
編程成為主導類別

2025 年初,編程相關(guān)請求占 token 約 11%
最近幾周,這個數(shù)字已超過 50%

這條線對應的是

  • ? AI 輔助開發(fā)在 IDE 里的深度集成

  • ? 內(nèi)部平臺對 LLM 的接入

  • ? 以及調(diào)試、日志分析、數(shù)據(jù)腳本等長上下文場景

不同提供方在編程類別的份額

在編程盤子里

  • ? Anthropic Claude 長期吃掉超過 60% 的支出

  • ? Google 穩(wěn)在 15% 左右,OpenAI 從 2% 爬到約 8%

  • ? MiniMax 最近幾周明顯抬頭,是增長最快的新玩家

其他品類的內(nèi)部構(gòu)成

報告給了兩張“Top 6 類別”和“Next 6 類別”的子標簽分布


前六大類別的子標簽結(jié)構(gòu)

有幾個點值得留意

Roleplay
約 60% 是 Games/Roleplaying Games
另外有 Writers Resources 和 Adult 的不小占比

Programming
超過三分之二被打在 “Programming/Other” 標簽下
說明它是廣義編程需求,不是單一語言的垂直場景

Translation
幾乎平均分布在語言資源和其他
是一個“工具型”長期需求

Science
80% 是 Machine Learning & AI 自身相關(guān)
典型的“問 AI 關(guān)于 AI”

Health
是所有大類里最分散的
沒有任何一個子標簽超過 25%


次六大類別的子標簽結(jié)構(gòu)

健康是最分散的品類,沒有任何子標簽超過 25%
金融、學術(shù)、法律也都很分散,可能是因為這些領域的 LLM 工作流還不成熟

各家廠商的使用畫像

報告把Anthropic、Google、OpenAI、xAIDeepSeekQwen這幾家抽出來,看它們各自的任務分布


Anthropic 使用結(jié)構(gòu)

Anthropic高度集中在編程和技術(shù)任務。角色扮演和閑聊只是一小部分


Google 使用結(jié)構(gòu)

Google使用分布更均勻。翻譯、科學、技術(shù)、知識問答都有份額。編程占比在 2025 年底降到了 18% 左右


xAI 使用結(jié)構(gòu)

xAI大部分時間 80% 以上是編程。但 11 月突然變了,技術(shù)、角色扮演、學術(shù)都漲起來了。報告推測這和 xAI 通過某些消費應用免費分發(fā)有關(guān),帶來了大量非開發(fā)者用戶


OpenAI 使用結(jié)構(gòu)

OpenAI2025 年初超過一半是科學類任務,到年底降到 15% 以下。編程和技術(shù)各占 29% 左右


DeepSeek 使用結(jié)構(gòu)

DeepSeek角色扮演、閑聊、娛樂占了大頭,經(jīng)常超過 2/3。編程和科學只占一小部分


Qwen 使用結(jié)構(gòu)

Qwen編程長期維持在 40–60% 區(qū)間,Science、Technology、Roleplay 份額波動較大

每個廠商都有自己的定位,沒有誰能通吃所有場景

地理分布

LLM 使用越來越全球化,OpenRouter 的亞洲請求持續(xù)增多

區(qū)域結(jié)構(gòu):亞洲份額翻倍
按地區(qū)的支出占比

亞洲份額從 13% 漲到 31%,翻了一倍多

北美還是最大的,占 47.22%,但已經(jīng)不到一半了。亞洲 28.61%,歐洲 21.32%。大洋洲、南美、非洲加起來不到 3%

按國家看,美國 47.17%,新加坡 9.21%,德國 7.51%,中國 6.01%,韓國 2.88%,荷蘭 2.65%,英國 2.52%,加拿大 1.90%,日本 1.77%,印度 1.62%,其他 60+ 國家合計 16.76%

語言結(jié)構(gòu):英文第一,中文第二

語言分布很直白

  • ? 英語 82.87%

  • ? 簡體中文 4.95%

  • ? 俄語 2.47%

  • ? 西班牙語 1.43%

  • ? 泰語 1.03%

英文仍然是絕對統(tǒng)治地位,但中文已經(jīng)是第二大單語種

需要注意:這個數(shù)據(jù)只代表 OpenRouter 的訪問請求

用戶留存:灰姑娘的玻璃鞋

這是很意思的發(fā)現(xiàn)
早期用戶的留存遠遠好于后來的用戶
他們把這叫做「灰姑娘的玻璃鞋

灰姑娘的玻璃鞋 Cinderella Glass Slipper 當一個新模型發(fā)布時,最早嘗試的那批用戶,如果發(fā)現(xiàn)這個模型剛好能解決他們的問題(「鞋子剛好合腳」),他們就會留下來,而且留存時間非常長

第一個解決用戶真實痛點的模型,會建立起深度、粘性的使用
用戶會圍繞這個模型建立工作流和習慣,切換成本很高

對于模型開發(fā)者和投資人來說,要看的不是增長曲線,而是留存曲線,那些「基礎性群組」的形成

這里先放幾個留存曲線,大家感受下


Claude 4 Sonnet 留存Gemini 2.5 Pro 留存OpenAI GPT-4o Mini 留存DeepSeek R1 留存

對此,讓我們來看看這幾組模型

OpenAI GPT-4o Mini的水晶鞋

2024 年 7 月的曲線明顯高出其他時期
后面所有曲線幾乎都在底部貼著走


OpenAI GPT-4o Mini 留存

如果某個模型在發(fā)布時就抓住了需求
對應的用戶就會成為基礎性群組

后面再進來的用戶
要么已經(jīng)有主力模型
要么只是輕度使用
窗口只有一次,錯過就沒有

Gemini 2.0 Flash沒有水晶鞋

Gemini 2.0 Flash的留存,則非常貼合
每條曲線都差不多
沒有任何一條明顯高出


OpenAI GPT-4o Mini 留存

這是啥意思呢?
這模型來的太遲了,也沒有足夠的性能優(yōu)勢
所以,并不會某個高價值工作負載視為“第一選擇”
它們從一開始就被當作“夠用”的替代品

DeepSeek的先跌后升

DeepSeek V3/R1則比較特殊
留存曲線都出現(xiàn)了「先跌后升」


DeepSeek V3 留存DeepSeek R1 留存

報告把這個叫boomerang effect
就是用戶離開以后又回來
說明對比了其他模型后
確認 DeepSeek 在性能 + 成本 + 特性組合上仍然最合適

就只能說牛逼了

定價與用量:四種關(guān)系

在報告的最后,有這么一張圖
不同模型的定價策略

開源 vs 閉源模型成本 vs 使用

再看提供方視角


模型成本 vs 使用市場圖

對此,就有了四象限分類:效率巨頭高端領導者、長尾高端專家

Efficient giants/效率巨頭
低價高量如 Gemini 2.0 Flash、DeepSeek V3 0324

Premium leaders/高端領導者
高價高量如 Claude 3.7 Sonnet、Claude Sonnet 4

Long tail/長尾
低價低量如 Qwen 2 7B Instruct、IBM Granite 4.0 Micro

Premium specialists/高端專家
極高單價如 GPT-4、GPT-5 Pro

進而的,又多了一些結(jié)論

  • ? 企業(yè)愿意為關(guān)鍵任務付高價,開發(fā)者和愛好者會涌向便宜的模型

  • ? 便宜的模型消耗了更多 token,但不會帶來深度集成

  • ? Claude 和 GPT-4 雖然貴,但用量依然大,因為它們更可靠、信任度更高

  • ? 光便宜沒用:很多接近零成本的開源模型用量也很小

收尾:報告的六個核心結(jié)論

報告最后給了六個判斷

第一,多模型生態(tài)是常態(tài)
沒有誰能通吃,用戶會根據(jù)任務選模型,開發(fā)者沒有忠誠度

第二,使用場景很多元
角色扮演和娛樂用量巨大,不只是生產(chǎn)力工具。

第三,Agentic 推理正在成為主流
單輪問答的時代在過去,多步推理、工具調(diào)用、長上下文迭代,這些才是現(xiàn)在的主戰(zhàn)場

第四,地理格局在去中心化
亞洲份額翻倍,中國既是消費者也是供應商。LLM 必須是全球可用的

第五,價格不是唯一變量
用戶會在質(zhì)量、可靠性、能力廣度之間做權(quán)衡

第六,留存是真正的護城河
第一個解決用戶痛點的模型,會建立深度粘性

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
表演“死亡飛輪” 演員不慎高空墜落;最新情況:送醫(yī)檢查無大礙

表演“死亡飛輪” 演員不慎高空墜落;最新情況:送醫(yī)檢查無大礙

大風新聞
2025-12-27 14:20:11
剛剛!中國醫(yī)藥原黨委書記、董事長被查

剛剛!中國醫(yī)藥原黨委書記、董事長被查

醫(yī)療器械經(jīng)銷商聯(lián)盟
2025-12-27 13:28:01
被排隊斬殺的美國人為什么不反抗?

被排隊斬殺的美國人為什么不反抗?

觀雨大神經(jīng)
2025-12-26 19:55:35
西安某地產(chǎn)集團大暴雷:全員待崗!

西安某地產(chǎn)集團大暴雷:全員待崗!

黯泉
2025-12-26 14:54:00
小米也漲價了!內(nèi)存壓力傳導至手機廠商,業(yè)界稱終端再不漲明年必定虧損

小米也漲價了!內(nèi)存壓力傳導至手機廠商,業(yè)界稱終端再不漲明年必定虧損

澎湃新聞
2025-12-26 20:22:27
全世界在看北京怎么亮劍!針鋒相對扣押運走美國貨輪貨物

全世界在看北京怎么亮劍!針鋒相對扣押運走美國貨輪貨物

柳扶風
2025-12-26 09:08:54
換了車我才悟了:寧可多花點錢,汽車也要堅持4不買!建議收藏!

換了車我才悟了:寧可多花點錢,汽車也要堅持4不買!建議收藏!

藍色海邊
2025-12-27 07:14:15
中方對美連發(fā)“三個停止”警告

中方對美連發(fā)“三個停止”警告

第一財經(jīng)資訊
2025-12-26 18:13:53
美國頁巖油陷阱!廢水回注正在失控,或引發(fā)人類巨大災難

美國頁巖油陷阱!廢水回注正在失控,或引發(fā)人類巨大災難

新浪財經(jīng)
2025-10-07 21:58:33
老了才明白:盡量不要跟身邊任何人,包括你的兒女,分享這5件事

老了才明白:盡量不要跟身邊任何人,包括你的兒女,分享這5件事

朗威談星座
2025-12-25 10:51:58
大同8.5級大地震?最新通報來了!

大同8.5級大地震?最新通報來了!

大同全方位
2025-12-27 15:02:04
“萬稅之國”加拿大被冤枉了?實際稅負比例竟然比中國還要低

“萬稅之國”加拿大被冤枉了?實際稅負比例竟然比中國還要低

回旋鏢
2025-12-27 13:46:40
中國航發(fā)集團原董事長曹建國已從中國工程院院士名單中撤下

中國航發(fā)集團原董事長曹建國已從中國工程院院士名單中撤下

澎湃新聞
2025-12-27 09:54:26
把副省長文國棟拉下馬的環(huán)保案件,賠償了50億

把副省長文國棟拉下馬的環(huán)保案件,賠償了50億

極目新聞
2025-12-26 22:46:14
打虎!郭學益被查

打虎!郭學益被查

新京報政事兒
2025-12-27 10:47:31
爆料!徐湖平添“新案”:借他人收藏品丟失,拿南博明代畫抵償

爆料!徐湖平添“新案”:借他人收藏品丟失,拿南博明代畫抵償

娜烏和西卡
2025-12-27 10:38:23
格力市場總監(jiān)朱磊曬工廠圖:銅管堆成山!堅決不用鋁代銅

格力市場總監(jiān)朱磊曬工廠圖:銅管堆成山!堅決不用鋁代銅

快科技
2025-12-26 17:57:08
姜昆唱歌視頻拍攝者發(fā)聲,是在洛杉磯拍攝,時間是2025年12月19日

姜昆唱歌視頻拍攝者發(fā)聲,是在洛杉磯拍攝,時間是2025年12月19日

阿纂看事
2025-12-27 09:55:58
彈劾賴清德,結(jié)局會如何?

彈劾賴清德,結(jié)局會如何?

新民周刊
2025-12-27 09:15:57
湖北調(diào)整全省最低工資標準

湖北調(diào)整全省最低工資標準

荊頭條
2025-12-27 13:25:34
2025-12-27 17:04:49
賽博禪心
賽博禪心
拜AI古佛,修賽博禪心
225文章數(shù) 12關(guān)注度
往期回顧 全部

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

頭條要聞

男子戒毒后隨領導出差被警察帶走驗尿 回家后工作沒了

頭條要聞

男子戒毒后隨領導出差被警察帶走驗尿 回家后工作沒了

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

張昊唯逃稅涉黃風波落幕:法院認定朋友造謠

財經(jīng)要聞

注意,開始拉物價了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

健康
游戲
親子
藝術(shù)
家居

這些新療法,讓化療不再那么痛苦

索尼被騎臉!獨占神作被抄襲 PS商店竟然給過審了

親子要聞

父母為了孩子連夜驅(qū)車趕來武漢,為了方便換藥在武漢租房等待

藝術(shù)要聞

砸50億!廣東驚現(xiàn)“全球最大爛尾醫(yī)院”,連窗框都沒裝完

家居要聞

格調(diào)時尚 智慧品質(zhì)居所

無障礙瀏覽 進入關(guān)懷版