国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

中美AI價(jià)差60倍,中國(guó)模型周調(diào)用量8.7萬(wàn)億暴漲7倍

0
分享至



截至2026年4月3日當(dāng)周,該平臺(tái)調(diào)用量排名前十的模型中,有6個(gè)來(lái)自中國(guó)。按調(diào)用量從高到低依次為:小米MiMo-V2-Pro、階躍星辰Step3.5Flash、MiniMaxM2.7、DeepSeekV3.2、智譜GLM5Turbo和MiniMaxM2.5。其中,小米MiMo-V2-Pro以4.82萬(wàn)億Token(詞元)位居全平臺(tái)第一。

事實(shí)上,自2026年2月9日至15日,當(dāng)周中國(guó)模型調(diào)用量首次超過(guò)美國(guó)以來(lái),中國(guó)模型的領(lǐng)先已持續(xù)近兩個(gè)月。

OpenRouter平臺(tái)匯聚了超過(guò)400個(gè)AI模型,覆蓋60多家供應(yīng)商,其調(diào)用量的數(shù)據(jù)被視為觀察全球開發(fā)者模型選擇偏好的窗口之一。開發(fā)者可通過(guò)同一APIKey(一種用于驗(yàn)證身份和調(diào)用服務(wù)的密鑰)在不同模型間隨時(shí)切換。

OpenRouter聯(lián)合創(chuàng)始人兼 COOChrisClark在2026年2月公開表示,中國(guó)開源模型在美國(guó)企業(yè)運(yùn)行的Agent(智能體)工作流中占比“不成比例的高”。同時(shí),開發(fā)者社區(qū)中圍繞模型間任務(wù)分配與成本優(yōu)化的討論也日益增多。

有觀點(diǎn)將這一現(xiàn)象與30年前的中國(guó)制造業(yè)類比:當(dāng)時(shí)中國(guó)憑借成本優(yōu)勢(shì)切入全球電子產(chǎn)業(yè)鏈的組裝環(huán)節(jié),產(chǎn)生了富士康、立訊精密等代工企業(yè);如今,中國(guó)大模型也正以價(jià)格優(yōu)勢(shì)切入全球AI產(chǎn)業(yè)鏈的執(zhí)行環(huán)節(jié)。也有觀點(diǎn)將國(guó)產(chǎn)大模型視為“AI時(shí)代的富士康”。

國(guó)產(chǎn)大模型在AI產(chǎn)業(yè)鏈中扮演何種角色?該角色的含金量究竟有多高?

價(jià)格優(yōu)勢(shì)

經(jīng)濟(jì)觀察報(bào)記者梳理各廠商截至2026年3月底的官方API定價(jià)發(fā)現(xiàn),中美主流大模型的價(jià)格存在巨大差距。

以輸入價(jià)格為例,中國(guó)模型中,DeepSeekV3.2為每百萬(wàn)Token0.28美元,MiniMaxM2.5為0.3美元,月之暗面KimiK2.5為0.42美元。美國(guó)模型中,An-thropicClaudeOpus4.6為5美元,OpenAIGPT-5.4為2.50美元。美國(guó)主流模型的輸入價(jià)格約為中國(guó)主流模型的10至20倍。

輸出價(jià)格差距更為明顯。中國(guó)模型方面,DeepSeekV3.2為每百萬(wàn)Token0.42美元,MiniMaxM2.5為1.1美元,月之暗面KimiK2.5為2.2美元。美國(guó)模型方面,OpenAIGPT-5.4為15美元,ClaudeOpus4.6為25美元。中美主流模型輸出價(jià)格差距約為7倍至60倍。

上述價(jià)差一直存在,此前未引發(fā)大規(guī)模用戶遷移,原因很簡(jiǎn)單,大多數(shù)人用AI的主要場(chǎng)景就是聊天,Token消耗量較低,價(jià)差影響甚微。

但2026年初,一只“龍蝦”的出現(xiàn)改變了這一切。

在這種工作模式下,Token消耗量與聊天場(chǎng)景不在一個(gè)量級(jí)。

比如,一個(gè)編程任務(wù)可能需要經(jīng)歷幾十輪“寫代碼—運(yùn)行—報(bào)錯(cuò)—修改—再運(yùn)行”的循環(huán),每一輪都是一次完整的模型調(diào)用。為了讓智能體記住此前的操作,每次調(diào)用還需要調(diào)用對(duì)話歷史。

以O(shè)penClaw為代表的智能體應(yīng)用推高了整個(gè)平臺(tái)Token消耗量。比如,2025年3月3日至9日當(dāng)周,OpenRouter前十大模型周調(diào)用量總計(jì)1.24萬(wàn)億Token。至2026年2月16日至22日當(dāng)周,僅前十大模型周調(diào)用量就超過(guò)了8.7萬(wàn)億Token,增長(zhǎng)近7倍。編程任務(wù)在平臺(tái)Token消耗中的占比也從2025年初的11%升至2025年底的50%以上。

當(dāng)單次任務(wù)Token消耗從幾千增至幾十萬(wàn),中美模型間的價(jià)格差距從可忽略的成本轉(zhuǎn)變?yōu)槊吭聰?shù)百甚至上千美元的顯著差異。

2026年2月19日前后,美國(guó)大模型公司Anthropic更新服務(wù)條款,禁止用戶將Claude訂閱賬號(hào)憑證接入OpenClaw等第三方工具,要求通過(guò)API按量計(jì)費(fèi)。隨后Google也推出類似限制。對(duì)于每天需頻繁調(diào)用API的智能體應(yīng)用,模型選擇中的價(jià)格因素成為繞不過(guò)去的問(wèn)題,開發(fā)者被推上了按量付費(fèi)的賽道。

在智能體核心的編程場(chǎng)景上,中美模型能力已較為接近。

SWE-BenchVerified是由普林斯頓大學(xué)研究團(tuán)隊(duì)維護(hù)的一項(xiàng)編程能力公開評(píng)測(cè),做法是讓AI模型去修復(fù)GitHub(全球最大的開源代碼托管平臺(tái))上真實(shí)的代碼問(wèn)題。根據(jù)該評(píng)測(cè)公開排行榜的數(shù)據(jù),2026年2月13日發(fā)布的中國(guó)模型MiniMaxM2.5拿到了80.2%,2月5日發(fā)布的美國(guó)模型 ClaudeOpus4.6為80.8%,兩者差距只有0.6個(gè)百分點(diǎn)。

在能力相近而價(jià)格懸殊的情況下,開發(fā)者的選擇迅速反映在了數(shù)據(jù)上。

2026年2月9日至15日當(dāng)周,中國(guó)模型Token調(diào)用量達(dá)4.12萬(wàn)億,首次超過(guò)美國(guó)模型的2.94萬(wàn)億。隨后一周,中國(guó)模型調(diào)用量升至5.16萬(wàn)億,三周時(shí)間增長(zhǎng)127%。同期美國(guó)模型調(diào)用量降至2.7萬(wàn)億。

中國(guó)大模型為什么能比美國(guó)大模型便宜這么多?

工信部信息通信經(jīng)濟(jì)專家委員會(huì)委員盤和林向經(jīng)濟(jì)觀察報(bào)表示,原因主要有兩點(diǎn):一是中國(guó)算力基礎(chǔ)設(shè)施規(guī)模大、復(fù)用率高,報(bào)價(jià)較低;二是中國(guó)算力集群中存在大量自建算力,獲取成本低于海外。

此外,技術(shù)路線也影響成本。有業(yè)內(nèi)人士告訴記者,目前主流中國(guó)大模型普遍采用MoE架構(gòu),也稱為“混合專家模型”。通俗地說(shuō),一個(gè)MoE模型雖然參數(shù)總量很大,但每次運(yùn)行時(shí)只激活其中一小部分參數(shù)來(lái)處理任務(wù),而不是全體參數(shù),這大幅降低了每次推理所需的計(jì)算量。

不同路徑

硅谷風(fēng)投機(jī)構(gòu) a16z合伙人MartinCasado在2025年底表示,在使用開源技術(shù)棧的AI初創(chuàng)公司中,約80%的公司使用中國(guó)模型。他隨后在社交平臺(tái)上補(bǔ)充說(shuō)明,這并非指80%的美國(guó)AI初創(chuàng)公司都在使用中國(guó)模型,而是那些選擇開源技術(shù)路線的公司中(約占全部美國(guó)AI初創(chuàng)公司的20%至30%),約80%使用了中國(guó)模型。

記者注意到,GitHub上已出現(xiàn)多個(gè)幫助開發(fā)者在不同模型間優(yōu)化成本的開源工具。其思路多為將任務(wù)按難度分級(jí),簡(jiǎn)單任務(wù)交由免費(fèi)或低價(jià)的中國(guó)模型處理,復(fù)雜任務(wù)再調(diào)用高價(jià)美國(guó)模型。

這種模式能夠成立的前提是中國(guó)模型在執(zhí)行類任務(wù)上能力足夠。在編程方面,前面提到的SWE-Bench數(shù)據(jù)已經(jīng)說(shuō)明了這一點(diǎn)。而在編程之外,中美大模型整體能力差距有多大呢?

LMSYSChatbotArena是目前全球公認(rèn)度最高的AI模型評(píng)測(cè)平臺(tái)之一,其做法是讓真人用戶在不知道模型名字的情況下同時(shí)試用兩個(gè)模型,然后投票選出更好的那個(gè),相當(dāng)于一場(chǎng)AI之間的盲品測(cè)試。

在其截至2026年3月25日的綜合排名中,前五名均為美國(guó)公司模型,中國(guó)模型中排名最高的DeepSeekV3.2Speciale位列第六。在專門測(cè)試復(fù)雜推理能力的HardPrompts(高難度提示詞,專門用于測(cè)試模型處理復(fù)雜推理和多步邏輯任務(wù)的能力)類別中,中美模型的差距更為明顯,第一梯隊(duì)仍主要為美國(guó)模型。

編程能力接近、復(fù)雜推理尚有差距,這是當(dāng)下中美大模型之間差異化能力的體現(xiàn),也是“分層調(diào)用”這套做法成立的基礎(chǔ)。

不過(guò),和30年前被鎖在低利潤(rùn)率的代工廠商不同,中國(guó)大模型廠商在價(jià)格上并沒有一直往下走。

事實(shí)上,從2024年開始,中國(guó)大模型行業(yè)曾發(fā)生過(guò)一輪價(jià)格戰(zhàn):2024年5月,字節(jié)跳動(dòng)旗下火山引擎豆包大模型以0.0008元/千Token的價(jià)格引發(fā)“價(jià)格戰(zhàn)”,阿里云、百度智能云相繼跟進(jìn)。此后近一年,行業(yè)經(jīng)歷Token價(jià)格下降超過(guò)90%的階段,部分廠商推理算力毛利率一度為負(fù)。

廠商當(dāng)時(shí)的策略是以虧損換取規(guī)模,培養(yǎng)用戶調(diào)用習(xí)慣。2026年2月OpenClaw走紅后,Token消耗量增速遠(yuǎn)超預(yù)期,算力供給趨緊。

智譜最先做出反應(yīng),2026年2月12日發(fā)布新模型GLM-5時(shí)上調(diào)API定價(jià),3月16日發(fā)布GLM-5-Turbo時(shí)再次提價(jià),兩輪累計(jì)漲幅83%。

智譜CEO張鵬在2025年度業(yè)績(jī)說(shuō)明會(huì)上表示,2026年一季度API調(diào)用定價(jià)提升83%,調(diào)用量增長(zhǎng)400%。根據(jù)年報(bào),智譜2025年全年收入 7.243億元,同比增長(zhǎng)132%,MaaS(模型即服務(wù))平臺(tái)年度經(jīng)常性收入約為17億元,12個(gè)月增長(zhǎng)60倍。

選擇漲價(jià)的不只智譜一家。2026年3月13日,騰訊云調(diào)整了混元系列大模型定價(jià),部分模型漲幅超460%。3月18日,阿里云與百度智能云同日發(fā)布調(diào)價(jià)公告,AI算力相關(guān)產(chǎn)品漲幅在5%至34%之間,新價(jià)格于4月18日生效。

中科曙光高級(jí)副總裁李斌在接受經(jīng)濟(jì)觀察報(bào)采訪時(shí)稱,算力系統(tǒng)評(píng)價(jià)指標(biāo)正在發(fā)生改變,過(guò)去衡量一個(gè)系統(tǒng)的標(biāo)準(zhǔn)是看它有多少算力,現(xiàn)在則要看它能夠多么經(jīng)濟(jì)地產(chǎn)出Token。

從集體降價(jià)到集體漲價(jià),轉(zhuǎn)變只用了不到兩年。

2026年3月,國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏在中國(guó)發(fā)展高層論壇上公布了一組數(shù)字:中國(guó)日均Token調(diào)用量已突破140萬(wàn)億,較兩年前增長(zhǎng)超過(guò)1000倍。

在同月的GTC大會(huì)上,英偉達(dá)創(chuàng)始人黃仁勛稱,Token將是未來(lái)數(shù)字世界最核心的大宗商品。

30年前的消費(fèi)電子代工產(chǎn)業(yè)有一個(gè)特點(diǎn),組裝環(huán)節(jié)的利潤(rùn)率被上游品牌商牢牢壓住,不少頭部的代工廠發(fā)展至今的毛利率都沒有超過(guò)10%。成本優(yōu)勢(shì)帶來(lái)了訂單,但未能帶來(lái)定價(jià)權(quán)。

當(dāng)前,中國(guó)大模型的處境看起來(lái)與當(dāng)年的消費(fèi)電子代工產(chǎn)業(yè)有幾分相似,但在定價(jià)權(quán)方面似乎又頗有不同。例如,智譜漲價(jià)83%之后,調(diào)用量增長(zhǎng)了400%。阿里云、百度智能云、騰訊云在2026年3月集體上調(diào)了AI算力和模型服務(wù)的價(jià)格,需求并沒有萎縮,調(diào)用量在持續(xù)增長(zhǎng)。

在SWE-Bench編程評(píng)測(cè)上,頭部中國(guó)模型和頭部美國(guó)模型的差距已經(jīng)縮小到不足1個(gè)百分點(diǎn)。兩者在復(fù)雜推理上的差距還在,但這個(gè)差距也在快速收窄。

此次,中國(guó)大模型廠商的發(fā)展路徑似乎有所不同。

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
楊某媛辭職了!而且社交媒體賬號(hào)也被注銷……

楊某媛辭職了!而且社交媒體賬號(hào)也被注銷……

麥杰遜
2026-04-16 12:04:33
江蘇最新癌情發(fā)布!需警惕這幾種癌

江蘇最新癌情發(fā)布!需警惕這幾種癌

句容發(fā)布
2026-04-16 09:15:07
蘇林從北京乘高鐵南下,12小時(shí)的車程,他一路上笑臉盈盈充滿好奇

蘇林從北京乘高鐵南下,12小時(shí)的車程,他一路上笑臉盈盈充滿好奇

知法而形
2026-04-16 15:10:45
港獨(dú)、罵中國(guó)人,如今卻還想來(lái)內(nèi)地?fù)平?,這3位香港明星令人作嘔

港獨(dú)、罵中國(guó)人,如今卻還想來(lái)內(nèi)地?fù)平?,這3位香港明星令人作嘔

驕陽(yáng)之夏明
2026-04-15 16:44:42
71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

月滿大江流
2026-04-16 13:54:38
老照片太刺眼:王寶強(qiáng)當(dāng)年真沒察覺嗎

老照片太刺眼:王寶強(qiáng)當(dāng)年真沒察覺嗎

草莓解說(shuō)體育
2026-04-16 20:07:54
山東淄博一化工廠發(fā)生火情,未致人員傷亡

山東淄博一化工廠發(fā)生火情,未致人員傷亡

界面新聞
2026-04-16 22:05:10
咖啡再次被關(guān)注!醫(yī)生發(fā)現(xiàn):高血脂患者常喝咖啡,或出現(xiàn)這些變化

咖啡再次被關(guān)注!醫(yī)生發(fā)現(xiàn):高血脂患者常喝咖啡,或出現(xiàn)這些變化

岐黃傳人孫大夫
2026-04-16 16:30:03
鴻山寺方丈法云法師去世,終年61歲,3天前還好好的,弟子曝原因

鴻山寺方丈法云法師去世,終年61歲,3天前還好好的,弟子曝原因

180視角
2026-04-16 11:34:36
陪玩陪睡已淘汰!繼關(guān)曉彤風(fēng)波、注射不明物后,娛樂圈再曝潛規(guī)則

陪玩陪睡已淘汰!繼關(guān)曉彤風(fēng)波、注射不明物后,娛樂圈再曝潛規(guī)則

阿纂看事
2026-04-16 19:31:39
普京:俄羅斯經(jīng)濟(jì)連續(xù)兩個(gè)月負(fù)增長(zhǎng)

普京:俄羅斯經(jīng)濟(jì)連續(xù)兩個(gè)月負(fù)增長(zhǎng)

看看新聞Knews
2026-04-16 11:40:07
烏克蘭4年獲捐35.8億美元,都花在了哪里?

烏克蘭4年獲捐35.8億美元,都花在了哪里?

網(wǎng)易新聞出品
2026-04-16 15:44:52
現(xiàn)場(chǎng)簽約!越南對(duì)華作出保證,蘇林坐上離京高鐵,臨走前獻(xiàn)出重禮

現(xiàn)場(chǎng)簽約!越南對(duì)華作出保證,蘇林坐上離京高鐵,臨走前獻(xiàn)出重禮

好賢觀史記
2026-04-16 16:46:18
外媒傳出重磅消息,巴基斯坦2年后 接收五代機(jī):不是中國(guó)的殲35!

外媒傳出重磅消息,巴基斯坦2年后 接收五代機(jī):不是中國(guó)的殲35!

軍機(jī)Talk
2026-04-16 17:13:39
牛肉頂多注個(gè)水豬肉頂多催個(gè)肥,唯有三文魚全程cosplay

牛肉頂多注個(gè)水豬肉頂多催個(gè)肥,唯有三文魚全程cosplay

富貴說(shuō)
2026-04-14 23:15:09
男子因噪音過(guò)敏住5年隔音艙:自己設(shè)計(jì),已接上百個(gè)訂單,幫噪音受困者找回睡眠

男子因噪音過(guò)敏住5年隔音艙:自己設(shè)計(jì),已接上百個(gè)訂單,幫噪音受困者找回睡眠

半島官網(wǎng)
2026-04-16 11:20:50
匈牙利撤軍:人還沒走,茶就涼了

匈牙利撤軍:人還沒走,茶就涼了

寰宇大觀察
2026-04-16 17:20:43
你封海峽,我撤6000億!沙特這回是真掀桌子了

你封海峽,我撤6000億!沙特這回是真掀桌子了

李榮茂
2026-04-16 19:29:23
云南白藥在國(guó)內(nèi)配方保密,卻在美國(guó)公布成分,被規(guī)定為寵物用藥

云南白藥在國(guó)內(nèi)配方保密,卻在美國(guó)公布成分,被規(guī)定為寵物用藥

深度報(bào)
2026-04-16 22:55:43
蘋果首次成為全球手機(jī)市場(chǎng)第一!份額21%,三星20%,這回是真的了

蘋果首次成為全球手機(jī)市場(chǎng)第一!份額21%,三星20%,這回是真的了

數(shù)碼Antenna
2026-04-16 11:52:53
2026-04-17 01:19:00
青杍無(wú)夢(mèng)
青杍無(wú)夢(mèng)
灑脫一笑,世界皆治愈
698文章數(shù) 59關(guān)注度
往期回顧 全部

科技要聞

趙明:智駕之戰(zhàn),看誰(shuí)在大模型上更高效

頭條要聞

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

頭條要聞

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財(cái)經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰(shuí)的生意?

汽車要聞

空間大五個(gè)乘客都滿意?體驗(yàn)嵐圖泰山X8

態(tài)度原創(chuàng)

房產(chǎn)
游戲
教育
旅游
藝術(shù)

房產(chǎn)要聞

人人人人!封關(guān)后首屆消博會(huì),擠爆了!

《荒野大鏢客3》最全新情報(bào)!前傳還是新故事?

教育要聞

985學(xué)院官宣!學(xué)碩,停招

旅游要聞

社評(píng):讀懂“China Travel”持續(xù)圈粉的邏輯

藝術(shù)要聞

你絕對(duì)想不到!這幅油畫背后的美麗故事!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版