国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

誰在消耗5萬億模型算力?

0
分享至


經(jīng)濟觀察報記者 鄭晨燁

2026年2月9日至2月15日,在線人工智能托管平臺OpenRouter發(fā)布了一組數(shù)據(jù):中國大模型的單周調用量達到4.12萬億Token,歷史上首次超過美國模型的2.94萬億Token。

OpenRouter是一個聚合全球大模型接口的平臺,被稱為人工智能界的“超級接口”。開發(fā)者不需要逐一去注冊大模型公司的賬號,只需通過該平臺的統(tǒng)一接口,就能自由調用全球各家公司推出的各類模型,因此,該平臺的使用量數(shù)據(jù)通常被視為全球大模型受歡迎程度和真實應用強度的風向標。

緊接著的2月16日至2月22日這一周,中國大模型的周調用量進一步?jīng)_高至5.16萬億Token,三周內增長了127%,在當周全球大模型周調用量排名前五的榜單中,MiniMax M2.5、月之暗面Kimi K2.5、智譜GLM-5與深度求索DeepSeek V3.2占據(jù)了四個席位。

根據(jù)官方用戶數(shù)據(jù),在OpenRouter平臺近47.17%的用戶來自美國、中國開發(fā)者僅占6.01%的背景下,這組數(shù)據(jù)反映出海外開發(fā)者對中國模型的使用意愿正在快速上升。

Token是人工智能處理語言的基本單元。在算力市場中,Token調用量是衡量大模型使用強度、商業(yè)價值與滲透深度的核心指標,海外開發(fā)者對中國模型的高頻調用,標志著人工智能產(chǎn)業(yè)的重心正在發(fā)生轉移,行業(yè)不再單純比拼構建大模型時的“一次性訓練成本”,而是進入了高頻度、常態(tài)化的“應用推理”階段。

應用重心的遷移直接導致了下游采購標準的轉向,國產(chǎn)AI芯片廠商也由此獲得了加快進入市場的機會。

五萬億Token流向了哪里

要厘清這五萬億Token的去向,首先需要觀察用戶使用人工智能的方式發(fā)生了什么變化。

根據(jù)OpenRouter與風險投資機構a16z聯(lián)合發(fā)布的《2025 AI使用報告》,該平臺處理的編程任務Token占比已從2025年初的11%增加到了50%以上,成為最大的單一使用品類。這一轉變背后,是人工智能應用模式從“問答式”向“智能體(Agent)”模式的切換。

在早期的問答模式下,用戶提一個問題,模型給出一個回答,單次交互消耗的Token通常在幾百到幾千個之間。一旦用戶停止提問,消耗也就隨之停止。但進入智能體模式后,人工智能開始在后臺持續(xù)執(zhí)行多步驟任務。

上海一家算力芯片廠商的負責人告訴記者,以編程場景為例,一個智能體在接收到指令后,會經(jīng)歷編寫代碼、運行測試、識別報錯、自我修正、再次運行的循環(huán),為了讓機器記住此前的操作,每次調用都需要攜帶完整的對話歷史。

比如,目前國產(chǎn)大模型諸如智譜GLM-5等新一代模型已經(jīng)支持200K(約20萬Token)的超長上下文窗口。這種多輪自我修正和工具鏈級聯(lián)的模式,使得單次活躍會話的Token吞吐量呈幾何級數(shù)增長。

另外,多模態(tài)應用的落地則進一步推高了消耗量。根據(jù)公開數(shù)據(jù),年初爆火的Seedance 2.0視頻模型生成一條10秒、1080p規(guī)格的視頻,大約需要消耗35萬Token。

視頻生成場景單位時間內產(chǎn)生的Token消耗,是傳統(tǒng)文本問答的數(shù)百倍。

“當前數(shù)萬億Token級別的調用量,已不再主要由測試性場景構成,而是由一批高頻、規(guī)模化、可持續(xù)付費的商業(yè)應用所支撐。”弗若斯特沙利文(Frost & Sullivan)中國業(yè)務主管合伙人兼董事總經(jīng)理陸景向經(jīng)濟觀察報記者表示。

陸景介紹,從頭豹研究院對國內大模型商業(yè)生態(tài)的調研來看,目前集中買單的領域主要包括互聯(lián)網(wǎng)、金融、跨境電商與娛樂行業(yè)。

具體場景則涵蓋了以下三類:第一類是企業(yè)級應用,如智能客服、智能營銷、代碼輔助開發(fā)、辦公自動化工具等,這類應用在金融、電商、游戲行業(yè)已實現(xiàn)規(guī)?;渴穑坏诙愂腔ヂ?lián)網(wǎng)平臺中的生成式內容服務,包括智能搜索、對話式助手與虛擬角色;第三類是AIGC(人工智能生成內容)生產(chǎn)工具,如短視頻腳本生成、廣告文案創(chuàng)作、跨境電商商品描述生成等。

這些行業(yè)的共同特征是,業(yè)務流程中存在高比例的文本或多模態(tài)內容生成需求,且企業(yè)能夠承接大模型服務產(chǎn)生的算力成本。

2026年2月10日,在鄭州舉行的“國產(chǎn)萬卡算力賦能大模型發(fā)展研討會”上,中國科學院自動化所研究員陳盈盈表示,驅動行業(yè)發(fā)展的核心動力依然是大算力、大數(shù)據(jù)與大參數(shù)。但隨著模型參數(shù)量增長帶來的性能提升進入瓶頸期,行業(yè)正邁向智能體、合成數(shù)據(jù)和推理計算,數(shù)據(jù)決定了人工智能的高度,環(huán)境將決定模型演進的方向。

應用模式的改變,解釋了調用量為何飆升,那為何國產(chǎn)大模型又能在新的范式下,承接住來自全球高頻的調用需求呢?

前述算力芯片廠商負責人告訴記者,目前,MiniMax M2.5、Kimi K2.5等國產(chǎn)模型普遍采用了“混合專家(MoE)”架構。與傳統(tǒng)的稠密模型(Dense Model)在每次運算時都要激活全部參數(shù)不同,MoE架構通過按需激活特定的專家網(wǎng)絡,使推理時的顯存占用降低了約60%,吞吐量得到顯著提升。

稠密模型的設計邏輯是,處理每一個輸入請求時,神經(jīng)網(wǎng)絡中的每一個參數(shù)都必須參與計算。這意味著隨著模型規(guī)模的增大,所需的算力與顯存開銷會同步呈線性增長。

混合專家架構則改變了這種全量運算的模式,它將模型參數(shù)劃分為多個功能組,即“專家”,在執(zhí)行具體任務時,路由系統(tǒng)會識別需求并只激活與之相關的部分參數(shù)。這種分工機制使得模型可以在保持巨大參數(shù)量的同時,大幅降低單次推理所需的有效算力。

技術上的優(yōu)化直接反映在了售價上。目前中國模型的輸入價格約為0.3美元/百萬Token,而部分海外同類產(chǎn)品的價格在5美元左右。此外,電力成本也是一個變量,中國西部算力節(jié)點的電力成本約為每度0.2元至0.3元,而歐美地區(qū)的成本在1元至1.5元之間。

這種成本優(yōu)勢促成了供需關系的再平衡。2026年春節(jié)期間,國產(chǎn)大模型迎來密集發(fā)布潮。2月11日,智譜上線底座模型GLM-5;2月12日,MiniMax開源文本模型M2.5;2月14日,字節(jié)跳動發(fā)布豆包大模型2.0系列,與此同時,大廠圍繞AI應用的紅包戰(zhàn)同步打響:百度投入5億元,騰訊元寶10億元,阿里推出30億元免單計劃。

密集的應用落地也拉動了算力消耗的急劇攀升。公開數(shù)據(jù)顯示,中國日均Token消耗從2024年初的1000億攀升至2026年2月的180萬億級別,在這種爆發(fā)式的需求驅動下,此前深陷價格戰(zhàn)的國內大模型廠商開始集體調頭。

比如,2026年2月12日,智譜AI在發(fā)布新模型的同時,宣布上調其API(應用程序編程接口)調用價格,部分海外訂閱價格漲幅達到30%至60%,API調用價格漲幅最高達到100%。智譜對此回應稱,用戶規(guī)模與調用量快速提升,公司需同步加大算力投入。另外,月之暗面旗下的Kimi K2.5發(fā)布不到一個月,其海外收入便超過了國內收入。

也就是說,大模型公司正在告別虧本引流的價格戰(zhàn),開始有了實打實的業(yè)務收入。五萬億Token的流向表明,人工智能正在從單純的對話框,轉變?yōu)榻鹑?、電商與編程場景中在后臺自動運轉的工業(yè)流程。

而順著這股成倍增長的數(shù)據(jù)流往上游看,那些承載運算任務的智算中心,挑選算力硬件的眼光也發(fā)生了變化。

算力采購的標準變了

算力市場的核心指標正在從搶奪計算卡轉向核算單位產(chǎn)出成本。

2025年,中國GPU算力租賃市場經(jīng)歷了價格下調。比如,英偉達H100計算卡的租賃價格從高峰時的每小時90多元人民幣,跌至15元到20元;A100的價格則降至每小時3元到5元。

這種價格走勢背后是采購邏輯的更替。在大模型開發(fā)初期,由于高性能芯片稀缺,市場處于資源囤積階段,追求的是單卡的算力峰值(FLOPS)。但當推理負載成為常態(tài)后,企業(yè)開始核算總擁有成本(TCO)。

“客戶不再只盯著單卡的絕對算力峰值,而是開始計算每投入一元錢能換取多少吞吐量,每消耗一瓦電能處理多少Token?!鼻笆鏊懔π酒瑥S商負責人向經(jīng)濟觀察報記者表示。

該負責人認為,當前的算力需求呈現(xiàn)出推理與渲染的雙重特征。除了文本生成,AI智能體云底座、云手機、數(shù)字孿生及工業(yè)仿真等場景對實時交互的需求,正在拉動對全功能GPU的采購。進入推理階段之后,國產(chǎn)芯片迎來了切入窗口——訓練階段行業(yè)高度依賴英偉達的CUDA生態(tài),而推理任務則更聚焦于能耗、穩(wěn)定性和供應安全。

TrendForce集邦咨詢分析師龔明德在回復經(jīng)濟觀察報記者采訪時亦預計,2026年推理型AI服務器在整體出貨結構中的比重有望提升至44%,相較于2025年上升3個百分點。

龔明德認為,相比追求算力密度的大模型訓練集群,推理型服務器在底層硬件架構設計上更注重性價比和能效比,推理端對高端封裝(如CoWoS)和高帶寬內存(HBM)的嚴苛要求有所下調。

在龔明德看來,這種規(guī)格的放寬,有利于中國本土企業(yè)在取得HBM受限的情況下,發(fā)展中等規(guī)模算力的推理芯片,并在互聯(lián)網(wǎng)、車載系統(tǒng)等領域提供機會。

隨著行業(yè)重心轉向推理和微調,企業(yè)客戶在規(guī)劃智算中心預算時,投入結構也發(fā)生了改變。

對此,陸景分析稱,過去在訓練階段,投入主要集中在高端訓練型GPU集群、超高速互聯(lián)網(wǎng)絡以及高性能存儲系統(tǒng),以滿足長時間、高并行度的訓練需求。而在推理需求增長的背景下,企業(yè)開始更多采用推理優(yōu)化型GPU、國產(chǎn)AI芯片或異構算力組合。在投入結構中,軟件平臺、算力調度、模型優(yōu)化工具以及推理加速框架的占比逐步提升。

陸景認為,國內人工智能芯片在底層軟件生態(tài)建設方面,正處于由可用向規(guī)?;逃眠^渡的階段,主要國產(chǎn)芯片廠商已構建起包括驅動層、編譯器、算子庫、運行時環(huán)境在內的基礎工具鏈體系,能夠支持大模型訓練、推理及智算中心部署。

目前的算力采購也已經(jīng)從單卡送測進入了系統(tǒng)級工程交付階段。由于推理任務對響應延遲極其敏感,萬卡規(guī)模的集群在協(xié)同工作中,網(wǎng)絡通信和散熱能力往往比單張計算卡的“跑分”更具決定性。

2026年2月5日,國家超算互聯(lián)網(wǎng)鄭州核心節(jié)點正式上線試運行。在這個節(jié)點上,部署了3套由中科曙光(603019.SH)提供的scaleX萬卡超集群,最大可提供超過3萬張國產(chǎn)加速卡的算力,這是全國首個實現(xiàn)3萬卡部署且實際投入運營的國產(chǎn)AI算力池。

中科曙光高級副總裁李斌告訴經(jīng)濟觀察報記者,鄭州核心節(jié)點的上線,驗證了國產(chǎn)算力基礎設施的工程化能力,行業(yè)已從早期的單點突破,轉向大規(guī)模落地部署。此前各家廠商在硬件設計、軟件棧和互連協(xié)議上自成體系,導致算力資源難以跨平臺調度。

“萬卡集群的落地不僅是IT技術問題,更是冷卻、供電等跨學科的工程化挑戰(zhàn)。”李斌強調,如果單點技術出現(xiàn)短板,會直接拖累整個系統(tǒng)的效率,目前的系統(tǒng)研制突破了傳統(tǒng)IT技術與其他工程技術的結合瓶頸。

目前,該國產(chǎn)算力系統(tǒng)已完成了千款應用的適配。根據(jù)國家超算互聯(lián)網(wǎng)鄭州核心節(jié)點運維主任安磊的介紹,超算互聯(lián)網(wǎng)第一期已有645家第三方商家適配了該節(jié)點,超過7200款軟件和源碼接入。

在這些資源的支持下,已有超過70%的國產(chǎn)新能源汽車在該平臺上進行流體和碰撞仿真實驗,例如,針對國家新出臺的規(guī)范可能要求禁用新能源車隱藏把手的變化,車企需要利用大集群模擬門把手改為開放式后對能效與風阻的影響。

此外,該集群還支撐了國產(chǎn)羽絨服頂級面料的研發(fā),以及為國際奢侈品品牌提供智算資源支持其在國內的優(yōu)化設計。

這種由下游應用爆發(fā)倒逼上游基建升級的邏輯,也正在轉化為國產(chǎn)芯片廠商的業(yè)務收入。比如,根據(jù)2026年初中國移動的人工智能通用計算設備集采結果,在總價值超過50億元的訂單中,采購推理型AI服務器7499臺。其中,華為昇騰系廠商斬獲了34億元的份額,昆侖技術等國產(chǎn)企業(yè)的占比顯著提升。

另外,國產(chǎn)算力廠商的業(yè)績也在過去一年實現(xiàn)了爆發(fā)性增長。比如,2月27日,寒武紀(688256.SH)發(fā)布的業(yè)績快報顯示,2025年營收增長453.21%,達到64.97億元,并實現(xiàn)了20.59億元的歸母凈利潤,這是該公司上市以來的首次年度盈利,寒武紀表示,收入增長受益于人工智能行業(yè)算力需求的攀升,公司推動了應用場景的落地。類似地,摩爾線程(688795)、沐曦股份(688802)、海光信息(688041.SH)2025年度的業(yè)績表現(xiàn)亦均有大幅提升。

瀚博半導體創(chuàng)始人兼CEO錢軍則向經(jīng)濟觀察報記者表示,物理人工智能正接近關鍵拐點,實現(xiàn)路徑依賴于從虛擬到現(xiàn)實的閉環(huán)。瀚博半導體成立于2018年12月,是一家國產(chǎn)高性能GPU芯片提供商。

錢軍表示,圖形渲染作為構筑仿真與數(shù)字孿生的基礎,是連接人工智能與物理世界的第一步,該公司已在AI推理與云渲染領域建立了基本盤,目前其產(chǎn)品已在超10家頭部互聯(lián)網(wǎng)公司、多家運營商和央國企落地。

根據(jù)伯恩斯坦(Bernstein)發(fā)布的《2025年中國AI芯片產(chǎn)業(yè)報告》,中國本土AI芯片品牌市場滲透率已從2024年的約29%提升至2025年的42%。這也意味著,在數(shù)萬億Token持續(xù)消耗的背后,國產(chǎn)算力通過對行業(yè)應用的適配和成本結構的優(yōu)化,正在完成從邊緣備選向市場首選的跨越。

(作者 鄭晨燁)

免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。


鄭晨燁

資深記者。關注新能源、半導體、智能汽車等新產(chǎn)業(yè)領域,有線索歡迎聯(lián)系:zhengchenye@eeo.com.cn,微信:zcy096x。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
驚蟄過后濕氣重,養(yǎng)脾是關鍵,多吃這3樣,睡眠變好,精力充沛!

驚蟄過后濕氣重,養(yǎng)脾是關鍵,多吃這3樣,睡眠變好,精力充沛!

江江食研社
2026-03-06 11:18:24
凱特王妃「光腳丫跳舞」沒包袱!自曝重口味:超愛香菜

凱特王妃「光腳丫跳舞」沒包袱!自曝重口味:超愛香菜

達達哥
2026-03-07 11:27:40
G聯(lián)賽|楊瀚森復出13中10轟下21+9+6!撕裂之城混音132-122力克山谷太陽

G聯(lián)賽|楊瀚森復出13中10轟下21+9+6!撕裂之城混音132-122力克山谷太陽

臺州交通廣播
2026-03-07 13:43:37
湖州街頭上演現(xiàn)實版“飛馳人生”!網(wǎng)友怒贊!

湖州街頭上演現(xiàn)實版“飛馳人生”!網(wǎng)友怒贊!

環(huán)球網(wǎng)資訊
2026-03-07 13:39:16
鄭爽分享美國近況,穿搭不輸當紅明星,自曝做醫(yī)美網(wǎng)友直呼認不出

鄭爽分享美國近況,穿搭不輸當紅明星,自曝做醫(yī)美網(wǎng)友直呼認不出

萌神木木
2026-03-06 17:33:33
湖人不敵掘金!是誰毀了詹姆斯的封神夜?1人證明佩林卡早該被炒

湖人不敵掘金!是誰毀了詹姆斯的封神夜?1人證明佩林卡早該被炒

小路看球
2026-03-06 15:32:17
騰訊大廈排長隊!龍蝦OpenClaw爆火,現(xiàn)場安裝人氣爆棚

騰訊大廈排長隊!龍蝦OpenClaw爆火,現(xiàn)場安裝人氣爆棚

鞭牛士
2026-03-06 15:58:12
A股致命陷阱:橫盤數(shù)月拉2個漲停就跌 主力就賺這點?真相扎心了

A股致命陷阱:橫盤數(shù)月拉2個漲停就跌 主力就賺這點?真相扎心了

一方聊市
2026-03-05 10:18:35
第21波報復降臨,美軍航母被炸得后逃2000里,特朗普A計劃大敗

第21波報復降臨,美軍航母被炸得后逃2000里,特朗普A計劃大敗

吳欣純Deborah
2026-03-06 14:53:04
四川“黑道女皇”葉永梅:憑美貌上位,為禍四川10多年,下場如何

四川“黑道女皇”葉永梅:憑美貌上位,為禍四川10多年,下場如何

談史論天地
2026-03-05 13:37:50
5000萬磅!皇馬簽1米96天才逆襲封神,羅馬棄將征服伯納烏太震撼

5000萬磅!皇馬簽1米96天才逆襲封神,羅馬棄將征服伯納烏太震撼

卿子書
2026-03-07 09:14:13
全球首個、一周一次注射可控血糖,該創(chuàng)新藥率先在中國上市

全球首個、一周一次注射可控血糖,該創(chuàng)新藥率先在中國上市

南方都市報
2026-03-06 19:58:10
太陽徹底被坑慘!狄龍涉大麻被捕,3300萬水貨拖垮全隊

太陽徹底被坑慘!狄龍涉大麻被捕,3300萬水貨拖垮全隊

草莓解說體育
2026-03-07 10:26:40
騙過全世界的“中國第一鬼才”,惡習累累卻為何能享譽全球?

騙過全世界的“中國第一鬼才”,惡習累累卻為何能享譽全球?

曉風洞察
2026-03-01 18:19:19
4家企業(yè)同時被查,中標后故意放軍隊鴿子,背后有什么隱情?

4家企業(yè)同時被查,中標后故意放軍隊鴿子,背后有什么隱情?

我是盲流
2026-03-06 18:57:27
美國打伊朗到底圖什么?八成中國人以為是搶石油……

美國打伊朗到底圖什么?八成中國人以為是搶石油……

基本常識
2026-03-02 23:53:16
穿“鳥”的人少了,穿“山”的人多了?商場這一幕,太真實了

穿“鳥”的人少了,穿“山”的人多了?商場這一幕,太真實了

白色得季節(jié)
2026-03-06 10:44:56
致敬西虹市首富?切爾西眾人開球前將球圍在中間,解說員啞然失笑

致敬西虹市首富?切爾西眾人開球前將球圍在中間,解說員啞然失笑

懂球帝
2026-03-07 13:08:08
養(yǎng)老金公平性引熱議!四大群體的訴求,戳中制度痛點,太扎心了

養(yǎng)老金公平性引熱議!四大群體的訴求,戳中制度痛點,太扎心了

老特有話說
2026-03-06 15:46:13
德牧被棄服務區(qū),因體型大屢次被毆打,它到底做錯了什么?

德牧被棄服務區(qū),因體型大屢次被毆打,它到底做錯了什么?

Magic寵物社
2026-03-05 19:50:03
2026-03-07 14:36:49
經(jīng)濟觀察報 incentive-icons
經(jīng)濟觀察報
經(jīng)濟觀察報是專注于財經(jīng)新聞與經(jīng)濟分析的全國性綜合財經(jīng)類媒體。聚焦商道、商技和商機。
113389文章數(shù) 1606544關注度
往期回顧 全部

科技要聞

OpenClaw爆火,六位"養(yǎng)蝦人"自述與AI共生

頭條要聞

特朗普突然放話"先解決伊朗后解決古巴" 梅西聽懵了

頭條要聞

特朗普突然放話"先解決伊朗后解決古巴" 梅西聽懵了

體育要聞

塔圖姆歸來:凱爾特人的春之綠

娛樂要聞

周杰倫田馥甄的“JH戀” 被扒得底朝天

財經(jīng)要聞

針對"不敢休、不讓休"怪圈 國家出手了

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

房產(chǎn)
健康
數(shù)碼
教育
時尚

房產(chǎn)要聞

傳統(tǒng)學區(qū)房熄火?2月海口二手房爆火的板塊竟然是…

轉頭就暈的耳石癥,能開車上班嗎?

數(shù)碼要聞

蘋果M5 Pro芯片GeekBench跑分曝光:多核破2.8萬

教育要聞

兩會速遞|教育部部長:將實施新一輪學生心理健康促進行動

這些才是適合普通人的穿搭!搭配腰帶、多穿牛仔褲,簡單舒適

無障礙瀏覽 進入關懷版