国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

AI駛入“推理時代”:英偉達欲加冕“Token國王”,中國大模型已憑性價比搶跑

0
分享至

“推理的拐點已然到來。”

當地時間3月16日,在美國圣何塞舉行的GTC(GPU技術大會)上,英偉達CEO黃仁勛為全球AI競賽劃定了全新的戰(zhàn)場。

在這場萬眾矚目的演講中,黃仁勛拋出了一個新的商業(yè)概念——“AI Token工廠”。

他指出,隨著AI大模型從單純的“聊天工具”進化為“自主執(zhí)行任務的智能體(Agent)”,AI的核心戰(zhàn)事已從一次性的模型訓練,全面轉向持續(xù)、海量的Token生成(即推理)。

在這個規(guī)模到2027年或將高達萬億美元的新市場里,誰能把Token的生產成本降到最低,誰就能加冕為“Token國王”。


圖片來源:黃仁勛演講視頻截圖

為此,英偉達祭出了能將生成Token成本暴降90%的新一代Vera Rubin計算平臺。

就在黃仁勛高呼“降本”的同時,中國AI廠商已在推理市場上悄然拿下了全球定價權。

數據顯示,自2026年2月以來,伴隨著OpenClaw等智能體應用引發(fā)的Token消耗量狂飆,中國AI大模型憑借極致的性價比——僅為國外競品1/6至1/10的Token單價,在全球最大的API聚合平臺OpenRouter上,周調用量已連續(xù)多次強勢反超美國同行,并長期霸榜。

這絕非一場簡單的市場份額易手,而是一場關于AI降本路徑的底層邏輯大碰撞。

當AI全面駛入“推理時代”,這場爭奪定價權的“Token戰(zhàn)”已正式打響。


圖片來源:每日經濟新聞

黃仁勛定調新戰(zhàn)場:AI競爭核心已從訓練轉向Token生產效率

在2026年的GTC大會上,黃仁勛用近兩個小時的主題演講,為AI行業(yè)的下一階段競爭劃定了賽道——推理(Inference)。

黃仁勛強調,隨著AI從簡單的聊天機器人演進到能自主完成任務的智能體(Agentic AI),AI行業(yè)的核心工作正從一次性的模型訓練,轉向持續(xù)不斷地運行模型以生成結果,即推理。

每一次AI的問答、創(chuàng)作或分析背后,都是模型對Token的處理和生成。

Token是AI處理信息的最小數據單元,可以是一個單詞的一部分,也可以是圖像的像素塊。黃仁勛指出,Token是新AI時代的基礎構建單元,而AI應用的價值也越來越多地體現(xiàn)在持續(xù)、高效地生成Token上。

基于這一判斷,黃仁勛重提他早在2024年就提出的概念:“AI Token工廠”。


圖片來源:黃仁勛演講視頻截圖

他認為,數據中心的角色已經發(fā)生了根本性轉變。

“在上次工業(yè)革命中,進入工廠的原材料是水,出來的產品是電?!秉S仁勛在2024年的GTC大會上曾說,“如今,進入這些(服務器)房間的原材料是數據和電力,出來的則是Token。這些Token雖然無形,但非常有價值,將被分發(fā)到世界各地”。

這個概念的轉變至關重要。過去,數據中心一直被視為企業(yè)的“成本中心和資本支出”,但黃仁勛試圖讓市場接受一種新的經濟模型:算力直接與收入掛鉤?!叭绻麤]有算力,就沒有Token;沒有Token,就沒有收入”。在這種模型下,“AI Token工廠”的效率,將成為衡量云服務商和AI公司的核心經營指標。

黃仁勛給出了一個驚人的預測,到2027年,AI計算基礎設施的市場規(guī)??赡軙咏?萬億美元。一年前,英偉達給出的預期數字還只是5000億美元。黃仁勛解釋說,無論是初創(chuàng)公司還是大型企業(yè),對算力的需求都在激增,“如果他們能獲得更多算力,就能生成更多Token,他們的收入就會提升”。

在以提高Token生產效率為目標的戰(zhàn)場上,誰能以最低成本生成Token,誰就掌握了主導權。黃仁勛在演講中毫不諱言英偉達的雄心,他手舉一條印有“InferenceX”(推理之王)的冠軍腰帶,并多次強調英偉達通過軟硬件的“極致協(xié)同設計”(Extreme Co-design),實現(xiàn)了全球最低的Token成本,自封為“Token國王”。


英偉達發(fā)布新一代AI平臺Vera Rubin,欲將Token成本降低90%

為了在自己定義的“推理時代”中鞏固領先地位,英偉達在本次GTC上重點提及了自己的下一代AI計算平臺——Vera Rubin。

黃仁勛宣稱,Vera Rubin平臺將帶來一次“代際飛躍”,其每瓦特的推理性能是上一代Grace Blackwell的10倍,能夠將生成Token的成本降低約90%。在AI應用能耗問題日益凸顯的當下,這一能效比的巨大提升顯得尤為關鍵。

此外,英偉達還首次詳細披露了其整合Groq技術的成果。Groq是一家由谷歌TPU(張量處理單元)創(chuàng)始人創(chuàng)立的公司,英偉達在2025年12月斥資200億美元收購了其大部分資產。Groq的核心技術是一種確定性數據流處理器(LPU),專為低延遲推理而設計。

英偉達創(chuàng)造了一種創(chuàng)新的混合架構。在這套系統(tǒng)中,推理過程中需要大量算力和內存的任務在Vera Rubin GPU上完成;而對速度要求極高的任務,即最終生成Token的步驟,則交由Groq的LPU處理。

黃仁勛表示,Vera Rubin與Groq LPU的組合可以將推理性能提升高達35倍。這種“GPU負責高吞吐,LPU負責低延遲”的混合模式,旨在應對不同AI任務對成本、延遲和吞吐量的復雜要求,幫助客戶在不同價值層級的Token生成中找到最佳平衡點。黃仁勛表示:“如果你的工作主要是高吞吐,100%使用Vera Rubin;如果你有大量高價值的編程級別的Token生成需求,拿出25%的數據中心規(guī)模給Groq?!?/p>


圖片來源:黃仁勛演講視頻截圖

英偉達的野心不止于芯片。從Vera Rubin GPU、Vera CPU,到BlueField 4存儲系統(tǒng)、CPO Spectrum X光學交換機,再到名為Kyber的全新液冷機架系統(tǒng),英偉達展示了一套從芯片到系統(tǒng)的全棧解決方案。黃仁勛在演講中反復強調,加速計算不是一個芯片問題,而是一個系統(tǒng)問題,必須進行垂直整合。

為了讓“AI工廠”的建設更加標準化,英偉達甚至推出了名為NVIDIA DSX的數字孿生平臺。該平臺基于其Omniverse技術,允許客戶在虛擬世界中規(guī)劃、設計和模擬整個吉瓦級AI工廠的運行,包括機械、熱學、電氣和網絡系統(tǒng),甚至可以與電網協(xié)同進行節(jié)能調度,以求在設計階段就將效率最大化。


圖片來源:黃仁勛演講視頻截圖

通過定義Token經濟、發(fā)布降本硬件、推出全棧方案乃至制定建廠標準,英偉達正試圖定義整個AI工廠的構建模式,將自己從一個芯片供應商,升級為AI時代的“工廠架構師、操作系統(tǒng)供應商和通行費征收者”。


憑借架構創(chuàng)新和電力優(yōu)勢實現(xiàn)低價Token,中國AI已領跑全球市場

就在黃仁勛描繪“將Token成本降低90%”的宏偉藍圖時,中國的AI大模型廠商早已憑借性價比優(yōu)勢,在全球市場領跑。

2026年以來,OpenClaw的出現(xiàn)讓全球AI大模型的Token消耗量相比于“聊天機器人”時代呈指數級提升。

因此,開發(fā)者和用戶對于大模型Token價格更加敏感。借僅為國外大模型1/6~1/10的Token價格,中國大模型成為全球智能體(AI Agent)用戶的優(yōu)先選擇。

全球最大的AI大模型API聚合平臺OpenRouter數據顯示,今年2月9日~15日當周,中國AI大模型以4.12萬億的Token調用量,首次超過同期美國AI大模型的2.94萬億Token。到3月9日~15日當周,上榜的AI大模型中,中國AI大模型的周調用量上升至4.69萬億Token,再次連續(xù)兩周超越美國。


而且,在調用量排名前列的AI大模型中,中國AI大模型持續(xù)占據多數。


此前,OpenClaw默認選擇Claude4.5大模型,但有部分開發(fā)者認為其成本較高。而中國AI大模型運營實際成本遠低于美國AI大模型。

根據Artificial Analysis數據,以Minimax M2.5為例,運行一輪Artificial Analysis測試成本僅需125美元,而以Claude Opus 4.6運行一輪測試需要4970美元,使用GPT5.2-Codex測試一輪也需要花費3244美元。

中國AI大模型成本低,首先是因為Token價格低。比如,Minimax M2.5輸入和輸出價格僅為Claude Opus的6%和5%,是GPT5.2 Codex(xhigh)的17%和9%;


其次,單次運行測試所消耗的Token量少。以Minimax M2.5為例,運行一次測試消耗的Token量為58M,僅為Claude Opus的36%和GPT5.2-Codex(xhigh)的29%。


雖然價格便宜,但國產AI大模型的能力并不低。

根據Artificial Analysis上對代碼能力的評分,智譜GLM-5、Kimi K2.5和MiniMax 2.5在代碼測試集上分別得分44、40、37分,與GPT-5.1(high)、Claude 4.5 Sonnet持平。


國產AI大模型的性價比優(yōu)勢得益于兩個方面。首先是推理架構。

2025年后,DeepSeek通過一套協(xié)同創(chuàng)新實現(xiàn)高效:Multi-Head Latent Attention(多頭潛在注意力,MLA))大幅壓縮KV緩存。Mixture-of-Experts(專家混合,MoE)架構、FP8混合精度訓練、Multi Token Prediction(多Token預測,MTP),以及從DeepSeek-R1推理大模型蒸餾的知識。這套架構使其能在受限GPU上實現(xiàn)接近最先進的水平。

Kimi K2.5、智譜GLM5等大模型延續(xù)了DeepSeek思路,降低了推理成本。

電力成本優(yōu)勢是國產大模型高性價比的另一個原因。

申萬宏源計算機分析師測算,使用中國數據中心電力,理論上一張英偉達B200人工智能芯片每年可以節(jié)省900美元。2026年預計H200/B200及同級別芯片出貨量超1500萬顆,理論上全球每年電價可節(jié)省空間為百億美元。


單張GPU芯片推理作業(yè)中生成的Tokens及電價消耗量測算

國信證券分析師在研報中指出,相較于訓練端比拼最先進芯片、超大規(guī)模集群和長周期前置投入,推理更看重用戶生態(tài)、電力、網絡和調度效率等方面,中國與美國的芯片差距被縮小。

免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中方警戒艦目前正處于霍爾木茲海峽附近?國防部:假消息

中方警戒艦目前正處于霍爾木茲海峽附近?國防部:假消息

環(huán)球網資訊
2026-03-26 16:20:07
章澤天看展帶火春日穿搭叫“針織衫+彎刀褲”,配色清新很少女!

章澤天看展帶火春日穿搭叫“針織衫+彎刀褲”,配色清新很少女!

明星私服穿搭daily
2026-03-26 09:44:53
中東局勢升級!印尼狂砸31億,搶購中國退役導彈艇,西方不解

中東局勢升級!印尼狂砸31億,搶購中國退役導彈艇,西方不解

胖福的小木屋
2026-03-26 23:27:43
日本公布中國游客免稅店2月份消費數據,真的是打臉了!

日本公布中國游客免稅店2月份消費數據,真的是打臉了!

消失的電波
2026-03-26 15:20:44
忠告天下子女:再孝順,也不要為年過75歲的老父老母,做這三件事

忠告天下子女:再孝順,也不要為年過75歲的老父老母,做這三件事

風起見你
2026-03-27 00:22:57
俄羅斯宣傳三天攻占愛沙尼亞!炮制公投,又是特別軍事行動?

俄羅斯宣傳三天攻占愛沙尼亞!炮制公投,又是特別軍事行動?

項鵬飛
2026-03-24 20:28:43
生死12分鐘!廣東一男子踢球時心臟驟停 一群醫(yī)生沖上前接力心肺復蘇救回一命

生死12分鐘!廣東一男子踢球時心臟驟停 一群醫(yī)生沖上前接力心肺復蘇救回一命

閃電新聞
2026-03-26 11:46:05
寫小說判十年,把生殖器放女孩嘴巴里判兩年九個月

寫小說判十年,把生殖器放女孩嘴巴里判兩年九個月

昊軒看世界
2026-03-24 19:56:42
日均接診1.5萬人次、手術500臺,廣東這家華南醫(yī)療航母火遍全省

日均接診1.5萬人次、手術500臺,廣東這家華南醫(yī)療航母火遍全省

健身狂人
2026-03-27 00:11:10
局勢惡化!英外長急致電北京,六國發(fā)表聯(lián)合聲明,特朗普越做越絕

局勢惡化!英外長急致電北京,六國發(fā)表聯(lián)合聲明,特朗普越做越絕

報君知史
2026-03-27 02:43:59
美國記者挖坑提問:萬一臺灣不想被統(tǒng)一怎么辦?被中方精準反殺

美國記者挖坑提問:萬一臺灣不想被統(tǒng)一怎么辦?被中方精準反殺

雪中風車
2026-02-23 19:34:34
比亞迪官宣:《007》邦德扮演者丹尼爾·克雷格出任騰勢汽車代言人

比亞迪官宣:《007》邦德扮演者丹尼爾·克雷格出任騰勢汽車代言人

IT之家
2026-03-26 20:55:38
太意外!米蘭寶格麗之夜合影:劉亦菲兩度被擠,下意識動作引熱議

太意外!米蘭寶格麗之夜合影:劉亦菲兩度被擠,下意識動作引熱議

時間巡查
2026-03-25 04:28:00
張雪峰對蘇州的綜合貢獻曝光!5年納稅8.5億,間接經濟拉動28億

張雪峰對蘇州的綜合貢獻曝光!5年納稅8.5億,間接經濟拉動28億

談史論天地
2026-03-26 07:45:53
伊朗伊斯蘭革命衛(wèi)隊稱擊落一架美軍F-18戰(zhàn)機

伊朗伊斯蘭革命衛(wèi)隊稱擊落一架美軍F-18戰(zhàn)機

環(huán)球網資訊
2026-03-26 06:37:05
羅技:“我一降價,你還不是像狗一樣跑過來”

羅技:“我一降價,你還不是像狗一樣跑過來”

電腦吧評測室
2026-03-26 22:05:58
信息量極大!黃仁勛最新論斷:AGI已實現(xiàn),OpenClaw是AI界iPhone,未來將有10億程序員

信息量極大!黃仁勛最新論斷:AGI已實現(xiàn),OpenClaw是AI界iPhone,未來將有10億程序員

AI科技大本營
2026-03-26 19:52:36
沙特實戰(zhàn)封神!中國“天盾”21發(fā)21中,美方2億美元系統(tǒng)差距在哪

沙特實戰(zhàn)封神!中國“天盾”21發(fā)21中,美方2億美元系統(tǒng)差距在哪

聞香閣
2026-03-27 04:16:43
柳景武已任山東省委副秘書長、省機關事務管理局局長

柳景武已任山東省委副秘書長、省機關事務管理局局長

黃河新聞網呂梁
2026-03-26 10:03:54
蔣介石孫子召開發(fā)布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

蔣介石孫子召開發(fā)布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

老謝談史
2026-03-18 18:33:35
2026-03-27 06:20:49
每日經濟新聞 incentive-icons
每日經濟新聞
中國主流財經全媒體平臺。
1519847文章數 2724764關注度
往期回顧 全部

科技要聞

美團發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

特朗普:對伊朗能源設施空襲再推遲10天

頭條要聞

特朗普:對伊朗能源設施空襲再推遲10天

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

教育
房產
本地
時尚
公開課

教育要聞

2026青島要取消高中特色班招生?

房產要聞

突發(fā),三亞又有大批征遷補償方案出爐!

本地新聞

救命,這只醬板鴨已經在我手機復仇了一萬遍

400萬人愛過的女孩,被黃謠網暴180天后

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版