国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

黃仁勛的Token經(jīng)濟(jì)學(xué)

0
分享至


經(jīng)濟(jì)觀察報(bào)記者 鄭晨燁

素有AI行業(yè)年度風(fēng)向標(biāo)之稱的英偉達(dá)GTC大會(huì),今年3月16日至19日在美國(guó)加利福尼亞州圣何塞舉行。

當(dāng)?shù)貢r(shí)間3月16日上午11點(diǎn),也就是北京時(shí)間3月17日凌晨2點(diǎn),英偉達(dá)CEO黃仁勛在圣何塞SAP中心發(fā)表了超過(guò)兩小時(shí)的主題演講。

黃仁勛在演講中預(yù)測(cè),到2027年全球AI基礎(chǔ)設(shè)施相關(guān)需求將達(dá)到1萬(wàn)億美元。他還說(shuō),實(shí)際需求可能會(huì)比1萬(wàn)億美元高得多,英偉達(dá)的產(chǎn)品甚至?xí)┎粦?yīng)求。

這個(gè)數(shù)字發(fā)布后,英偉達(dá)美股股價(jià)瞬時(shí)跳漲超過(guò)4%。但幾個(gè)小時(shí)后A股開(kāi)盤,算力產(chǎn)業(yè)鏈股票集體下跌,天孚通信(300394.SZ)收盤跌幅超10%,長(zhǎng)光華芯(688048.SH)收盤跌幅亦達(dá)9.72%,多數(shù)龍頭股回吐了近5日漲幅。

一邊是萬(wàn)億美元預(yù)期,一邊是產(chǎn)業(yè)鏈股票大跌,落差來(lái)自時(shí)間尺度。

黃仁勛講的是未來(lái)的需求預(yù)期,而他預(yù)告的下一代Feynman芯片架構(gòu)要到2028年才上市。另外,萬(wàn)聯(lián)證券在3月16日發(fā)布的研報(bào)中指出,A股電子板塊截至3月15日的平均市盈率約為82倍,市場(chǎng)或在擔(dān)心“高處不勝寒”。

但黃仁勛的這場(chǎng)演講值得仔細(xì)看的地方不在于萬(wàn)億美元這個(gè)數(shù)字本身,而在于他用兩個(gè)小時(shí)講了一套新的商業(yè)邏輯:數(shù)據(jù)中心正在從訓(xùn)練模型的地方,變成生產(chǎn)Token的工廠。

Token工廠

Token是大語(yǔ)言模型處理信息的基本單位,可以粗略理解為AI處理或生成的文字片段,一個(gè)漢字大約對(duì)應(yīng)一到兩個(gè)Token。

過(guò)去兩年,Token的消耗量發(fā)生了幾次量級(jí)上的跳躍。

黃仁勛在演講中把這件事追溯到了三個(gè)節(jié)點(diǎn):2022年底ChatGPT上線,AI學(xué)會(huì)了生成內(nèi)容,開(kāi)始大量消耗Token;ChatGPT o1模型出現(xiàn)后,AI學(xué)會(huì)了推理和反思,為了思考,它要在內(nèi)部生成大量Token給自己看;Claude Code(Anthropic公司開(kāi)發(fā)的AI編程工具)發(fā)布后,AI能讀取文件、編寫代碼、編譯測(cè)試,每完成一個(gè)任務(wù)消耗的Token比簡(jiǎn)單對(duì)話多出好幾個(gè)數(shù)量級(jí)。

黃仁勛提到,英偉達(dá)所有的軟件工程師都在用AI輔助編程。

AI的工作分兩個(gè)階段:訓(xùn)練是讓模型變聰明的過(guò)程,需要花一次大錢把模型練出來(lái);推理是模型干活的過(guò)程,每天都在發(fā)生,需求也越來(lái)越大。過(guò)去全球買GPU(圖形處理器,目前AI計(jì)算的核心硬件)主要是為了訓(xùn)練,現(xiàn)在重心已經(jīng)在向推理轉(zhuǎn)移。

黃仁勛說(shuō),推理服務(wù)商的業(yè)務(wù)規(guī)模過(guò)去一年增長(zhǎng)了100倍。IDC中國(guó)分析師杜昀龍也告訴經(jīng)濟(jì)觀察報(bào)記者,目前國(guó)內(nèi)推理服務(wù)器不論增速還是占比均已超過(guò)訓(xùn)練,從服務(wù)器出貨金額來(lái)看,推理占比已接近60%。

推理的需求在爆發(fā),但Token還沒(méi)有形成市場(chǎng)定價(jià)體系。

黃仁勛在演講中給出了他認(rèn)為未來(lái)會(huì)出現(xiàn)的五檔價(jià)格:免費(fèi)層,Token產(chǎn)出量大但響應(yīng)速度慢;中等層,每百萬(wàn)Token約3美元;高級(jí)層,每百萬(wàn)Token約6美元;高速層,每百萬(wàn)Token約45美元;頂級(jí)層,每百萬(wàn)Token約150美元。模型越大、上下文越長(zhǎng)、響應(yīng)速度越快,Token就越貴。

他以頂級(jí)層舉了個(gè)例子:一個(gè)研究團(tuán)隊(duì)每天用5000萬(wàn)Token,按每百萬(wàn)Token150美元來(lái)算也就只有7500美元,對(duì)企業(yè)來(lái)說(shuō)不算什么。上下文窗口從32K個(gè)Token拉到400K個(gè)Token之后,AI能一次性讀完一整份合同或一整個(gè)代碼庫(kù),價(jià)格對(duì)應(yīng)的是此前做不了的事情。

有了分層定價(jià),數(shù)據(jù)中心的經(jīng)濟(jì)模型就變了。

黃仁勛說(shuō),每一座數(shù)據(jù)中心都受電力限制,一座1GW(吉瓦,一種電力計(jì)量單位)的數(shù)據(jù)中心永遠(yuǎn)不會(huì)變成2GW,這是電力和土地決定的。在固定功率下,誰(shuí)消耗每瓦電力能產(chǎn)出的Token最多,誰(shuí)的生產(chǎn)成本就最低。也就是說(shuō),同樣耗一度電,誰(shuí)能生產(chǎn)更多Token,誰(shuí)就能賺得更多。

他在演講時(shí)展示了一組數(shù)字:同一個(gè)1GW數(shù)據(jù)中心,假設(shè)把算力分配給不同價(jià)格層級(jí),使用英偉達(dá)當(dāng)前的Blackwell架構(gòu)年?duì)I收約300億美元,換成新一代Vera Rubin約1500億美元,再加上Groq LPU推理加速器約3000億美元。同一座數(shù)據(jù)中心,換一套設(shè)備,營(yíng)收可以相差10倍。

英偉達(dá)2026財(cái)年全年?duì)I收2159億美元,數(shù)據(jù)中心業(yè)務(wù)貢獻(xiàn)了其中的1937億美元。

按黃仁勛的邏輯,客戶現(xiàn)有的數(shù)據(jù)中心還沒(méi)有被充分利用,換上新一代設(shè)備,同樣的電力條件下收入可以翻好幾倍。萬(wàn)億美元預(yù)期就是這么來(lái)的,不是芯片漲價(jià),是同樣的電力能生產(chǎn)出更多、更貴的Token。

黃仁勛說(shuō),未來(lái)每一位CEO都會(huì)盯著自己Token工廠的效能,因?yàn)槟侵苯泳褪鞘杖搿?/p>

他還描述了一個(gè)正在硅谷出現(xiàn)的變化:現(xiàn)在越來(lái)越多工程師日常用AI寫代碼、做研究、處理文檔,這些操作都要消耗Token,企業(yè)需要為員工使用AI的開(kāi)銷買單。

黃仁勛預(yù)測(cè)這筆開(kāi)銷會(huì)大到需要單獨(dú)列預(yù)算,就像企業(yè)給員工配電腦和軟件一樣。

他還說(shuō),未來(lái)每個(gè)工程師入職時(shí)都會(huì)拿到一份年度Token預(yù)算,金額大約相當(dāng)于基礎(chǔ)薪資的一半。

兩種芯片

黃仁勛的這套Token經(jīng)濟(jì)學(xué)對(duì)應(yīng)的硬件,是GTC上正式發(fā)布的Vera Rubin平臺(tái)。

黃仁勛在演講中說(shuō),過(guò)去談Hopper架構(gòu)的時(shí)候他會(huì)舉起一塊芯片,但Vera Rubin不是一塊芯片的事,它是一整個(gè)系統(tǒng)。這套系統(tǒng)做到了百分之百的液冷,安裝時(shí)間從過(guò)去的兩天壓縮到了兩個(gè)小時(shí)。

Vera Rubin由七款芯片組成。核心機(jī)架NVL72集成72顆Rubin GPU和36顆Vera CPU,通過(guò)NVLink 6(英偉達(dá)自研的芯片間高速互連技術(shù))相連。與上一代Blackwell相比,每瓦推理吞吐量最高提升10倍,單Token成本降至十分之一。

英偉達(dá)同時(shí)發(fā)布了全新88核Vera CPU,為AI智能體場(chǎng)景下的工具調(diào)用和數(shù)據(jù)處理做了專門優(yōu)化。

黃仁勛在演講中稱,微軟CEO納德拉已向他確認(rèn),首批Vera Rubin機(jī)架已在Azure(微軟的云計(jì)算平臺(tái))上運(yùn)行。

但Vera Rubin有一個(gè)短板,黃仁勛在演講時(shí)說(shuō),當(dāng)每個(gè)用戶每秒需要生成超過(guò)400個(gè)Token時(shí),NVL72的帶寬就不夠用了。補(bǔ)上這個(gè)缺口的,是Groq這家成立于2016年的美國(guó)AI加速芯片公司。英偉達(dá)此前收購(gòu)了Groq的技術(shù)授權(quán)和核心團(tuán)隊(duì)。

Groq的LPU(語(yǔ)言處理單元)和GPU是完全不同的兩種芯片。GPU內(nèi)存大、算力強(qiáng),單顆Rubin GPU有288GB內(nèi)存,適合處理復(fù)雜計(jì)算。LPU內(nèi)存小但讀寫速度極快,單顆只有500MB存儲(chǔ),裝不下大模型的完整參數(shù),但生成Token的速度和延遲遠(yuǎn)優(yōu)于GPU。

英偉達(dá)通過(guò)一套叫Dynamo的推理調(diào)度軟件,把推理過(guò)程拆成了兩步:需要大量算力和內(nèi)存的上下文理解交給Vera Rubin處理,對(duì)延遲敏感的Token生成交給Groq LPU。兩者通過(guò)以太網(wǎng)高速連接協(xié)同工作,延遲減少約一半。

黃仁勛管這種方式叫解耦推理(即把推理過(guò)程拆分給不同芯片處理),核心想法是承認(rèn)高吞吐和低延遲天然矛盾,不如讓兩種芯片各干各擅長(zhǎng)的事。

他說(shuō),這套組合在45美元和150美元的高價(jià)格層級(jí)實(shí)現(xiàn)了相比上一代35倍的性能提升。

從更長(zhǎng)的時(shí)間維度看,同一個(gè)1GW的數(shù)據(jù)中心,兩年時(shí)間,Token生成速率可以從每秒2200萬(wàn)提升到7億。

黃仁勛給客戶的建議是,如果工作以高吞吐的批量推理為主,就完全用Vera Rubin;如果有大量編程、實(shí)時(shí)交互等需求,可以拿出25%的數(shù)據(jù)中心算力配Groq LPU。

黃仁勛表示,Groq 3 LPU由三星代工,已在量產(chǎn),預(yù)計(jì)今年三季度出貨。

軟件方面,英偉達(dá)發(fā)布了企業(yè)級(jí)智能體平臺(tái)NemoClaw,支持近期火爆的開(kāi)源項(xiàng)目OpenClaw。OpenClaw在幾周之內(nèi)成為GitHub(全球最大的開(kāi)源代碼托管平臺(tái))上增長(zhǎng)最快的開(kāi)源項(xiàng)目,黃仁勛把它的地位抬到和Linux同一級(jí)別,說(shuō)它是智能體計(jì)算機(jī)的操作系統(tǒng)。

但企業(yè)環(huán)境下直接用開(kāi)源的OpenClaw有安全風(fēng)險(xiǎn),因?yàn)橹悄荏w可以訪問(wèn)公司的敏感數(shù)據(jù)、執(zhí)行代碼和外部通信。NemoClaw就是英偉達(dá)給OpenClaw加上的企業(yè)安全層。Adobe、Salesforce、SAP等17家企業(yè)軟件公司已宣布采用英偉達(dá)的Agent Toolkit(智能體開(kāi)發(fā)工具包)。

路線圖方面,英偉達(dá)預(yù)告了2028年上市的下一代Feynman架構(gòu),首次同時(shí)支持銅纜和CPO(將光通信元件直接集成到芯片上的技術(shù))兩種互連方式。

今年也是CUDA(英偉達(dá)開(kāi)發(fā)的GPU通用計(jì)算平臺(tái),被視為英偉達(dá)軟件生態(tài)的基石)誕生20周年。據(jù)黃仁勛在演講中介紹,英偉達(dá)目前60%的業(yè)務(wù)來(lái)自全球前五大云服務(wù)商,另外40%分布在主權(quán)AI、企業(yè)、工業(yè)、機(jī)器人等各個(gè)領(lǐng)域。

在本次GTC大會(huì)上,英偉達(dá)還宣布了與Uber、比亞迪、吉利、現(xiàn)代、日產(chǎn)、五十鈴在自動(dòng)駕駛領(lǐng)域的合作。受此消息推動(dòng),港股汽車板塊17日集體走強(qiáng),吉利汽車(00175.HK)盤中一度漲超5%,最終收漲4.55%。

(作者 鄭晨燁)

免責(zé)聲明:本文觀點(diǎn)僅代表作者本人,供參考、交流,不構(gòu)成任何建議。


鄭晨燁

資深記者。關(guān)注新能源、半導(dǎo)體、智能汽車等新產(chǎn)業(yè)領(lǐng)域,有線索歡迎聯(lián)系:zhengchenye@eeo.com.cn,微信:zcy096x。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
我國(guó)癌癥高發(fā),電飯煲是“幫兇”?醫(yī)生:7種省錢行為要不得

我國(guó)癌癥高發(fā),電飯煲是“幫兇”?醫(yī)生:7種省錢行為要不得

大象新聞
2026-03-24 13:53:11
中考大改革!10門變6門,體育成“主科”,調(diào)整還在進(jìn)行中……

中考大改革!10門變6門,體育成“主科”,調(diào)整還在進(jìn)行中……

侃故事的阿慶
2026-03-26 14:02:37
上海媽媽尋親27年,懸賞上海市區(qū)一套房!“不需要回來(lái)盡孝,只在等一個(gè)擁抱”

上海媽媽尋親27年,懸賞上海市區(qū)一套房!“不需要回來(lái)盡孝,只在等一個(gè)擁抱”

環(huán)球網(wǎng)資訊
2026-03-26 15:06:31
38.6萬(wàn)元起拍!南京一民國(guó)老四合院上架拍賣

38.6萬(wàn)元起拍!南京一民國(guó)老四合院上架拍賣

現(xiàn)代快報(bào)
2026-03-26 14:34:07
鎮(zhèn)江一男子,被要挾曝光“不雅視頻”!

鎮(zhèn)江一男子,被要挾曝光“不雅視頻”!

知揚(yáng)中
2026-03-26 17:46:49
香港再無(wú)董建華

香港再無(wú)董建華

華人星光
2025-11-25 12:01:27
國(guó)防部:菲方侵權(quán)挑釁只會(huì)遭到更加堅(jiān)決應(yīng)對(duì)

國(guó)防部:菲方侵權(quán)挑釁只會(huì)遭到更加堅(jiān)決應(yīng)對(duì)

新京報(bào)
2026-03-26 16:30:55
“尼帕病毒”來(lái)勢(shì)洶洶,建議:每家備好6樣?xùn)|西,關(guān)鍵時(shí)刻能救命

“尼帕病毒”來(lái)勢(shì)洶洶,建議:每家備好6樣?xùn)|西,關(guān)鍵時(shí)刻能救命

路醫(yī)生健康科普
2026-01-28 12:18:49
杜淳寵妻太狠了!王燦戴4條金手鏈,口紅整箱買像批發(fā)?

杜淳寵妻太狠了!王燦戴4條金手鏈,口紅整箱買像批發(fā)?

娛樂(lè)領(lǐng)航家
2026-03-26 00:00:03
“地鐵吐血女孩”獨(dú)自到醫(yī)院看?。核嬖V醫(yī)生當(dāng)天嘔血10毫升,醫(yī)院再發(fā)病危通知單,開(kāi)藥后繼續(xù)觀察

“地鐵吐血女孩”獨(dú)自到醫(yī)院看?。核嬖V醫(yī)生當(dāng)天嘔血10毫升,醫(yī)院再發(fā)病危通知單,開(kāi)藥后繼續(xù)觀察

極目新聞
2026-03-24 19:14:02
5分鐘開(kāi)通國(guó)家免費(fèi)電視!不用機(jī)頂盒、不連網(wǎng),永久免費(fèi)

5分鐘開(kāi)通國(guó)家免費(fèi)電視!不用機(jī)頂盒、不連網(wǎng),永久免費(fèi)

叮當(dāng)當(dāng)科技
2026-03-20 03:29:51
王仁輝任江西省衛(wèi)健委主任

王仁輝任江西省衛(wèi)健委主任

中國(guó)經(jīng)濟(jì)網(wǎng)
2026-03-26 13:51:05
美議員喊話特朗普:如果北京不答應(yīng)美國(guó)要求,就不準(zhǔn)中國(guó)做一件事

美議員喊話特朗普:如果北京不答應(yīng)美國(guó)要求,就不準(zhǔn)中國(guó)做一件事

讓心靈得以棲息
2026-03-26 05:03:07
宅基地確權(quán)最后沖刺:今年不把名字改成兒子的,以后可能就改不了

宅基地確權(quán)最后沖刺:今年不把名字改成兒子的,以后可能就改不了

混沌錄
2026-03-19 21:59:03
殲-20總師被除名:長(zhǎng)期任央企領(lǐng)導(dǎo),最近照曝出,事發(fā)全過(guò)程披露

殲-20總師被除名:長(zhǎng)期任央企領(lǐng)導(dǎo),最近照曝出,事發(fā)全過(guò)程披露

博士觀察
2026-03-23 23:03:27
胖東來(lái)再立功,自選眼鏡超市火爆,7億近視人配鏡應(yīng)花多少錢?

胖東來(lái)再立功,自選眼鏡超市火爆,7億近視人配鏡應(yīng)花多少錢?

勻楓財(cái)技大兜底
2026-03-25 10:26:15
可能出大事了,四名軍工系統(tǒng)院士被除名,釋放的信號(hào)讓人不敢細(xì)想

可能出大事了,四名軍工系統(tǒng)院士被除名,釋放的信號(hào)讓人不敢細(xì)想

張嘴說(shuō)財(cái)經(jīng)
2026-03-25 23:07:05
央視發(fā)文,60歲釋永信再迎噩耗,被他害慘的4個(gè)明星也出了口惡氣

央視發(fā)文,60歲釋永信再迎噩耗,被他害慘的4個(gè)明星也出了口惡氣

丁丁鯉史紀(jì)
2026-03-25 18:03:42
國(guó)民黨大亂!馬英九緊急發(fā)聲、與鄭麗文決裂?蕭旭岑恐遭牢獄之災(zāi)

國(guó)民黨大亂!馬英九緊急發(fā)聲、與鄭麗文決裂?蕭旭岑恐遭牢獄之災(zāi)

滄海一書客
2026-03-25 12:07:49
從廣東到東北!劉強(qiáng)東游艇版圖擴(kuò)容,150億元項(xiàng)目進(jìn)駐大連

從廣東到東北!劉強(qiáng)東游艇版圖擴(kuò)容,150億元項(xiàng)目進(jìn)駐大連

南方都市報(bào)
2026-03-26 14:42:13
2026-03-26 20:08:49
經(jīng)濟(jì)觀察報(bào) incentive-icons
經(jīng)濟(jì)觀察報(bào)
經(jīng)濟(jì)觀察報(bào)是專注于財(cái)經(jīng)新聞與經(jīng)濟(jì)分析的全國(guó)性綜合財(cái)經(jīng)類媒體。聚焦商道、商技和商機(jī)。
113751文章數(shù) 1606621關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂(lè)要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

汽車要聞

一汽奧迪A6L e-tron開(kāi)啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

房產(chǎn)
健康
旅游
藝術(shù)
數(shù)碼

房產(chǎn)要聞

突發(fā),三亞又有大批征遷補(bǔ)償方案出爐!

轉(zhuǎn)頭就暈的耳石癥,能開(kāi)車上班嗎?

旅游要聞

魯冰花開(kāi)啦!快來(lái)新鄉(xiāng)南太行八里溝 赴一場(chǎng)春日之約

藝術(shù)要聞

哪一座橋不是風(fēng)景?

數(shù)碼要聞

1+4核,英特爾酷睿3 304處理器現(xiàn)身基準(zhǔn)測(cè)試

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版