国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

黃仁勛:日薪兩千美元的員工,我巴不得你每天花一千去“養(yǎng)蝦”!|閉門會2萬字實錄

0
分享至

出品 | 網(wǎng)易智能

作者 | 小小

編輯 | 王鳳枝

在2026年GTC兩小時主題演講引爆全場后,英偉達(dá)創(chuàng)始人兼CEO黃仁勛18日再度現(xiàn)身GTC 2026現(xiàn)場,面向金融分析師舉行了一場閉門問答會。面對諸多尖銳提問,“黃教主”不僅展現(xiàn)出對行業(yè)趨勢的深刻洞察,更罕見地披露了關(guān)于下一代架構(gòu)的萬億級市場預(yù)期。


黃仁勛在問答中提出了一系列觀點。他認(rèn)為,AI產(chǎn)業(yè)正邁入“第三個拐點”,從生成式AI向“智能體系統(tǒng)”階段演進(jìn),AI將不再僅是回答問題,而是能夠自主執(zhí)行復(fù)雜任務(wù)。

這一轉(zhuǎn)變將徹底重塑計算產(chǎn)業(yè)形態(tài):計算機正從單純的工具演變?yōu)椤爸圃煸O(shè)備”,其核心產(chǎn)出物是具有經(jīng)濟(jì)價值的Token。他將其定義為“AI工廠”模式,并強調(diào)衡量算力優(yōu)劣的標(biāo)準(zhǔn)已轉(zhuǎn)向“單位功耗下的Token生成效率”。

在黃仁勛看來,驅(qū)動這座“AI工廠”高速運轉(zhuǎn)的核心操作系統(tǒng),正是當(dāng)下火爆的開源項目OpenClaw。他毫不諱言地指出:“今天,全球每家公司都必須確立自己的OpenClaw戰(zhàn)略。”

黃仁勛算了一筆“經(jīng)濟(jì)賬”:他曾瀏覽過一篇Reddit帖子,發(fā)帖人的Claw智能體一天內(nèi)竟消耗了5000萬個Token。聽起來猶如天文數(shù)字,但折算下來不過區(qū)區(qū)50美元。倘若這50美元能讓智能體替你從事極具生產(chǎn)力的工作,這筆投資簡直微不足道。未來的常態(tài)將是:一位日薪數(shù)千美元的精英,統(tǒng)領(lǐng)著一支龐大的智能體大軍,為每個智能體分配50美元的日預(yù)算,從而將個人生產(chǎn)力推向極致。這一場景很快便會司空見慣。

事實上,在英偉達(dá),他們已然將此付諸實踐。黃仁勛坦言:“對于那些我每天支付數(shù)千美元薪酬的員工,我巴不得他們每天消耗的Token遠(yuǎn)超50美元。我期望他們能運籌帷幄,管理一整支智能體編隊來代勞繁雜任務(wù)。”他還稱,真心期盼一位日入2000美元的干將,每天能豪擲1000美元在Token消耗上。

正是基于這種由智能體引爆的算力渴求,面對分析師對市場天花板的疑慮,黃仁勛再次重申了其預(yù)測:基于Blackwell和下一代Rubin架構(gòu),英偉達(dá)在2027年前的明確可見市場需求已超過1萬億美元。他進(jìn)一步展望,傳統(tǒng)的2萬億美元軟件許可行業(yè),正加速向基于AI智能體的Token轉(zhuǎn)售模式轉(zhuǎn)型,潛在市場規(guī)模有望擴(kuò)張至8萬億美元。

這場對話不僅勾勒出英偉達(dá)的雄心,也揭示了AI底層商業(yè)邏輯即將迎來的根本性變革。

以下為黃仁勛記者問答會全文:

01重新定義AI時代:計算機不再是工具,是制造設(shè)備

主持人:大家早上好。希望各位喜歡昨天GTC的主題演講,雖然時間稍長,但我認(rèn)為它為我們做了一次極佳的總結(jié)。接下來,我們將利用這段時間聚焦各位的需求,解答大家可能存在的其他疑問。我們將先過幾張幻燈片,隨后開放提問。現(xiàn)在,把時間交給黃仁勛。

黃仁勛:正如我昨日所述,AI的發(fā)展正經(jīng)歷三個關(guān)鍵的轉(zhuǎn)折點:第一個是生成式AI,第二個是推理階段,而我們現(xiàn)在正處于第三個即智能體系統(tǒng)。每一次轉(zhuǎn)折都建立在上一代的基礎(chǔ)之上,但智能體系統(tǒng)的本質(zhì)突破在于“自主性”。過去,AI只是回答問題;現(xiàn)在,你可以為其設(shè)定目標(biāo),它便能真正著手執(zhí)行任務(wù)。

任務(wù)可以是什么?最典型的一個應(yīng)用就是編寫軟件。如今,貴公司的工程師,當(dāng)然也包括我們公司的,每天都在高頻使用智能體系統(tǒng)。過去,工程師上班只需一臺筆記本電腦;而現(xiàn)在,他們需要筆記本電腦,外加Token。Token預(yù)算已成為切實存在的資源。試想,如果你雇了一位年薪30萬美元的工程師,而他在工作中竟完全不消耗任何Token,你恐怕得問問他:你到底在忙些什么?所以結(jié)論很清楚:每個工程師都將消耗大量Token,而這些Token必須被生產(chǎn)出來。

這就引發(fā)了一場根本性變革:過去計算機只是工具,而未來的計算機將是制造設(shè)備。它們和ASML的光刻機沒什么兩樣,都在生產(chǎn)某種可供出售的商品。就像很久以前的發(fā)電機生產(chǎn)電力一樣,這些都是制造系統(tǒng)。其能效與生產(chǎn)效率,將直接決定你的營收與競爭力。

第三個轉(zhuǎn)折點已經(jīng)到來。以O(shè)penClaw項目為例,很多人初見其開源版本時,還以為那是個玩具。但若你退一步,從第一性原理出發(fā)去思考,便會發(fā)現(xiàn)OpenClaw本質(zhì)上就是一臺計算機,它是AI計算機的操作系統(tǒng),也是一臺個人AI計算機。它具備計算系統(tǒng)的所有屬性:資源管理、任務(wù)調(diào)度、執(zhí)行輸入輸出、網(wǎng)絡(luò)連接等,它擁有基礎(chǔ)計算機所需的一切。那條陡峭的增長曲線已說明一切,這才是真正值得矚目的焦點。

所以,今天每家公司都需要思考一個問題:你的OpenClaw戰(zhàn)略是什么?過去,我們必須制定Linux戰(zhàn)略、互聯(lián)網(wǎng)戰(zhàn)略、移動云戰(zhàn)略;而如今,每家軟件公司都必須確立OpenClaw戰(zhàn)略。這件事的重要性怎么強調(diào)都不為過。

在此背景下,我想更新一下去年做出的某項預(yù)測。一年前我曾提到,我們對Blackwell和Rubin架構(gòu)到2026年的出貨量有著極高的業(yè)務(wù)可見度,包括明確的采購訂單和需求,當(dāng)時的預(yù)期規(guī)模約為5000億美元。很多人當(dāng)時對此有疑問,想知道最新進(jìn)展?,F(xiàn)在是3月,我們距離2027年底還有很長時間。正因為我們在建設(shè)的是基礎(chǔ)設(shè)施和工廠,而每個人的交付周期都很長,所以我希望他們盡早下單以確保供應(yīng)。

今天我可以更新的數(shù)據(jù)是:我們對Blackwell加Rubin的出貨價值(僅限這兩款產(chǎn)品)突破1萬億美元,有著極強的信心與可見度。這不是一個浮動的估值,不是精確到小數(shù)點后94位的數(shù)字,我們也沒有在錙銖必較地算零頭。我的意思是,針對超過1萬億美元的Blackwell加Rubin市場,我們抱有強烈的預(yù)期。為什么只說Blackwell和Rubin?因為去年我提的時候只談了這兩款芯片。今年我們新增了Groq、獨立的CPU還有很多其他產(chǎn)品,但為了口徑一致,我今天的更新只聚焦于Blackwell和Rubin。

所以我需要把話說清楚:我所說的這1萬億美元,只包括Blackwell和Rubin這兩款產(chǎn)品。不包括Feynman,不包括Rubin Plus或Rubin Ultra,不包括Vera Standalone,也不包括Groq。僅僅是Blackwell加Rubin,我們就已經(jīng)有了超過1萬億美元的采購訂單,這是基于高度確信的需求、清晰的可見性和扎實的預(yù)測得出的結(jié)論。

我們一直在達(dá)成交易、完成出貨,而且從現(xiàn)在到2027年底,我們預(yù)計還會達(dá)成更多交易、預(yù)訂更多訂單、出貨更多產(chǎn)品。原因很簡單:我們會一直工作到那一天。英偉達(dá)有一個獨特的優(yōu)勢。因為我們設(shè)計和交付的是高度復(fù)雜的整體系統(tǒng),我們可以在同一個季度內(nèi)完成從贏單、預(yù)訂到出貨的全過程。如果你做的是ASIC(專用集成電路),你做不到這一點。如果你現(xiàn)在還沒看到需求,就不可能趕在2027年底前出貨。但我們不同。

我們提前建立庫存,構(gòu)建了完整的供應(yīng)鏈,我們必須把這個優(yōu)勢用足。當(dāng)前客戶對算力如饑似渴,如果他們在最后一刻突然提出“我們還需要更多”,我希望我們永遠(yuǎn)有底氣回應(yīng):“沒問題,我們樂意效勞?!备螞r,我們還在開拓新客戶、新市場、新區(qū)域,這些甚至還沒有算進(jìn)這1萬億美元里。畢竟,距離2027年底還有21個月。因此,我希望大家真正理解這1萬億美元意味著什么:它絕非終點,它本身將持續(xù)增長,未來勢必會超越這一數(shù)字。

02推理經(jīng)濟(jì)學(xué):最貴的計算機,最便宜的Token

我再補充幾點。

2025年對我們來說是意義非凡的一年,因為它是“推理之年”。在這一年里,我們幫助市場理清了一個核心邏輯:計算機的售價與Token的成本之間并無必然聯(lián)系。人們買這些計算機是為了生產(chǎn)Token,而Token的生產(chǎn)效率至關(guān)重要。如果你買了一臺昂貴的計算機然后轉(zhuǎn)手賣掉,那它確實只是“昂貴”;但若你用它來生產(chǎn)Token,它的“貴”則源于其技術(shù)足夠先進(jìn),能以驚人的效率產(chǎn)出Token。這意味著你完全可以同時擁有“最昂貴的計算機”與“成本最低的Token”,這正是我們每天在做的事,也是我們創(chuàng)造獨特價值的根源。

這種價值差,最終體現(xiàn)在兩個指標(biāo)上:每秒生成的Token數(shù)以及每瓦功耗產(chǎn)出的Token數(shù)。我們每一代產(chǎn)品都在實現(xiàn)指數(shù)級的性能躍升,以至于客戶寧愿出高價購買我們的下一代產(chǎn)品,也不愿低價購入上一代。Vera Rubin一旦上市,他們便會立刻切換。因為盡管價格更高,其創(chuàng)造的價值卻大得多。我之所以將這兩個系統(tǒng)放在一起比較,是因為它們已成為全球事實上的標(biāo)準(zhǔn)。在無法超越這兩個系統(tǒng)之前,購買其他產(chǎn)品毫無意義。然而想要超越它們難如登天,因為摩爾定律無法再賦予你35倍的性能提升,單靠制造更快的芯片已無濟(jì)于事,你必須打造出“海量的、速度更快的芯片群”。

作為推理之年,2025年我們也切實證明了自身在推理領(lǐng)域的領(lǐng)導(dǎo)力,從訓(xùn)練到后訓(xùn)練,再到推理,全面領(lǐng)跑。

去年我們還完成了另一件大事:大幅拓寬了平臺的模型覆蓋廣度。我們新增了對Anthropic的支持,這是全新的舉措;新增了對Meta Superintelligence Labs的支持,這是一個擁有全新計算需求的全新實體。眾所周知,去年開源軟件與開源模型真正迎來了爆發(fā)。時至今日,若按生成的Token總量計算,位列第一的是OpenAI,第二名是所有開源模型的總和,第三是Anthropic,第四是xAI。繼續(xù)梳理下去你會發(fā)現(xiàn),英偉達(dá)正是全球開源模型的最佳運行平臺,這也解釋了為何我們在如此龐大的基數(shù)之上,依然能實現(xiàn)加速增長。

最后我想強調(diào)一點:我們極為珍視與超大規(guī)模云廠商的合作關(guān)系,但這絕不僅僅是簡單的買賣關(guān)系。我們也在幫他們“獲客”。既然CUDA運行在他們的云端,就意味著所有CUDA開發(fā)者、AI原生初創(chuàng)企業(yè)以及與我們合作的大型企業(yè)都會隨之遷移。我們每推動一家大企業(yè)或初創(chuàng)公司落地,都會引導(dǎo)他們到某家云廠商處進(jìn)行托管。從某種意義上說,我們堪稱全球各大云廠商最頂尖的銷售團(tuán)隊之一。

你去展區(qū)看看就明白了:AWS的展位規(guī)模龐大,Google Cloud、Azure、Oracle、CoreWeave的展位同樣宏大。他們?yōu)楹螀R聚于此?正是為了向我們的開發(fā)者推銷產(chǎn)品。而我們的開發(fā)者只熟悉一種編程方式,那就是CUDA。當(dāng)他們完成開發(fā)并尋求落地時,自然會選擇入駐某位云服務(wù)提供商合作伙伴的云平臺。這便是我們與超大規(guī)模云廠商之間最真實的關(guān)系。

03拆解60/40客戶版圖:英偉達(dá)成了云廠商最好的銷售團(tuán)隊

最后,我想重點談?wù)効蛻艚Y(jié)構(gòu)的另一面。

我們與超大規(guī)模云廠商的合作固然緊密,貢獻(xiàn)了約60%的業(yè)務(wù)份額。但許多人忽視了另外的40%,即來自區(qū)域云、工業(yè)、企業(yè)及本地部署的龐大需求。戴爾、聯(lián)想、惠普正在快速增長,所有的ODM也在快速增長。這部分業(yè)務(wù),正在流向圖表右側(cè)的那40%。

這40%意味著什么?倘若沒有英偉達(dá)的全棧能力,沒有我們構(gòu)建完整“AI工廠”的實力,沒有全球所有開源平臺皆運行于英偉達(dá)之上這一鐵律,你根本無從觸及這片市場。左側(cè)那60%的份額中,很大一部分歸功于我們將開發(fā)者引流至云端;而右側(cè)這40%的陣地,如果僅僅是一家芯片制造商,絕對是100%無能為力的,因為這部分客戶不買芯片,他們買的是平臺。

不知我是否將這一信息傳達(dá)清晰了?準(zhǔn)確理解我們的業(yè)務(wù)結(jié)構(gòu)至關(guān)重要。我們將這一切深度整合,并統(tǒng)稱為“加速計算”。

明年我們可能會換一種方式拆分業(yè)務(wù),大概就像這張圖表展示的那樣:超大規(guī)模占60%,但請記住,其中很多客戶是我們帶上云的。右側(cè)那40%,只做芯片的公司永遠(yuǎn)夠不著。

一張幻燈片里塞滿了三重信息,可能讓大家有些應(yīng)接不暇。我本該將其拆分為三張的,盡管那樣演講可能會拉長到七個小時,但也絕對物超所值。

好了,就這些。謝謝。

以下為問答環(huán)節(jié):

04 OpenAI和Anthropic的收入,你們低估了

問:首先感謝你們提供這次交流機會。祝賀你和你的團(tuán)隊?,F(xiàn)在大家都理解了推理的重要性,但我認(rèn)為市場最大的疑慮是:投入到底值不值?超大規(guī)模企業(yè)能否通過API和云服務(wù)獲得足夠的收入增長,來證明當(dāng)前資本支出的合理性?我自己做了一些測算,目前他們的資本支出比云API收入高出20%。Jensen,你看到的情況是什么?你曾說過,你的客戶,尤其是那些支撐Anthropic和OpenAI的超大規(guī)模企業(yè),會帶來巨大的現(xiàn)金流上行空間。那么,我們什么時候能看到這些收入真正兌現(xiàn)?我知道這個問題對您而言略顯棘手,畢竟您還要兼顧對其他公司的指引。但如果我們能看到這種上行空間,市場對你們的信心會強得多,大家才會相信這種建設(shè)是可以持續(xù)的。那么,收入上行何時出現(xiàn)?我們怎樣才能更有信心?

黃仁勛:我多希望這些公司已經(jīng)上市,這樣大家就能真切地看到我眼中的景象了。縱觀歷史,從未有過任何一家未上市的初創(chuàng)企業(yè),能實現(xiàn)每周狂攬十億乃至二十億美元的營收增量。而他們當(dāng)下正在經(jīng)歷的,正是這種堪稱恐怖的量級增長。

記住我剛才說的是“每周”。整個IT軟件行業(yè)的規(guī)模約為2萬億美元。在我看來,這一行業(yè)不會被顛覆,而是將迎來徹底的重塑。我堅信,這2萬億美元IT版圖中的每一家企業(yè),都會將OpenAI、Anthropic及各大開源模型整合進(jìn)來,接入名為OpenClaw的開源軟件中。隨后,我們會將其打造為企業(yè)級版本,也就是NeMoClaw。借此,你瞬間便能擁有一個智能體。目前已有150萬人下載了OpenClaw并搭建了專屬智能體。只需寥寥一行代碼,當(dāng)你下達(dá)任務(wù)指令時,這個智能體便會自動展開學(xué)習(xí)與執(zhí)行。

未來,這些智能體會被整合進(jìn)整個IT行業(yè)。這個行業(yè)現(xiàn)在還是2萬億美元的軟件許可模式,但將來可能會變成8萬億美元規(guī)模。同時,他們還會轉(zhuǎn)售海量的Token。全球100%的IT公司,都將成為OpenAI和Anthropic的經(jīng)銷商。因此,請各位務(wù)必調(diào)高對OpenAI和Anthropic的估值預(yù)期。

我相信,Anthropic、OpenAI,當(dāng)然還有所有的IT公司,也會用開放模型來修改和定制自己的軟件。這就是英偉達(dá)開源大模型NeMotron的用途,這就是開發(fā)與部署平臺NeMo的用途。我們創(chuàng)建了所有這些工具,這就是為什么我們和每一家公司都在合作。他們都會去創(chuàng)建整合了這三個組件的智能體。我相信他們會以難以置信的速度增長。這個時刻很快就會到來,因為你可以從Anthropic和OpenAI的數(shù)字里看到,他們不是在普通地增長,他們在一個月內(nèi)就能增長出一家完整的IT公司。

這些AI公司的營收模式在于:其能力一部分將由企業(yè)直接采購使用,另一部分則會通過IT公司分銷,深度嵌入到IT企業(yè)的產(chǎn)品線中。因為AI本身就是軟件。他們的軟件可以直接提供給企業(yè),也可以被集成、被定制,變成特定領(lǐng)域的、受管控的、安全的、易于配置的智能體系統(tǒng),連接到企業(yè)的核心系統(tǒng)。然后這些智能體系統(tǒng)會被租給客戶,而客戶在使用過程中,仍然需要通過AI工廠來消耗Token。無論這些Token來自O(shè)penAI、Anthropic還是開放模型,都需要被生成出來。

歸根結(jié)底,傳統(tǒng)的IT公司售賣的是軟件授權(quán),而未來的IT企業(yè)出租的將是Token。他們的商業(yè)模式必將重構(gòu),企業(yè)體量將進(jìn)一步膨脹,毛利率結(jié)構(gòu)亦將隨之改變,因為如今他們的成本核算中加入了Token這一銷貨成本,但相應(yīng)地,他們所能提供的價值也呈幾何級數(shù)躍升。對他們而言,這無疑是令人振奮的時代機遇。

05 40%會變成70%:物理AI的萬億市場

問:我想聊聊那張60/40圖的演變。你昨天談到了NeMo,又發(fā)布了Vera Rubin DSX AI工廠參考設(shè)計,這基本上是為非超大規(guī)??蛻籼峁┝艘粋€藍(lán)圖,讓他們有能力與超大規(guī)模企業(yè)競爭。當(dāng)你把所有這些東西整合在一起,看到Token生成量的大幅飆升,你預(yù)計這張圖會如何演變?我們該怎么看待不同參與者的發(fā)展方向?

黃仁勛:我認(rèn)為該圖表的左右兩側(cè)均會保持增長,且在未來幾年內(nèi)增速將基本持平,直至物理AI的拐點真正降臨。

一旦跨過那個拐點,工業(yè)端的計算處理就必須轉(zhuǎn)至本地,必須在邊緣側(cè)、在業(yè)務(wù)現(xiàn)場、在生產(chǎn)車間內(nèi)完成。到那時,那40%很可能會開始加速增長。我甚至認(rèn)為,最終那40%會變得更大,因為與物理AI相關(guān)的全球工業(yè)規(guī)模,遠(yuǎn)比與數(shù)字AI相關(guān)的規(guī)模大得多。

全球工業(yè)領(lǐng)域有高達(dá)70萬億美元的經(jīng)濟(jì)活動亟需物理AI的深度介入,因為世界的運轉(zhuǎn)并非僅僅局限于我們的筆記本電腦屏幕內(nèi),而是實實在在地發(fā)生于廣袤的物理空間中。大量與原子相關(guān)的業(yè)務(wù),沒有物理AI根本處理不了。因此我堅信,也熱切期盼著,那40%的份額最終能攀升至70%。

但無論比例如何變化,兩邊都會變得極其巨大。因為這個世界將進(jìn)入一個狀態(tài):每天、每時每刻都在持續(xù)不斷地生產(chǎn)Token,永不停歇。就在我們說話的這會兒,我們所有的筆記本電腦都在持續(xù)運轉(zhuǎn),希望你們大部分人的電腦都處于閑置狀態(tài),但在未來,計算機會24小時不間斷運行,持續(xù)創(chuàng)造Token。因為你的智能體們正在替你工作。

我曾瀏覽過一篇Reddit帖子,發(fā)帖人的Claw智能體一天內(nèi)竟消耗了5000萬個Token。聽起來猶如天文數(shù)字,但折算下來不過區(qū)區(qū)50美元。倘若你手下有一個智能體正在從事極具生產(chǎn)力的工作,這50美元簡直微不足道。你完全可以讓一位日薪數(shù)千美元的精英,統(tǒng)領(lǐng)一支龐大的智能體大軍,為每個智能體分配50美元的日預(yù)算,從而將生產(chǎn)力推向極致。這一場景很快便會司空見慣。

在英偉達(dá),我們已然付諸實踐。對于那些我每天支付數(shù)千美元薪酬的員工,我巴不得他們每天消耗的Token遠(yuǎn)超50美元。我期望他們能運籌帷幄,管理一整支智能體編隊來代勞繁雜任務(wù)。說實話,我真心期盼一位日入2000美元的干將,每天能豪擲1000美元在Token消耗上。這絕非天方夜譚,此時此刻全球各地的軟件公司里,這一切正在真實上演。

06解密推理光譜:Groq不是來取代,是來補位的

問:你們談過Rubin會在下半年開始出貨,Groq聽起來像是在第三季度推出。那么,我是否可以認(rèn)為Rubin應(yīng)該和Groq一起推出?因為我不認(rèn)為Groq是獨立存在的。然后,我想問一個更長遠(yuǎn)的問題。我真的很喜歡你們前幾天放出的那張圖,它在我看來幾乎是展示了推理光譜的延伸,這為Groq創(chuàng)造了價值。你過去常說GPU是唯一的出路,我們現(xiàn)在看到像Groq這樣的架構(gòu)是必要的,以便利用不斷擴(kuò)大的推理光譜,低延遲變得更加重要。我想知道的是,你如何看待這個光譜從今往后的演變?你的平臺現(xiàn)在是否擁有了未來幾年所需的所有組件?展望未來,隨著推理的發(fā)展,會出現(xiàn)哪些新型的工作負(fù)載?你是否擁有抓住這些機會所需的所有組件?

黃仁勛:謝謝你對Groq和LPDDR的提問。我們確實溝通過,Groq也會在今年下半年開始出貨,具體時間臨近時再看,但確實是在今年。你可以說Groq在第三季度出貨,我昨天確認(rèn)了,這是我們的預(yù)期。但我要說明一點:Vera Rubin會在Groq之前出貨。原因是我們已經(jīng)在生產(chǎn)Vera Rubin了,系統(tǒng)已經(jīng)在生產(chǎn)線上跑著。Vera Rubin本身便難以逾越,即便對手是Groq亦是如此,哪怕將Groq與Vera Rubin強強聯(lián)手,想要擊敗純粹的Vera Rubin也并非易事。

在計算架構(gòu)領(lǐng)域,大致可劃分為兩大流派:一派追求極致的低延遲,另一派則主攻極高的吞吐量。事實上,CPU本質(zhì)上就是一臺低延遲計算機,看看其芯片上的緩存規(guī)模便知,幾乎全由SRAM構(gòu)成。而Groq正是此類架構(gòu)的極端化產(chǎn)物:SRAM幾乎霸占了整塊芯片,任務(wù)調(diào)度完全依靠靜態(tài)完成,由編譯器精準(zhǔn)測算數(shù)據(jù)與計算指令的位置,確保它們“如期相遇”。整個Groq系統(tǒng)猶如一臺龐大的同步機器,這賦予了它極強的確定性與極低的延遲。然而代價也顯而易見:編程門檻高、缺乏靈活性,且并非面向通用計算。

因此我們所做的是采用了Vera Rubin,正如昨天我所描述的,它占據(jù)了大約四分之三的空間。Vera Rubin是正確的答案。我們不知道如何使它變得更好。如果我們知道如何讓它變得更好,我們就會去改進(jìn)它。NVLink 72以及Vera Rubin Ultra NVLink 144、Feynman NVLink 1152,我們會繼續(xù)擴(kuò)大左側(cè)那個高吞吐量至關(guān)重要的區(qū)域的范圍。同時,我們會把Groq加進(jìn)來,與Vera Rubin融合,與我們的GPU融合,用Groq來處理自回歸模型的最后一個階段,也就是語言模型中那個對帶寬要求極高的最后階段。如果我們把一大堆SRAM聚集起來,比如數(shù)千個Groq芯片,比例大概是8比1。

所以,對于最后25%的功耗以及最后25%的用例,我們都在用ChatGPT,但我們以不同的方式使用它,我們有不同的定價層級。因為你的數(shù)據(jù)中心有各種各樣的用例,不是只有一種。我們都在我那張圖里的不同波段中。我展示了零級、免費級、好、更好、最好、極致版本。對于免費、好、更好這幾個層級,Vera Rubin是無敵的,我們想不出任何接近的東西。而對于最好和極致,加上Groq,你可以提高最好層的吞吐量,甚至把極致層推得更遠(yuǎn)。

“極致”層級開辟了一片全新市場,但受制于吞吐量曲線,其受眾規(guī)模注定極小,你無法指望需求量呈爆發(fā)式增長,因此必須輔以極高的定價策略。然而,一個全新的高凈值客戶群已然浮出水面:那些身價不菲的資深軟件工程師。其自身的人力成本本就極為高昂,若我每天再為他們增加100美元的推理與Token成本,我也甘之如飴。哪怕在項目攻堅期暴增1000美元,他們同樣樂見其成。我描述的是一個正在成熟的市場里正在發(fā)生的事情。

在市場莽荒期,沒人確切知曉該如何駕馭這項技術(shù),技術(shù)本身亦不夠成熟,用戶根本無法做到精準(zhǔn)施放。100%的早期推理客戶都在免費層。但隨著技術(shù)開始達(dá)到o1和o3水平,付費層突然飆升,因為人們現(xiàn)在能用它來做有用的事情了。然后當(dāng)智能體出現(xiàn)時,比如云代碼、Codex,那些Token比免費層貴得多,也比每月20美元貴得多。所以我們剛剛增加了兩個細(xì)分市場。

這和iPhone沒什么不同,起初只有一個版本,現(xiàn)在有很多版本。和汽車行業(yè)沒什么不同,和任何行業(yè)都沒什么不同。隨著市場擴(kuò)大,細(xì)分市場也在擴(kuò)大。

我展示的是一個能夠生產(chǎn)不同細(xì)分市場和不同層級Token的工廠:從非常聰明、極其快速,到高吞吐量的免費層。這描述的是一種AI工廠架構(gòu),允許你覆蓋所有需求,最終最大化工廠的總收入。我們讓你自己決定如何搭配組合。

我的估計是,現(xiàn)在大概有25%的市場,主要針對少數(shù)幾家公司,你需要是其中之一,你需要生成大量Token才值得這么做。然后還有一大批所謂的推理服務(wù)提供商、API服務(wù)提供商,我認(rèn)為他們也可以從中受益,因為他們希望有不同的Token生成細(xì)分市場。所以我稱之為一個由10家客戶組成的群體,其中那25%的客戶代表了那個蛋糕的很大一部分。通過Groq,我們可以把那25%的蛋糕的總收入提高2倍。

問:隨著你繼續(xù)推出新版本的Groq,新一代產(chǎn)品會對市場產(chǎn)生什么影響?你是把那個邊界推得更遠(yuǎn),還是降低成本并增加需求?

黃仁勛:我們始終在雙線并進(jìn):一方面不斷拉升各個層級的吞吐量上限,另一方面持續(xù)拓寬AI的智能邊界。各位留意到那張帕累托圖了嗎?我始終在將其向上推舉。剛才我向大家演示了從Hopper、Blackwell到Vera Rubin的代際演進(jìn),每一次架構(gòu)迭代,我都在將其向上推、向外拓。

每當(dāng)我向上推,你的工廠在同等價格點上的產(chǎn)量就會增加。每當(dāng)我向外推,你就可以引入全新的AI層級、全新的Token層級,從而獲得全新的價格點?,F(xiàn)在的價格點大概是每百萬Token 6美元左右。但我知道,大家都希望看到每百萬Token 50美元的產(chǎn)品,那是超大模型、超快速度的層級。你能想象一個10萬億參數(shù)的模型,以每秒500個Token的速度運行嗎?我們的工程師會為此付出大價錢,我也會讓我的工程師為此付出大價錢。那個世界很快就會到來,然后明年還會再來,因為模型會變得更大,它們會思考得更多,會使用更多工具。

這就像早年的Nvidia。不知道你們有多少人記得,我們最初只有一個產(chǎn)品:Riva 128,299美元,就這一個SKU。那些美好的舊時光。然后今天我們有了5090、5080兩個不同的SKU,5070更是分出了三個。所有這些SKU的出現(xiàn),是因為市場變大了,開始出現(xiàn)細(xì)分,人們想要不同的東西。

Token市場也完全一樣。它正變得越來越大,不同的細(xì)分市場想要不同的東西。所以我需要幫助我們的客戶、幫助我們的模型制造者,為不同的細(xì)分市場制造不同的Token。我知道它們看起來只是數(shù)字,但它們是不同的AI。

所以答案是:我們將同時提高吞吐量并提高他們的定價。這就是Vera Rubin帶來的好處,我們每一代都是這樣做的。我們用Blackwell做到了,用Vera Rubin做到了,用帶Groq的Vera Rubin也會做到,用Vera Rubin Ultra同樣會做到。我們會持續(xù)不斷地突破那個邊界。

最終,簡單來說,就是那張帕累托圖。一個工廠要處理大量不同的工作負(fù)載和不同的客戶,我們希望不斷地把帕累托前沿向外推、向上推,不斷地向外、向上。而要做到這一點所需要的計算機科學(xué),是所有問題中最難的。

07 1萬億之外的1.25萬億:Groq、CPU、存儲的增量空間

問:我有兩個相關(guān)的問題。第一,在1萬億美元之外,昨天你還談到了其他產(chǎn)品:Vera CPU、其他CPU、Groq、存儲解決方案、CPX。這些增量有多少?沒有包含在這1萬億里的可尋址市場有多大?我假設(shè)它們對這1萬億是增量。第二,我想更深入了解Groq。你提到它將占據(jù)推理的25%,這是個相當(dāng)重要的聲明。它是在蠶食什么嗎?隨著時間的推移,Groq的價值捕獲是怎樣的?很多人問我們,它是否會蠶食高帶寬內(nèi)存的需求?

黃仁勛:首先,今天全球只有我們一家公司能夠在一個AI工廠里,同時優(yōu)化和整合三種內(nèi)存架構(gòu):HBM內(nèi)存是我們第一個使用LPDDR5的公司,它具有極高的帶寬和極低的功耗,這徹底改變了CPU的游戲規(guī)則;第三種是SRAM。我們現(xiàn)在可以利用所有這三種內(nèi)存類型,來打造真正完美的架構(gòu)。

過去,我們只有一個機柜產(chǎn)品:NV Link72 Grace Blackwell。現(xiàn)在我們有了五個機柜。NVLink 72的設(shè)計目標(biāo)就是運行各種大型語言模型,我們所有的推理棧都在上面跑。但你要理解智能體系統(tǒng)是什么,它正在運行的東西比如Claude Code現(xiàn)在做的,比如Codex現(xiàn)在做的。這些系統(tǒng)的內(nèi)存需求進(jìn)入了KV緩存,那是在STX系統(tǒng)上處理的。這個內(nèi)存增長得實在太快了,必須被加速。我們運行時占用的內(nèi)存越多,能解決的問題就越難。這涵蓋了結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),正是我在主題演講開篇所提及的cuDF與cuVS。過去鮮少有人談及這些底層架構(gòu),但其未來的商業(yè)價值無可估量,因為智能體的處理速度遠(yuǎn)超人類,它將以更為狂暴、迅猛的姿態(tài)瘋狂吞吐這些數(shù)據(jù)。

然后是工具使用,比如網(wǎng)頁瀏覽器。網(wǎng)頁瀏覽器運行在CPU上,所以你需要一個CPU來讓智能體訪問工具。然后它會衍生出子智能體:其中一個可能是Co-opt,由GPU加速;另一個可能是Omniverse,同樣由GPU加速。所以我們在數(shù)據(jù)中心里需要那種GPU。

所以,理解Vera Rubin的正確方式是:Vera Rubin作為一個系統(tǒng),它的能力被極大地擴(kuò)展了,我們從處理那90%的工作負(fù)載擴(kuò)展到了處理所有這些任務(wù)。這就是AI。這是ChatGPT開始的地方,但這是它現(xiàn)在所處的位置。

這就是一個智能體。那么,剛剛在我們的數(shù)據(jù)中心里發(fā)生了什么?畢竟,沒人希望數(shù)據(jù)中心被東拼西湊成“科學(xué)怪人”般的縫合怪,它渴求的是極其優(yōu)雅的供電與液冷系統(tǒng)。所以我們把所有這些計算機都放進(jìn)了MGX機柜,為其中每一個組件都設(shè)計了完美的處理器,然后直接裝上機架。如果你要把存儲放進(jìn)去,如果你要把那東西放在和計算同一條走廊的東西向網(wǎng)絡(luò)上,你最好別搞成弗蘭肯斯坦那樣。你不能一邊用著液冷的NVLink 72機柜,另一邊用著風(fēng)冷的;不能這里用300千瓦,那里用50千瓦。所以我們把所有這些統(tǒng)一到一個單一的機柜架構(gòu)里。如果你想建一個能運行那個智能體的集群,你只需要把它們?nèi)窟B接起來:同樣的供電,同樣的冷卻系統(tǒng),全部100%液冷,全部針對工作負(fù)載做了完全優(yōu)化,全部完全加速。

所以回到你的問題。為了運行這個智能體,為了提供我們剛才討論的所有這些東西,你的資本支出會增加,你的GPU計算支出會增加25%。你把Groq加到那25%的工作負(fù)載里,你購買八倍數(shù)量的芯片,價格大概和NVLink 72機柜差不多。所以25%乘以2,就是25%的增量?對,你的計算支出增加了25%。這是第一點,而這部分不在那1萬億美元里面。所以如果那1萬億美元中的100%都加上Groq,那就變成1.25萬億美元。

然后我們還有存儲。這個量很大,因為世界上存儲量本來就很大,它是第二大計算支出。第三是用于工具使用的CPU,但我不預(yù)期CPU會占很多,大概5%左右。所以如果你要問,Grace Blackwell機柜和Vera Rubin機柜之間的全部差異,如果它增加了另外50%的機會,我認(rèn)為這很可能差不多。

這就是Grace Blackwell上市和Vera Rubin上市的根本區(qū)別:在Grace Blackwell時代,我們要解決的是推理,我們要成為推理之王;而Vera Rubin,我們解決的是這個。這就是為什么我說OpenClaw是完全變革性的,終于我們有了一個統(tǒng)一的軟件可以運行在這整個架構(gòu)上,一個開源軟件。它就是這張圖的操作系統(tǒng)?,F(xiàn)在,世界上的每一家公司都可以去構(gòu)建這個了。

問:能談?wù)勀銈內(nèi)绾问褂矛F(xiàn)金來建立業(yè)務(wù)戰(zhàn)略優(yōu)勢嗎?你們在投資生態(tài)伙伴,有組件的采購承諾,也在向股東返還現(xiàn)金。你們?nèi)绾纹胶膺@些優(yōu)先事項?

黃仁勛:優(yōu)先事項必須這樣安排:第一,必須為我們的增長提供資金。我們與供應(yīng)鏈的合作非常緊密,我們今天與供應(yīng)鏈的關(guān)系處于良好狀態(tài)是有原因的,因為我們和他們進(jìn)行非常長期的合作。我們幫助他們規(guī)劃業(yè)務(wù),把業(yè)務(wù)授予他們來支持他們的增長,我們甚至?xí)A(yù)付款項,有時甚至?xí)Y助他們擴(kuò)充產(chǎn)能。我們正在為未來幾年那超過1萬億美元的需求做準(zhǔn)備。

第二,我們投資于我們的生態(tài)系統(tǒng),因為CUDA開發(fā)者和這個階段AI原生公司的增長非常重要。在這之后,我們?nèi)匀粫a(chǎn)生大量的自由現(xiàn)金流。這個問題我讓CFO科萊特·克雷斯(Colette Kress)來回答。

克雷斯:隨著我們未來1萬億美元的強勁增長,這自然為我們的自由現(xiàn)金流創(chuàng)造了非常有利的局面。黃仁勛剛才也提到了一些關(guān)鍵點:首先,我們要確保供應(yīng)商以及構(gòu)建所需的一切都井然有序,這當(dāng)中可能涉及一些預(yù)付款。其次是我們?nèi)栽诼男械耐顿Y承諾,這些是去年做出的,需要今年上半年完成。一旦我們把這些事情推進(jìn)并落實,我們就有機會進(jìn)行股票回購,把重心真正放在向股東返還資本上。這依然是我們接下來工作的重要部分。去年我們做得不錯,在向股東返還資本這件事上,今年我們也會交出出色的成績。

關(guān)于資本返還,我們現(xiàn)在討論的情況,還沒有把那個“加號”考慮進(jìn)去。如果不算那個“加號”,我們目前的計劃是:將自由現(xiàn)金流的50%用于股票回購和股息加總。這是我們現(xiàn)在的起點。但那個“加號”是真實存在的,它會給我們帶來額外的機會,讓我們有能力做得更多。至于具體的時間安排,需要考慮的是,我們今年上半年還有一些現(xiàn)有的承諾需要處理。但請保持關(guān)注。

08利潤率問題的正面回?fù)簦嘿I便宜的設(shè)備,還是賺更多的錢?

問:有人認(rèn)為你們從生態(tài)系統(tǒng)中獲取了太多價值,長期來看無法維持這樣的利潤率。你如何回應(yīng)這種擔(dān)憂?我知道你在網(wǎng)上也看到一些關(guān)于"必須投資生態(tài)系統(tǒng)"的評論,有些人用消極的方式解讀。你能談?wù)勀銈內(nèi)绾尉S持利潤率嗎?

黃仁勛:首先,我昨天告訴大家的幾乎都是全新的視角。每個人都必須理解Token經(jīng)濟(jì)學(xué)。這個世界需要重新認(rèn)識:計算機已經(jīng)變成了什么。如果我們能持續(xù)每年交付每瓦每秒Token數(shù)量的成倍增長,如果我們能持續(xù)通過引入新的Token細(xì)分市場,讓客戶的平均售價也成倍增長,那客戶有什么理由不繼續(xù)和我們合作?

還有一點,我以前也說過,這在數(shù)學(xué)上絕對清晰。我會挑戰(zhàn)每一家云服務(wù)提供商的CEO,讓他們?yōu)樽约寒嫵瞿菑垐D,我會幫他們畫。然后你選你最喜歡的其他配置,無論是第三方芯片還是自研芯片,忠實地把它放進(jìn)那個模型里。然后你自己決定:你是想要更高的收入,還是更低的?想要更高的平均售價,還是更低的?想要更高的利潤率,還是更低的?這才是全部的意義所在。

臺積電的晶圓堪稱全球最貴,但其性價比同樣冠絕全球,我極其樂意為此買單。ASML的系統(tǒng)造價不菲,但絕對物超所值,這毫無爭議。所以問題很簡單:你是想賺更多錢,還是想買最便宜的設(shè)備?

我剛才拋出的本質(zhì)上是一個前沿概念:我將計算機系統(tǒng)視作臺積電的晶圓廠,視作ASML的光刻機來對待。而在過去,人們的認(rèn)知并非如此。如果我有兩個CPU,一個是256核,另一個也是256核,哪個更好?更便宜的那個更好,因為我按核租賃。但Token不是這樣創(chuàng)造的。你不是按核租賃,你是通過每秒Token數(shù)量來實現(xiàn)收益的。這是一種完全不同的經(jīng)濟(jì)模式,你不是在租核心,不是在租節(jié)點,你是在生產(chǎn)Token。這就是為什么一切都變了。

任何散布此類言論的人,純粹是外行。他們滿腦子只想采購最廉價的設(shè)備?!拔业脑O(shè)備便宜30%”,但這筆賬算到整座工廠頭上,究竟意味著什么?這才是觸及靈魂的拷問。如果有人跑來向你推銷“我的芯片便宜50%”,請務(wù)必將這番話置于“AI工廠”的宏大語境下審視,這番說辭恰恰暴露了他對AI的一竅不通。

問:你昨天幾次提到,預(yù)計到2027年產(chǎn)能都會緊張。能詳細(xì)說明一下你具體在哪里看到這些短缺嗎?另外,你稱自己為“首席收入破壞者”,微軟CEO薩蒂亞·納德拉也評論過說不想過度依賴某一代產(chǎn)品,因為知道很快就會有下一代。這種行為是微軟獨有的嗎?這些限制是否反而保護(hù)了您的其他客戶?還是說他們也持有類似的心態(tài)?

黃仁勛:納德拉也會告訴你這話是誰跟他說的,是我告訴他的:買你今年需要的,因為明年會有更好的。我不希望你們過于細(xì)致地揣測我們的用詞。

世界在某種程度上是否供應(yīng)緊張?是的。我們可以達(dá)成共識,說相反的話反而奇怪。世界上汽車緊張嗎?你看到汽車了,但如果我把需求提高三倍呢?一切都某種程度上是緊張的,這完全取決于具體情況。

因為我們建設(shè)的規(guī)模如此之大,我們的生活并不簡單。我們正在多個維度上與多個供應(yīng)商合作,確保一切和諧運轉(zhuǎn)。不能太多,不能太少,要能夠滿足我們的需求甚至更多。我們想要滿足需求甚至更多,是因為未來21個月總有新需求出現(xiàn)。我還有很多新需求要來,所以我必須為此做好準(zhǔn)備。這里有各種各樣的參數(shù),并不簡單。如果我告訴你們我們在某個特定項目上供應(yīng)緊張,那我知道你們接下來會做什么了。

所以我認(rèn)為系統(tǒng)是和諧的:沒有太多,也沒有太少。我們沒有太多電力,也沒有太少電力。我們沒有太多建筑工人,也沒有太多水管工。我們沒有太多電纜,也沒有太少光模塊。就是剛好差不多。我們會每天努力維持這種平衡。但那一萬億美元訂單,我們是可以滿足的。

問:我收到了很多關(guān)于昨天演示的問題:CPO從哪里開始,銅纜到哪里結(jié)束?你概述了NVLink 576,有一張幻燈片上還有NVLink 1152。所以我很好奇你目前關(guān)于同時提供這兩者的想法,以及隨著我們擴(kuò)展到Vera Rubin Ultra,這會如何演變?

黃仁勛:首先,請善待我的合作伙伴們,他們都做得很好。我這里說的任何話都不意味著他們的業(yè)務(wù)會走向另一條路,他們所有的業(yè)務(wù)都會因為我們而增長。我們會讓銅纜業(yè)務(wù)增長,也會讓光模塊業(yè)務(wù)大幅增長。我說的有沒有完全合乎邏輯?答案是肯定的。讓我告訴你為什么。

我們應(yīng)該盡可能用銅纜擴(kuò)展,能撐多遠(yuǎn)就撐多遠(yuǎn)。但在一米左右,銅纜有其物理極限。你們已經(jīng)看到我們從NVLink 72發(fā)展到現(xiàn)在的Rubin Ultra NVLink 144,背板設(shè)計就是為了支持這一點。我們會繼續(xù)研究,如果能從144擴(kuò)展到288,我們非常樂意這么做,因為你應(yīng)該盡可能使用銅纜。銅纜更容易制造,更可靠,人類制造和使用銅纜已經(jīng)很長時間了。

這道理好比呼吸空氣:只要條件允許,你就應(yīng)該大口呼吸自然空氣,直到氧氣耗盡。在那之后,你或許不得不依靠壓縮液態(tài)空氣續(xù)命。但在此之前,自然空氣不僅免費,而且極其安全。

所以第一原則是:盡可能用銅纜擴(kuò)展。如你們所知,我們也把以太網(wǎng)帶到了結(jié)構(gòu)化電纜背板,這是增量的增長機會。我們要把以太網(wǎng)的背板變成這些脊柱,因為這些結(jié)構(gòu)化電纜非常容易使用?,F(xiàn)在我們掌握了如何制造和使用的技術(shù),我們可以創(chuàng)造這些東西,使其容易維護(hù),容易運輸,容易布線,不會出錯。

然而,同時我們想擴(kuò)展到72以上,到144,到1152,甚至未來可能更遠(yuǎn)。銅纜能走多遠(yuǎn)是有限度的。所以你可以看到這樣的演進(jìn)路徑:目前是100%銅纜。下一代Ultra會有兩個選擇:你可以用銅纜,或者銅纜加CPO。這是從現(xiàn)在起一年后。兩年后,到1152,就全是CPO了,因為銅纜的物理距離極限到了。所以會有一個自然的過渡。

但即使當(dāng)NVLink變成了CPO,Spectrum X也變成了CPO,我們在機架上的以太網(wǎng)scale-up仍然會使用銅纜,我們的存儲也仍然會使用銅纜。因為我們有五個不同的機柜。所以銅纜的使用量會繼續(xù)維持在高位,因為即使scale-up在兩三年后轉(zhuǎn)向CPO,隨著所有其他機柜的需求和總產(chǎn)能持續(xù)增長,銅纜連接器的總消耗量也會持續(xù)增長。

09細(xì)分市場的終局猜想:法拉利沒有免費版,Token也一樣

問:你之前談到Token成本,聽到高端占25%非常有幫助。你如何看待市場隨時間演變,低端或免費層與高端層的增長率會如何?在一個以Token成本大幅下降為前提的市場中,你認(rèn)為這一趨勢會如何發(fā)展?是否會開始放緩或趨于平緩?

黃仁勛:Token成本會持續(xù)下降,每年都在下降。從Grace Blackwell到Rubin,Token成本會再次下降,Rubin Ultra還會繼續(xù)下降。與此同時,每個Token背后的智能程度,會隨著我們把那條曲線向右推而持續(xù)上升。同時,我們會不斷提高吞吐量。

這一切都繞不開一個核心命題:任何人都不應(yīng)盲目盯著“每秒Token數(shù)”看,你必須始終將其與功耗相除進(jìn)行歸一化。邏輯很簡單,你的數(shù)據(jù)中心容量存在物理天花板。你的數(shù)據(jù)中心是一個吉瓦,你不會有第二個;如果是200兆瓦,你也不會有第三個。所以你必須始終將其歸一化到功耗。否則,你無法比較任何架構(gòu)。摩爾定律也總是要除以某個東西。所以你必須看的是:每瓦每秒Token數(shù)。任何向你兜售其他衡量標(biāo)準(zhǔn)的人,要么是AI門外漢,要么就是心懷鬼胎。這正是SemiAnalysis(半導(dǎo)體研究機構(gòu))之所以能看透本質(zhì)的原因,一切指標(biāo)都必須歸一化至單位功耗。

我們將不斷提高吞吐量。所以無論Token價格是多少,無論平均售價是多少,我們都在提高吞吐量。同時,無論那個細(xì)分市場是什么,我們都在降低成本。下端基本上是你們的細(xì)分產(chǎn)品市場,那是吞吐量、產(chǎn)量、成本的問題。這就是為什么這兩條曲線如此重要。現(xiàn)在我把這兩條曲線結(jié)合在一起,這條曲線本質(zhì)上就是帕累托前沿。

目前世界大部分地區(qū)還在這里,這是Hopper的世界。Blackwell把它擴(kuò)展了,并增加了一些新的細(xì)分市場。這非常有價值,因為這里和這里的平均售價差異可能達(dá)到5倍、10倍,模型更大,速度更快。

那么我如何看待需求曲線的變化?昨天我用了25%在這里,25%在這里,25%在那里,25%在另一邊。但一個制造商的不同產(chǎn)品細(xì)分市場的分布,完全取決于具體情況。法拉利全是高端,沒有免費層;而其他品牌則完全不同。我認(rèn)為這里也一樣。

如果你的業(yè)務(wù)是搜索,你主要會在免費層,因為沒人會為搜索付費。如果你是代碼生成、智能體代碼,你會大量集中在這里。如果你的客戶是企業(yè)員工,平均工資可能是5萬或7萬美元,你可能在這里,你希望你的產(chǎn)品定價也在相應(yīng)的位置。這取決于你的客戶、你為他們做的工作,以及競爭格局。AI Token是一種產(chǎn)品,一種新商品,它會以這種方式被營銷。不同的供應(yīng)商、不同的品牌、不同的目標(biāo)市場,會有完全不同的形狀分布。我昨天只是隨便選了一個平均分布做示例。

問:你認(rèn)為未來哪個細(xì)分市場增長更快?

黃仁勛:目前它們都會增長得非常快,都在呈指數(shù)級增長。我們還處在開始階段,增長率是被一個很小的基數(shù)相除后得到的結(jié)果。

問:我們的實地調(diào)研告訴我們,AI工程師對狀態(tài)空間模型感到興奮,因為它們解決了內(nèi)存需求問題。在主題演講中,你展示了NeMotron 3在頂級模型中的基準(zhǔn)測試,我相信那是一個混合了混合專家和狀態(tài)空間的模型。智能體AI是否創(chuàng)造了對新AI模型的需求?這就是你通過NeMotron和混合模型所做的嗎?狀態(tài)空間為NeMotron 3帶來了什么,是純混合專家模型沒有的?如果發(fā)生向新型AI模型的轉(zhuǎn)變,這對Nvidia的競爭環(huán)境有何影響?

黃仁勛:我們運行所有AI模型,無論是純Transformer、離散Token、連續(xù)模型、擴(kuò)散模型、狀態(tài)空間模型,還是混合模型。我們架構(gòu)的美妙之處在于,它能處理所有模型。舉個例子,Groq做不了擴(kuò)散模型,但我們什么都能做。我之所以拿Groq開玩笑,絕非刻意針對,畢竟它現(xiàn)在已歸我麾下。只是客觀而言,每種架構(gòu)都各有其主戰(zhàn)場。

英偉達(dá)之所以如此全能,之所以被如此廣泛地自由使用,是因為無論你的研究科學(xué)家明天想出什么創(chuàng)新,我向你保證:它在CUDA上會運行得很好。原因很簡單,我們擁有執(zhí)行所有這些任務(wù)所需的所有計算元素。

NeMotron 3的設(shè)計初衷,是為了讓你能夠處理極長的上下文。將來,你與你的AI的對話,希望能持續(xù)你的一生。所以問題來了:如何處理上下文?如何處理相關(guān)的對話記憶?一方面,如果你記住了所有東西,隨著時間的推移,我們談?wù)撨^很多事情,當(dāng)記憶太多時,你該調(diào)用哪個版本?可能會變得混亂。這些都是研究的前沿領(lǐng)域。

但我認(rèn)為,混合架構(gòu)將是一件非常重要的事情。因為它允許你處理極長的上下文,而不必遭受計算量二次爆炸的痛苦。這就是我們發(fā)明它的原因。我們把它開源,希望每個人都能使用它。它的目的就是推動AI進(jìn)步,而不是與任何人競爭。我們只是想推動AI向前發(fā)展。

問:我想試著理解你下游的AI市場目前有多集中,以及未來會如何演變。你那張圖顯示60%是超大規(guī)模企業(yè)。但我感覺另外40%里,大部分是二級云提供商,而他們中的很多人實際上是在把產(chǎn)能轉(zhuǎn)售或租賃給超大規(guī)模企業(yè)或前沿實驗室。所以如果把超大規(guī)模企業(yè)和前沿實驗室合在一起,可能80%的實際基礎(chǔ)設(shè)施使用者都在里面了。而這些模型,比如Anthropic的模型、OpenAI的模型,似乎只有極少數(shù)真正處在最前沿。你認(rèn)為這是對今天情況的準(zhǔn)確描述嗎?你如何看待這種情況的演變?這對價值鏈上的賺錢能力、發(fā)展方向以及AI的進(jìn)一步加速意味著什么?

黃仁勛:我會把它拆成三個維度來看。

第一個維度是:最終運行的是什么模型?我之前說過,OpenAI是最大的,第二大類是所有開放模型的總和,絕對穩(wěn)居第二,第三是Anthropic,然后依次往下排。長尾其實相當(dāng)長。所以如果你看模型消費的世界,哪怕只看語言模型,也應(yīng)該這樣思考。我們運行所有這些模型,我們參與其中每一個。

在這個模型的子維度里,你還必須加上物理AI模型,也就是機器人技術(shù)。你看到的所有機器人,它們運行的是視覺模型、語言模型、動作模型。這些和純語言模型完全不同。舉個例子,控制電機是連續(xù)的,不是離散的“點、點、點”;物理世界是連續(xù)的,生物學(xué)里的基因組遵循的是幾何規(guī)律。所以有很多不同類型的模型。但重點是,你首先要搞清楚正在運行的是哪些類型的模型,這有助于你思考如何開展業(yè)務(wù)。

第二個維度是:根據(jù)公司的結(jié)構(gòu)、意圖或利益,計算的位置在哪里?他們是想要自研芯片的公司,那我們必須和他們競爭?他們是想要在自己的云里托管Nvidia客戶的公司,顯然CUDA只在Nvidia上運行?他們是像NCPs這樣的公司,他們不能只買芯片,他們真的需要買系統(tǒng),所以他們是真正的基礎(chǔ)設(shè)施客戶?還是那些想要本地部署的公司?因此,我們的分銷渠道需要通過戴爾、惠普和聯(lián)想,因為必須整合一大堆其他企業(yè)計算組件,而戴爾和惠普不自研芯片?;蛘呤窃谶吘墸苍S是無線網(wǎng)絡(luò)、機器人系統(tǒng)、自動駕駛汽車,甚至是衛(wèi)星?現(xiàn)在你得決定計算在哪里進(jìn)行。

當(dāng)你把這些全部細(xì)分完之后,再回到我展示的那張60/40圖。在那40%里,他們本質(zhì)上需要的是計算平臺。不管他們運行什么模型,可能是OpenAI的模型,可能是Anthropic的模型,Nvidia支持機密計算,這讓OpenAI和Anthropic有可能在右側(cè)那部分運行。那一邊,他們想要完整的平臺,想要機密計算,想要在世界不同地方部署計算機,而不僅僅是在云里。

即使在云里,我們也和那60%CSP圖中的某一部分存在競爭關(guān)系,但我們也把客戶帶到另一部分。所以在那60%的CSP圖里,有一部分我們必須競爭。我們的工作就是比世界上任何人都更好地交付那張圖的價值,我們做得非常好,實際上我們的地位還在日益增強。而在另一部分,我們把客戶帶給他們,他們只有感激。

我把所有這些維度壓縮成兩個餅圖。你可以用這個壓縮后的圖來檢驗:他們是否設(shè)計自己的芯片?我們是否在芯片層面和他們競爭?我不認(rèn)為OCI會設(shè)計自己的芯片,我認(rèn)為他們這樣做不明智。顯然Coreweave也不會設(shè)計自己的芯片。所以我們在哪里競爭?我們在哪里為云服務(wù)提供商帶來客戶?他們云收入的很大一部分,顯然OCI幾乎是100%,是因為Nvidia。

10黃仁勛的組織哲學(xué):60個人管1萬億

問:展望未來,12個月的創(chuàng)新飛輪是你競爭優(yōu)勢的關(guān)鍵部分。但當(dāng)我看到員工人數(shù)時,增長其實非常緩慢,相對緩慢。然而,你們承擔(dān)的任務(wù)量比這增長得快得多。你如何管理這一點?如何管理這可能給業(yè)務(wù)帶來的風(fēng)險?

黃仁勛:我的直接匯報團(tuán)隊有60人。我們需要60人,是因為公司的架構(gòu)就是為了交付這種產(chǎn)品架構(gòu)而設(shè)計的。組織的架構(gòu)應(yīng)該反映他們構(gòu)建的產(chǎn)品。每家公司不應(yīng)該看起來都一樣。打造法拉利與流水線生產(chǎn)福特的方式截然不同,前者是圍繞底盤調(diào)動技師,后者則是讓車輛在流水線上流轉(zhuǎn)穿梭。這完全取決于你渴望締造怎樣的結(jié)果,而組織架構(gòu)理應(yīng)成為這一愿景的映射。

你看看我的管理團(tuán)隊,構(gòu)建Vera Rubin整個工廠所需技術(shù)的每一個方面,都在那里,百分之百具備。每個人都代表一個關(guān)鍵領(lǐng)域,所有專業(yè)知識都坐在同一張桌子上,共同決策。

第二件事是,我們有紀(jì)律去開發(fā)整個軟件棧。如果你不能把它啟用起來,你就無法每年構(gòu)建我們所構(gòu)建的東西。如果不能啟用,你怎么測試它?如果你從其他人那里拼湊新技術(shù),你怎么能做到每年啟用一次?這根本不現(xiàn)實,不可能。

所以我們讓我們所有的芯片與平臺對齊,所有七款芯片都只有一個流片時間表。我不會拼湊每個人的流片時間表然后算出系統(tǒng)什么時候出來。系統(tǒng)需要在它該來的時候來,每個人都對齊到那個時間點。而軟件棧,我們完全擁有每一部分。存儲是我們自己開發(fā)的,網(wǎng)絡(luò)當(dāng)然也是,甚至工廠操作系統(tǒng)Dynamo也是我們創(chuàng)造的。這樣我們就可以交付每一個基準(zhǔn)測試,測試到極限,測試可靠性。

英偉達(dá)構(gòu)建NeMotron的原因,就是為了我們能做預(yù)訓(xùn)練、后訓(xùn)練,現(xiàn)在還能做推理。我們擁有所有的軟件,這樣我們就可以每年啟用所有的系統(tǒng),這基本上意味著你一直在啟用。

如果你不擁有所有東西,你毫無機會,是絕對的零概率事件。人們談?wù)撍麄兊男翯PU,但他們的scale-up結(jié)構(gòu)從哪里來?那要怎么工作?我們之前討論的那個完整的智能體系統(tǒng),就是未來的計算機。所以我們公司的組織、公司的使命、公司的能力,都與我向市場交付承諾的目標(biāo)完全一致。這就是為什么我們能持續(xù)做到。

區(qū)區(qū)一張PPT是絕對造不出那套系統(tǒng)的。僅憑一張畫著兩根柱狀圖的幻燈片,也絕無可能忽悠別人砸給你500億美元。當(dāng)你真正將其全面工程化,并在數(shù)據(jù)中心內(nèi)部成功落地時,我們早已遙遙領(lǐng)先了兩個身位。這正是我們倒逼整個行業(yè)滾滾向前的獨特模式,一條鋪滿荊棘的極難之路。我們之所以能披荊斬棘,全憑我剛才詳述的種種底蘊。

我們的每一個系統(tǒng)都與CUDA兼容,所以第一天,昨天的軟件就能完美地在今天的系統(tǒng)上運行。我擁有所有的scale-up交換機、所有的scale-out交換機、所有的軟件。第一天,我把昨天的軟件放到新系統(tǒng)上。如果它不工作,那還有什么意義?然后一旦我們啟用了所有東西,因為我們擁有整個軟件棧,我們就可以把它推向極限。擁有CUDA兼容性,我們有這個叫DOCA的兼容層。我們擁有所有的編譯器,我們擁有所有的軟件棧,這非常非常重要。你不能把這外包給別人。別人為你構(gòu)建芯片,但他們不會為你啟用系統(tǒng),不會為你做驗證。

11 99%的算力應(yīng)該用在推理上

問:這次活動上我們談了很多關(guān)于推理的內(nèi)容。我希望你能花幾分鐘談?wù)動?xùn)練。你認(rèn)為計算強度會如何增長?未來幾年,驅(qū)動因素是什么?仍然是越來越大的模型,還是你看到地平線上有其他東西?如果從三到五年的角度來看,你對訓(xùn)練與推理在計算需求上的比例有何看法?

黃仁勛:訓(xùn)練已經(jīng)從預(yù)訓(xùn)練發(fā)展到了后訓(xùn)練階段。

預(yù)訓(xùn)練的本質(zhì)是記憶和泛化。你記憶得越多,泛化能力就越強,你擁有的基礎(chǔ)就越好。有了這個基礎(chǔ),也就是預(yù)訓(xùn)練模型,它有點像AI的幼兒園,或者更準(zhǔn)確地說,是AI的高中,它掌握了基本的詞匯、語法,甚至隱含了很多推理能力。這樣當(dāng)我教它新技能時,它才能理解我在說什么。如果你連我的意思都聽不懂,怎么可能去執(zhí)行任務(wù)?所以預(yù)訓(xùn)練做的就是這件事。

后訓(xùn)練則是教模型各種各樣的技能:強化學(xué)習(xí)、帶可執(zhí)行基礎(chǔ)的強化學(xué)習(xí)、帶可驗證反饋的強化學(xué)習(xí)、面向批處理的強化學(xué)習(xí)技術(shù)、工具使用,無論是基于結(jié)構(gòu)的API,還是非結(jié)構(gòu)化的工具使用。領(lǐng)域太多了。這部分的計算強度,我猜可能比預(yù)訓(xùn)練大一百萬倍。我可能差個1.2倍,但肯定是非常大的量級。原因是有太多技能需要學(xué)習(xí),而所有這些技能的學(xué)習(xí)周期都非常非常長。所以模型必須變得越來越大。當(dāng)你把這些技能都掌握之后,你生成的大量合成數(shù)據(jù),其中一部分又會回流到下一輪的預(yù)訓(xùn)練中。

因此,過去的預(yù)訓(xùn)練皆以互聯(lián)網(wǎng)數(shù)據(jù)為起點,當(dāng)下的預(yù)訓(xùn)練依然以此為主力。但假以時日,再歷經(jīng)幾代迭代,合成數(shù)據(jù)將全面接管預(yù)訓(xùn)練的半壁江山。同時,你還在增加多模態(tài)能力,增加運動能力,讓模型能夠在物理世界中長時間執(zhí)行動作。因為有很多常識是與認(rèn)知邏輯相關(guān)的,如果你能在物理世界中互動,即使在抽象世界中,你也能更容易地處理那個概念,因為你擁有了在物理世界中接地的經(jīng)驗。

請注意我剛才描述的計算量。我們未來所需的訓(xùn)練計算量是百萬倍、十億倍級別的,再加上持續(xù)學(xué)習(xí)。幾乎每個人的模型都會被最后訓(xùn)練、被微調(diào),以便它也能為每個人做記憶和泛化。所以在未來,推理從哪里開始、從哪里結(jié)束,訓(xùn)練從哪里開始、從哪里結(jié)束,會變得越來越模糊。你什么時候在學(xué)習(xí),什么時候在應(yīng)用你的智慧?對大多數(shù)人來說,現(xiàn)在是持續(xù)不斷的。

至于推理與訓(xùn)練的比例,我的希望是:世界上99%的計算都用于推理。因為推理環(huán)節(jié),才是我們將生成的Token兌現(xiàn)為真金白銀的變現(xiàn)場。世界上沒人會為你的學(xué)習(xí)過程買單,也沒人會替你的訓(xùn)練成本掏錢,你必須自掏腰包搞訓(xùn)練,而真正能榨出商業(yè)價值的,唯有推理。我希望這個世界能夠把這些Token用于有價值的成果:醫(yī)療保健、制造業(yè)、金融服務(wù)、工程等等。我們希望未來99%的Token都用于產(chǎn)生經(jīng)濟(jì)效益,而AI模型則在不斷學(xué)習(xí)。

有一個很好的理由可以解釋為什么Nvidia去年全力以赴投入推理,因為我們看到了這個未來:推理和訓(xùn)練、預(yù)訓(xùn)練和學(xué)習(xí),所有這些都只是一個大的連續(xù)統(tǒng)一體。不妨回味一下兩年前坊間流傳的論調(diào):“英偉達(dá)確實擅長訓(xùn)練,但推理簡直是小菜一碟,阿貓阿狗的公司都能做。”諸位還記得嗎?時至今日,真相大白,推理簡直難如登天。端詳一下這張圖表,它難到了極點,且未來將呈地獄級難度遞增。推理的本質(zhì)就是深度思考、硬核工作、真刀真槍地干活。這種苦差事,怎么可能“容易”?

所以我認(rèn)為人們完全把它搞反了,他們只是想編造故事來合理化他們自己的機會,這沒問題。但你得從第一性原理來推理。我花很長時間回答你們的問題,而不是用一個高度篩選、精心選擇、精準(zhǔn)調(diào)整動詞和名詞的簡短回答,是因為我希望你們學(xué)會如何通過這些來推理。這樣當(dāng)你們自己看到某些說法時,你會想“不,那沒道理”或者“那有道理”。因為你們是分析師,你們需要能夠理解這些事情。

相關(guān)推薦
熱點推薦
4S店蹭飯260次后續(xù),司機真容曝光社死,網(wǎng)友:他一年能省上萬塊

4S店蹭飯260次后續(xù),司機真容曝光社死,網(wǎng)友:他一年能省上萬塊

十九妹
2026-03-19 00:58:43
鄭爽疑精神失常!34歲滿頭白發(fā),與張恒家人街頭爭吵,孩子嚇得大哭

鄭爽疑精神失常!34歲滿頭白發(fā),與張恒家人街頭爭吵,孩子嚇得大哭

八卦王者
2026-03-19 11:48:39
高潔主任:無論多嚴(yán)重的失眠,每天做好4件事,睡眠一天比一天好!

高潔主任:無論多嚴(yán)重的失眠,每天做好4件事,睡眠一天比一天好!

大明愛養(yǎng)生
2026-03-18 15:09:29
女籃世界杯12人名單已明朗?9人基本穩(wěn)了:張茹或被宮魯鳴放棄?

女籃世界杯12人名單已明朗?9人基本穩(wěn)了:張茹或被宮魯鳴放棄?

籃球快餐車
2026-03-19 00:01:54
掀掉洋蔥頂,整治宗教泛濫的第一步

掀掉洋蔥頂,整治宗教泛濫的第一步

黑哥講現(xiàn)代史
2026-03-14 15:46:38
全球最大電子級玻璃纖維生產(chǎn)線點火 年產(chǎn)能達(dá)3.9億米

全球最大電子級玻璃纖維生產(chǎn)線點火 年產(chǎn)能達(dá)3.9億米

環(huán)球網(wǎng)資訊
2026-03-19 09:10:48
列國鑒|霍爾木茲海峽,地緣博弈與經(jīng)濟(jì)命脈的交織點

列國鑒|霍爾木茲海峽,地緣博弈與經(jīng)濟(jì)命脈的交織點

新華社
2026-03-13 17:53:11
周總理只是讓他經(jīng)商,給黨賺取經(jīng)費,他卻給組織賺回一個商業(yè)帝國

周總理只是讓他經(jīng)商,給黨賺取經(jīng)費,他卻給組織賺回一個商業(yè)帝國

芳芳?xì)v史燴
2026-03-17 22:15:13
沉迷養(yǎng)豬的丁磊,去年賺了338億

沉迷養(yǎng)豬的丁磊,去年賺了338億

大佬灼見
2026-03-13 12:21:50
女子泰國被拋尸大反轉(zhuǎn)!真實工作曝光,三大疑點越扒越細(xì)思極恐

女子泰國被拋尸大反轉(zhuǎn)!真實工作曝光,三大疑點越扒越細(xì)思極恐

米果說識
2026-03-18 10:05:00
阿森納贏球,整個英超都跟著沾光,歐冠額外名額穩(wěn)了

阿森納贏球,整個英超都跟著沾光,歐冠額外名額穩(wěn)了

樂道足球
2026-03-18 19:17:43
阿斯:晉級八強完成最低目標(biāo),皇馬已鎖定1億歐元歐冠收入

阿斯:晉級八強完成最低目標(biāo),皇馬已鎖定1億歐元歐冠收入

懂球帝
2026-03-19 16:41:08
蘇27回國路上被蒙古攔下要20萬過路費,俄飛行員當(dāng)場拍胸脯:給酒就行

蘇27回國路上被蒙古攔下要20萬過路費,俄飛行員當(dāng)場拍胸脯:給酒就行

史海孤雁
2026-03-18 18:08:18
楊洋的座駕現(xiàn)身安徽老家,去年法拉利,今年奔馳

楊洋的座駕現(xiàn)身安徽老家,去年法拉利,今年奔馳

總李談車
2026-03-18 08:31:09
毛新宇參觀祖宅時突然發(fā)現(xiàn)家譜記載:原來毛主席是毛太華第20代孫

毛新宇參觀祖宅時突然發(fā)現(xiàn)家譜記載:原來毛主席是毛太華第20代孫

老杉說歷史
2026-03-14 20:54:20
10萬億窟窿!比恒大更坑的民企來了,曾力壓許家印,位居第一

10萬億窟窿!比恒大更坑的民企來了,曾力壓許家印,位居第一

孤單是寂寞的毒
2026-03-04 15:38:03
錢再多有什么用?趙本山一家4口如今現(xiàn)狀,給所有中老年人提了醒

錢再多有什么用?趙本山一家4口如今現(xiàn)狀,給所有中老年人提了醒

心靈的觸動a
2026-03-19 10:35:16
特朗普設(shè)“能源紅線”:若再襲卡塔爾 將“摧毀”伊朗南帕爾斯氣田

特朗普設(shè)“能源紅線”:若再襲卡塔爾 將“摧毀”伊朗南帕爾斯氣田

智通財經(jīng)
2026-03-19 16:50:08
快訊!越南傳來新消息!

快訊!越南傳來新消息!

達(dá)文西看世界
2026-03-19 14:54:57
長征結(jié)束后,徐海東請毛主席吃飯,主席看到飯菜:你們?nèi)兆雍荛熉?>
    </a>
        <h3>
      <a href=瑩瑩的歷史說
2026-03-19 11:56:08
2026-03-19 17:31:00

科技要聞

機器人租賃:成立不到3月,估值破30億

頭條要聞

媒體:若伊朗戰(zhàn)爭失控 會發(fā)生讓歐洲人想起來都怕的事

頭條要聞

媒體:若伊朗戰(zhàn)爭失控 會發(fā)生讓歐洲人想起來都怕的事

體育要聞

他們專賣“老頭鞋”,卻能簽下19歲NBA未來門面?

娛樂要聞

戴軍55歲再翻紅!與何炅傳聞意難平

財經(jīng)要聞

伊朗戰(zhàn)爭會是"美國金融危機"導(dǎo)火索嗎?

汽車要聞

不到10萬還有激光雷達(dá) 零跑A10體驗超預(yù)期

態(tài)度原創(chuàng)

親子
時尚
游戲
本地
公開課

親子要聞

注冊營養(yǎng)師黃廷偉:娃過敏半年沒長高?營養(yǎng)師揪出 3 個隱形坑

女人過了60歲千萬別服老,看看這些日常穿搭,減齡舒適又耐看

主打美女多的《立方救贖》Steam上線好評率僅20%

本地新聞

春色滿城關(guān)不?。B興春日頂流,這片櫻花海藏不住了

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版
×