国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

黃仁勛最新2萬(wàn)字演講實(shí)錄:推理的拐點(diǎn)已經(jīng)到來(lái),Token將成最值錢(qián)的大宗商品

0
分享至



算力即印鈔機(jī),需求激增100萬(wàn)倍。

整理|莘歆

來(lái)源 | 盒飯財(cái)經(jīng)(ID:daxiongfan)

頭圖及封面來(lái)源 | 英偉達(dá)GTC 視頻截圖

當(dāng)?shù)貢r(shí)間2026年3月16日,被譽(yù)為“AI界春晚”的英偉達(dá)(NVIDIA)GTC大會(huì)如期而至。大會(huì)上,英偉達(dá)創(chuàng)始人兼CEO黃仁勛發(fā)表了一場(chǎng)長(zhǎng)達(dá)兩小時(shí)的主題演講。


演講中,黃仁勛指出,人工智能已經(jīng)跨越了只能陪人聊天、畫(huà)圖的“感知與生成”階段,正式進(jìn)入了以“智能體(Agentic AI)”和“物理AIPhysical AI)”為核心的執(zhí)行時(shí)代。算力也不再僅僅是研發(fā)支出,而是直接轉(zhuǎn)化為新一代大宗商品——Token(詞元)。

此外,黃仁勛再次強(qiáng)調(diào)了“AI工廠(chǎng)”概念。他指出,過(guò)去的數(shù)據(jù)中心是用來(lái)存放文件和照片的靜止倉(cāng)庫(kù),而未來(lái)的數(shù)據(jù)中心,將變成日夜不停運(yùn)轉(zhuǎn)的轟鳴工廠(chǎng)。它們生產(chǎn)的不再是傳統(tǒng)產(chǎn)品,而是未來(lái)數(shù)字世界最核心、最值錢(qián)的大宗商品:Token。而為了讓這些工廠(chǎng)的產(chǎn)能達(dá)到極致,英偉達(dá)不僅推出了Vera Rubin硬件系統(tǒng),還發(fā)布了能夠讓AI安全替人類(lèi)“打工”的操作系統(tǒng)框架。

演講要點(diǎn)如下:

1.轉(zhuǎn)折點(diǎn)到來(lái)。黃仁勛指出,AI 已經(jīng)能夠從事生產(chǎn)性工作,AI 市場(chǎng)最核心的轉(zhuǎn)變是從“訓(xùn)練”全面走向“推理”。

2.計(jì)算量激增。在推理時(shí)代,所需的 token 量和計(jì)算量相比訓(xùn)練階段增加了約一萬(wàn)倍,他相信過(guò)去兩年計(jì)算需求實(shí)際增加了100 萬(wàn)倍。

3.萬(wàn)億美元機(jī)會(huì)。基于這一轉(zhuǎn)變,他預(yù)期到 2027 年底,Blackwell 與 Vera Rubin 兩代架構(gòu)將帶來(lái)至少 1 萬(wàn)億美元的累計(jì)收入機(jī)會(huì)。

4.推理分工化。英偉達(dá)打破單芯片處理傳統(tǒng),將推理拆分為兩步:第一階段“預(yù)填充”由 Vera Rubin 負(fù)責(zé);第二階段“解碼”交由新整合的 Groq 芯片負(fù)責(zé),每瓦特性能提升了幾十倍。

5.路線(xiàn)圖發(fā)布。Groq 3 LPU,專(zhuān)注于低延遲計(jì)算,預(yù)計(jì)今年下半年出貨;Vera Rubin,性能比上一代高出 10 倍,預(yù)計(jì) 2026 年下半年出貨;Kyber 架構(gòu),將 144 個(gè) GPU 垂直集成,預(yù)計(jì) 2027 年應(yīng)用于 Vera Rubin Ultra;Feynman 芯片,暗示了 Rubin 之后的長(zhǎng)遠(yuǎn)產(chǎn)品線(xiàn)。

6.進(jìn)軍太空。宣布與 Axiom Space 合作推出 Vera Rubin Space-1 模塊,開(kāi)啟“軌道數(shù)據(jù)中心”計(jì)劃。

7.OpenClaw 合作的項(xiàng)目。黃仁勛形容其重要性堪比 Linux 和 HTML,能讓 AI 智能體自主執(zhí)行任務(wù)、調(diào)用工具并重塑軟件架構(gòu)。NemoClaw 參考設(shè)計(jì),用于確保企業(yè)級(jí)應(yīng)用的安全可控。

8.多次強(qiáng)調(diào)“AI 工廠(chǎng)”平臺(tái)。英偉達(dá)定義了三個(gè)平臺(tái):CUDA X 相關(guān)平臺(tái)、系統(tǒng)平臺(tái)以及新平臺(tái)“AI 工廠(chǎng)”。與此相應(yīng)的核心度量指標(biāo)也有改變——未來(lái) CEO 將重點(diǎn)關(guān)注 AI 工廠(chǎng)的 token 吞吐量和 token 速度(在恒定功耗下),這直接關(guān)系到企業(yè)的收入。

9.關(guān)于年度 token 預(yù)算。建議為每位工程師配備“年度 token 預(yù)算”,作為推動(dòng)生產(chǎn)力增長(zhǎng)的新標(biāo)配。

10.關(guān)于物理 AI 與機(jī)器人。黃仁勛展示了新的機(jī)器人訓(xùn)練平臺(tái) GR00T,并宣布其 N1 版本開(kāi)源。同時(shí),也聊到了未來(lái)的迪士尼,現(xiàn)場(chǎng)描繪了未來(lái)機(jī)器人角色在樂(lè)園中穿梭的景象。

以下為演講實(shí)錄,有刪改:


CUDA二十年的護(hù)城河和新變化

在 GTC,我們將談?wù)摷夹g(shù),我們將談?wù)撈脚_(tái)。NVIDIA 有三個(gè)平臺(tái)。你可能認(rèn)為我們主要只談?wù)撈渲兄弧Kc CUDA-X 有關(guān)。我們的系統(tǒng)是另一個(gè)平臺(tái),現(xiàn)在我們有了一個(gè)名為 AI Factories 的新平臺(tái)。我們將談?wù)撍羞@些平臺(tái),最重要的是,我們將談?wù)撋鷳B(tài)系統(tǒng)。


這次會(huì)議將涵蓋人工智能五層蛋糕的每一層,從土地、電力和外殼等基礎(chǔ)設(shè)施,到芯片,再到平臺(tái)、模型,當(dāng)然,最重要也是最終將推動(dòng)這個(gè)行業(yè)騰飛的,是所有的應(yīng)用程序。

今年是 CUDA 的 20 周年紀(jì)念,我們?cè)?CUDA 上深耕了 20 年。20 年來(lái),我們一直致力于這種架構(gòu)。這項(xiàng)革命性的發(fā)明,SIMT(單指令多線(xiàn)程),讓編寫(xiě)標(biāo)量代碼可以衍生出多線(xiàn)程應(yīng)用程序。這比 SIMD 編程要容易得多。我們最近添加了 tiles,用來(lái)幫助人們對(duì)Tensor Cores 以及當(dāng)今人工智能基礎(chǔ)的數(shù)學(xué)結(jié)構(gòu)進(jìn)行編程。

成千上萬(wàn)的工具、編譯器、框架和庫(kù),在開(kāi)源領(lǐng)域,有幾十萬(wàn)個(gè)公共項(xiàng)目。CUDA實(shí)際上已經(jīng)把它們整合到了每一個(gè)生態(tài)系統(tǒng)中。


這張圖基本上描述了 NVIDIA 100% 的戰(zhàn)略。你們從一開(kāi)始就看我在講這張幻燈片。最終,最難實(shí)現(xiàn)的是最底層的東西,即安裝基數(shù)。CUDA 的安裝基數(shù)是飛輪加速運(yùn)轉(zhuǎn)的原因,安裝基數(shù)吸引了開(kāi)發(fā)者,開(kāi)發(fā)者在此基礎(chǔ)上創(chuàng)造了新的算法并取得突破。例如,deeplearning,還有很多其他的例子。

這些突破帶來(lái)了全新的市場(chǎng),并圍繞它們與加入的其他公司建立了新的生態(tài)系統(tǒng),這又創(chuàng)造了更大的安裝基數(shù)。

這個(gè)飛輪現(xiàn)在正在加速。NVIDIA 庫(kù)的下載量正以驚人的速度加速增長(zhǎng)。它的規(guī)模非常大,而且增長(zhǎng)速度比以往任何時(shí)候都快。這個(gè)飛輪使得這個(gè)計(jì)算平臺(tái)能夠支撐如此多的應(yīng)用程序和新突破,但最重要的是,它也使得這些基礎(chǔ)設(shè)施擁有了超長(zhǎng)的使用壽命。

原因很明顯,有很多應(yīng)用程序可以在 NVIDIA CUDA 上運(yùn)行。應(yīng)用程序的覆蓋范圍如此之廣,以至于一旦你安裝了 NVIDIA GPUs,它的使用壽命將極高。這也是為什么我們大約六年前出貨的 Ampere,其在云端的定價(jià)還在上漲的原因之一。這是因?yàn)榘惭b基數(shù)大,飛輪效應(yīng)強(qiáng),開(kāi)發(fā)者觸達(dá)范圍廣。同時(shí),我們會(huì)不斷更新我們的軟件,計(jì)算成本隨之下降。加速計(jì)算極大地提升了應(yīng)用程序的速度。同時(shí),隨著我們不斷培育并在其生命周期內(nèi)更新軟件,你不僅獲得了首次的性能爆發(fā),還能獲得加速計(jì)算隨著時(shí)間推移帶來(lái)的持續(xù)成本降低。

我們?cè)敢馀嘤敢庵С质澜缟厦恳粋€(gè) GPUs,因?yàn)樗鼈冊(cè)诩軜?gòu)上都是兼容的。我們?cè)敢膺@樣做是因?yàn)榘惭b基數(shù)如此龐大,如果我們發(fā)布一個(gè)新的優(yōu)化,它將惠及數(shù)百萬(wàn)人。這種動(dòng)態(tài)的結(jié)合使得 NVIDIA 架構(gòu)擴(kuò)大了它的覆蓋范圍,加速了它的增長(zhǎng),同時(shí)降低了計(jì)算成本,最終鼓勵(lì)了新的增長(zhǎng)。而CUDA 處于這一切的中心。

我們走向 CUDA 的旅程實(shí)際上始于 25 年前的GeForce。我不知道你們中有多少人是伴隨著 GeForce 長(zhǎng)大的?GeForce 是 NVIDIA 最偉大的營(yíng)銷(xiāo)活動(dòng),早在你們自己能買(mǎi)得起之前很久,我們就開(kāi)始吸引未來(lái)的客戶(hù),是你們父母買(mǎi)的單。

你們的父母為你們成為 NVIDIA 的客戶(hù)買(mǎi)單,他們年復(fù)一年地付錢(qián),直到有一天你成為了一名了不起的計(jì)算機(jī)科學(xué)家,成為了一名真正的客戶(hù),一名真正的開(kāi)發(fā)者。這就是 GeForce 建立的根基。25 年前,我們開(kāi)始了我們的旅程,這促成了 CUDA 的誕生。

25年前,我們發(fā)明了可編程著色器。這是一個(gè)完全不顯眼的發(fā)明,目的是讓加速器變得可編程。世界上第一個(gè)可編程加速器,像素著色器。25年前,它引領(lǐng)我們進(jìn)一步探索。

20年后,也就是著色器發(fā)明的5 年后,CUDA 誕生了。它是我們最大的投資項(xiàng)目之一,在 GeForce 的基礎(chǔ)上把 CUDA推向每一臺(tái)計(jì)算機(jī),消耗了我們公司絕大部分的利潤(rùn)。

我們?nèi)硇牡赝度氲絼?chuàng)建這個(gè)平臺(tái)中,我們強(qiáng)烈地感受到了它的潛力。最終在20 年的 13 代產(chǎn)品中日復(fù)一日地堅(jiān)持,我們現(xiàn)在讓 CUDA 無(wú)處不在。像素著色器引發(fā)了 GeForce 的革命。

8年前,針對(duì)現(xiàn)代計(jì)算機(jī)圖形時(shí)代,我們對(duì)架構(gòu)進(jìn)行了徹底的重新設(shè)計(jì),推出了RTX。GeForce將CUDA帶給了世界。因此,GeForce讓Alex Krizhevsky和Ilya Sutskever,以及Geoffrey Hinton、Andrew Ng和許多其他人發(fā)現(xiàn),GPU可以成為他們加速deep learning的朋友。它開(kāi)啟了AI的大爆炸。

10年前,我們決定融合可編程著色技術(shù),并引入兩個(gè)新想法:ray tracing和硬件ray tracing,這是一項(xiàng)極難做到的技術(shù),也是當(dāng)時(shí)的一個(gè)新想法。想象一下,大約10年前,我們認(rèn)為AI會(huì)徹底改變計(jì)算機(jī)圖形學(xué)。就像 GeForce 把 AI 帶給世界一樣,AI 現(xiàn)在反過(guò)來(lái)將徹底改變計(jì)算機(jī)圖形的制作方式。

今天我要向你們展示一些屬于未來(lái)的東西。這是我們下一代的圖形技術(shù)。我們把它稱(chēng)為neural rendering——3D圖形與artificial intelligence 的融合,這就是 DLSS 5。不可思議吧?計(jì)算機(jī)圖形變得栩栩如生了。

那么,我們做了什么?

我們?nèi)诤狭丝煽氐?3D 圖形、虛擬世界的基準(zhǔn)事實(shí)(ground truth)、生成的虛擬世界的 structured data。我們將 3D 圖形、structured data 與 generative AI 結(jié)合在一起。其中一個(gè)是完全預(yù)測(cè)性的,另一個(gè)是概率性的,但高度逼真。

我們將這兩個(gè)想法結(jié)合起來(lái),通過(guò) structured data 進(jìn)行控制,完美控制的同時(shí)又在生成內(nèi)容。結(jié)果就是,內(nèi)容不僅美麗、驚人,而且是可控的。這種融合結(jié)構(gòu)化信息和 generative AI 的概念將在一個(gè)又一個(gè)行業(yè)中重演。Structured data 是值得信賴(lài)的 AI 的基礎(chǔ)。在接下來(lái)的時(shí)間里,我們將深入探討這張?jiān)韴D。


這是我最好的一張幻燈片。每次我問(wèn)團(tuán)隊(duì),“我最好的幻燈片是哪張?”他們總說(shuō)是這張。他們會(huì)說(shuō),“別放這張,Jensen。別放。”我說(shuō),“不行,你們中有些人的座位可是免費(fèi)的?!彼赃@就是你們?nèi)雸?chǎng)的代價(jià)。

這就是structured data。你們聽(tīng)說(shuō)過(guò)它,SQL、Spark、Pandas、Velox,還有一些重要的大型平臺(tái),Snowflake、Databricks、EMR、Amazon EMR、Azure、Fabric、Google Cloud、BigQuery。所有這些平臺(tái)都在處理data frames。這些data frames是巨大的電子表格,它們保存著生活的所有信息,這是structured data,商業(yè)的基準(zhǔn)事實(shí)。這是企業(yè)計(jì)算的基準(zhǔn)事實(shí)。那么,現(xiàn)在我們將讓AI來(lái)使用structured data,而且我們最好能極大地加速它。

過(guò)去這樣是可以的,我們會(huì)加速structured data,這樣我們就能做更多的事,成本更低,每天處理的頻率更高,并讓公司以更加同步的方式運(yùn)轉(zhuǎn)。然而,在未來(lái)將會(huì)發(fā)生的是,這些數(shù)據(jù)結(jié)構(gòu)將被AI使用,而AI的速度將比我們快得多。未來(lái)的agents也將使用structured databases。

當(dāng)然,還有unstructured database,即生成式數(shù)據(jù)庫(kù)。這個(gè)數(shù)據(jù)庫(kù)代表了世界上的絕大部分內(nèi)容。Vector databases,unstructured data、PDFs、視頻、演講、世界上所有的信息,每年生成的數(shù)據(jù)中約有 90% 是 unstructured data。直到現(xiàn)在,這些數(shù)據(jù)對(duì)世界來(lái)說(shuō)完全無(wú)用。

我們閱讀它,把它放入我們的文件系統(tǒng)中,僅此而已。但是,我們無(wú)法查詢(xún)它,我們無(wú)法搜索它。這很難做到。原因是目前沒(méi)有簡(jiǎn)單的方法來(lái)索引 unstructured data。你必須理解它的含義和目的。

現(xiàn)在我們讓 AI 來(lái)做這件事。就像 AI 能夠解決多模態(tài)感知和理解一樣,你可以使用相同的技術(shù),多模態(tài)感知和理解,去閱讀 PDF,理解其含義,并從這個(gè)含義中,將其嵌入到一個(gè)我們可以搜索、可以查詢(xún)的更大結(jié)構(gòu)中。

NVIDIA創(chuàng)建了2個(gè)基礎(chǔ)庫(kù)。就像我們?yōu)?/strong>3D圖形創(chuàng)建了RTX一樣,我們?yōu)?/strong>data framesstructured data創(chuàng)建了cuDF;我們?yōu)?/strong>vector stores、語(yǔ)義數(shù)據(jù)、unstructured data、AI data創(chuàng)建了cuVS。

這兩個(gè)平臺(tái)將成為未來(lái)最重要的兩個(gè)平臺(tái)。我非常興奮地看到它在這個(gè)由世界數(shù)據(jù)處理系統(tǒng)組成的復(fù)雜網(wǎng)絡(luò)中被廣泛采用。


談垂直整合

NVIDIA 是垂直整合的,是世界上第一家垂直整合但在水平層面開(kāi)放的公司。這樣做的必要性非常簡(jiǎn)單。加速計(jì)算不是一個(gè)芯片問(wèn)題。加速計(jì)算不是一個(gè)系統(tǒng)問(wèn)題。加速計(jì)算漏掉了一個(gè)詞。我們現(xiàn)在只是不再說(shuō)它了,應(yīng)用程序加速。如果我能制造出一臺(tái)運(yùn)行所有東西都更快的計(jì)算機(jī),那叫做 CPU,那已經(jīng)失效了。

未來(lái)我們要想加速應(yīng)用程序并繼續(xù)帶來(lái)巨大的速度提升、巨大的成本削減,唯一的方法是通過(guò)應(yīng)用程序或特定領(lǐng)域的加速。我把那個(gè)詞去掉了,因此它就變成了加速計(jì)算。這就是 NVIDIA 必須一個(gè)庫(kù)接一個(gè)庫(kù)、一個(gè)領(lǐng)域接一個(gè)領(lǐng)域、一個(gè)垂直行業(yè)接一個(gè)垂直行業(yè)去做的原因。

我們是一家垂直整合的計(jì)算公司,別無(wú)他法,我們必須理解這些應(yīng)用程序,我們必須理解這個(gè)領(lǐng)域。我們必須從根本上理解算法。我們必須弄清楚如何在它希望被部署的任何場(chǎng)景中部署算法,無(wú)論是在數(shù)據(jù)中心、云端、本地、邊緣還是在機(jī)器人系統(tǒng)中。

所有這些計(jì)算系統(tǒng)都是不同的。最后是系統(tǒng)和芯片。

我們是垂直整合的,使它無(wú)比強(qiáng)大,你們能看到所有這些幻燈片,是因?yàn)镹VIDIA 也是水平開(kāi)放的。我們將進(jìn)行合作,把 NVIDIA 的技術(shù)整合到你們希望我們整合進(jìn)去的任何平臺(tái)中。我們向你們提供軟件,向你們提供庫(kù)。我們與你們的技術(shù)整合,以便我們可以將加速計(jì)算帶給世界上的每個(gè)人。那么,這次 GTC 就是一個(gè)很好的證明。

你知道,大多數(shù)時(shí)候你會(huì)看到我談?wù)撨@些垂直領(lǐng)域,我會(huì)舉一些例子。在每一個(gè)案例中,無(wú)論是汽車(chē)行業(yè),順便說(shuō)一句,還有金融服務(wù)業(yè),參加這次 GTC 人數(shù)比例最高的是金融服務(wù)業(yè)的人士。

我知道。我希望來(lái)的是開(kāi)發(fā)者,而不是交易員。伙計(jì)們。有一件事我想說(shuō)。臺(tái)下的觀(guān)眾代表了 NVIDIA 供應(yīng)鏈上游和供應(yīng)鏈下游的生態(tài)系統(tǒng)。我們工作時(shí),會(huì)考慮我們供應(yīng)鏈的上下游。令人興奮的是,在過(guò)去的一年里,我們的整個(gè)上游供應(yīng)鏈,不管你們是 50 年歷史的公司,還是有 70 年歷史的公司,我們還有 150 年歷史的公司,現(xiàn)在都成為了 NVIDIA 供應(yīng)鏈的一部分,在我們的上游或下游與我們合作。

去年,你們迎來(lái)了創(chuàng)紀(jì)錄的一年。不是嗎?恭喜你們,我們?cè)谶@里大有作為。

如果你看看加速計(jì)算,我們現(xiàn)在已經(jīng)建立好了計(jì)算平臺(tái)。為了讓我們激活這些計(jì)算平臺(tái),我們需要擁有特定領(lǐng)域的庫(kù),來(lái)解決我們所涉足的每一個(gè)垂直領(lǐng)域中非常重要的問(wèn)題。你可以看到我們正在解決這其中的每一個(gè)問(wèn)題,如Autonomous vehicles(自動(dòng)駕駛車(chē)輛)。

我們的覆蓋范圍、我們的廣度、我們的影響力,令人難以置信。我們?cè)谶@方面取得了進(jìn)展。

金融服務(wù)。我剛才提過(guò)了。Algorithmic trading(算法交易)正在從帶有被稱(chēng)為quant(量化)的人工特征工程的經(jīng)典機(jī)器學(xué)習(xí)時(shí)代,跨入超級(jí)計(jì)算機(jī)分析海量數(shù)據(jù)、自己發(fā)現(xiàn)洞見(jiàn)和發(fā)現(xiàn)模式的時(shí)代。它正在經(jīng)歷它的deep learning和transformer時(shí)刻。

醫(yī)療保健正在經(jīng)歷他們的ChatGPT時(shí)刻。我們?cè)谀抢镎谧鲆恍┝钊伺d奮的工作。我們?cè)谶@里有一個(gè)很棒的主題演講環(huán)節(jié)。Kimberly Powell正在主持一場(chǎng)關(guān)于醫(yī)療保健的精彩主題演講。我們?cè)谡務(wù)撚糜谒幬锇l(fā)現(xiàn)的AI物理學(xué)或AI生物學(xué),用于客戶(hù)服務(wù)和輔助診斷的AI agents,當(dāng)然,還有physical AI機(jī)器人系統(tǒng)。所有這些不同的AI載體都有NVIDIA提供的不同平臺(tái)。

工業(yè)領(lǐng)域,我們正在徹底重置并開(kāi)始人類(lèi)歷史上最大規(guī)模的建設(shè)。世界上大多數(shù)正在建立 AI factories、建立芯片工廠(chǎng)、建立計(jì)算機(jī)工廠(chǎng)的行業(yè),今天都在這里有代表出席。媒體和娛樂(lè)、游戲,當(dāng)然還有實(shí)時(shí) AI 平臺(tái),以便我們可以進(jìn)行翻譯和廣播支持以及現(xiàn)場(chǎng)比賽和現(xiàn)場(chǎng)視頻,海量的內(nèi)容將通過(guò) AI 得到增強(qiáng)。

我們有一個(gè)名為 Holoscan 的平臺(tái)。Quantum 領(lǐng)域,有 35 家不同的公司在這里與我們一起構(gòu)建下一代 Quantum GPU 混合系統(tǒng)。零售和 CPG 領(lǐng)域,使用 NVIDIA 進(jìn)行供應(yīng)鏈管理,創(chuàng)建 agentic 購(gòu)物系統(tǒng)、用于客戶(hù)支持的 AI agents,這里正在進(jìn)行大量的工作,35 萬(wàn)億美元的產(chǎn)業(yè)。Robotics,50萬(wàn)億美元的制造業(yè)。NVIDIA 已經(jīng)在這個(gè)領(lǐng)域耕耘了十年,構(gòu)建了 3 臺(tái)計(jì)算機(jī),這是構(gòu)建機(jī)器人系統(tǒng)所必需的基礎(chǔ)計(jì)算機(jī)。

我們與大部分我們知道的制造機(jī)器人的公司進(jìn)行了整合與合作。我們?cè)谡箷?huì)上有110 個(gè)機(jī)器人。然后是電信領(lǐng)域。其規(guī)模與全球 IT 產(chǎn)業(yè)差不多,約2萬(wàn)億美元。當(dāng)然,我們看到基站無(wú)處不在。它是世界的基礎(chǔ)設(shè)施之一。

它是上一代計(jì)算技術(shù)的基礎(chǔ)設(shè)施。那個(gè)基礎(chǔ)設(shè)施將被徹底重塑。原因非常簡(jiǎn)單。那個(gè)只做一件事的基站,也就是基站功能,未來(lái)將變成一個(gè) AI 基礎(chǔ)設(shè)施平臺(tái)。AI 將在邊緣運(yùn)行。

我們?cè)谠擃I(lǐng)域的平臺(tái)叫做 Aerial 或 AI RAN。與 Nokia 有大規(guī)模合作,與 T-Mobile 及許多其他公司也有大規(guī)模合作。我們業(yè)務(wù)的核心,也就是我剛才提到的所有內(nèi)容,計(jì)算平臺(tái),但非常重要的一點(diǎn)是,我們的 CUDA-X 庫(kù)。我們的 CUDA-X 庫(kù)就是算法,NVIDIA 發(fā)明的算法。我們是一家算法公司,正是這一點(diǎn)讓我們與眾不同。

正是這一點(diǎn)讓我能夠進(jìn)入所有這些行業(yè),想象未來(lái),并讓世界上最優(yōu)秀的計(jì)算機(jī)科學(xué)家描述和解決問(wèn)題,重構(gòu)它,重新表達(dá)它,并將其變成一個(gè)庫(kù)。

我想在這次展會(huì)上,我們要宣布 100 個(gè)庫(kù),70 個(gè)庫(kù),也許 40 個(gè)模型,而這僅僅是在展會(huì)上。我們一直在更新這些內(nèi)容。我們一直在更新它們。庫(kù)是我們公司皇冠上的明珠。它使得這個(gè)計(jì)算平臺(tái),能夠被激活來(lái)解決問(wèn)題,產(chǎn)生影響。我們創(chuàng)建的最大、最重要的庫(kù)之一,cuDNN(CUDA Deep Neural Network)。它徹底改變了artificial intelligence,引發(fā)了現(xiàn)代 AI 的大爆炸。

過(guò)去兩年發(fā)生了一些事情,特別是去年。我們與 AI natives 合作了很長(zhǎng)時(shí)間,而就在去年,它一飛沖天,我來(lái)向你們解釋一下為什么會(huì)這樣。這個(gè)行業(yè)已經(jīng)一飛沖天了。1500 億美元的投資進(jìn)入了風(fēng)險(xiǎn)投資,進(jìn)入了初創(chuàng)企業(yè),這是人類(lèi)歷史上規(guī)模最大的。這也是投資規(guī)模首次從數(shù)百萬(wàn)美元、數(shù)千萬(wàn)美元跨越到了數(shù)億美元甚至數(shù)十億美元。原因在于,所有這些公司都需要算力,而且是海量的算力。他們需要 tokens,而且是海量的 tokens。

他們要么去創(chuàng)造、建立和生成 tokens,要么去整合 Anthropic、OpenAI 和其他公司創(chuàng)造的可用 tokens,并為之增加價(jià)值。這個(gè)行業(yè)在很多方面都與眾不同,但有一點(diǎn)非常清楚,它們正在產(chǎn)生的影響,它們已經(jīng)交付的令人難以置信的價(jià)值,是非常顯而易見(jiàn)的。AI natives,這全是因?yàn)槲覀冎厮芰擞?jì)算。就像 PC 革命期間,誕生了一大批新公司。就像互聯(lián)網(wǎng)革命期間,誕生了一大批新公司。在移動(dòng)云時(shí)代,也誕生了一大批新公司。它們都有自己的標(biāo)準(zhǔn)等等。我們將談?wù)撈渲幸粋€(gè)剛剛發(fā)生的主要標(biāo)準(zhǔn),它極其重要。


談推理拐點(diǎn)已至,Token與算力爆發(fā)

我們重塑了計(jì)算,理所當(dāng)然地,將會(huì)涌現(xiàn)出一大批對(duì)世界未來(lái)具有深遠(yuǎn)影響的新一代重要公司。那些因?yàn)樯弦淮斡?jì)算平臺(tái)轉(zhuǎn)變而誕生的 Googles、Amazons、Metas 等深具影響力的公司,我們現(xiàn)在正處于一個(gè)新的平臺(tái)轉(zhuǎn)變的起點(diǎn)。

過(guò)去幾年發(fā)生了什么?嗯,如你們所知,我們一直在觀(guān)察,我們一直致力于deep learning,致力于 AI?,F(xiàn)代 AI 的大爆炸,我們就身處現(xiàn)場(chǎng),我們推動(dòng)這個(gè)領(lǐng)域發(fā)展已經(jīng)有很長(zhǎng)一段時(shí)間了。為什么是過(guò)去兩年?過(guò)去兩年發(fā)生了什么?


第一,ChatGPT 開(kāi)啟了 generative AI 時(shí)代。它不僅能夠理解、感知并理解,還能夠進(jìn)行轉(zhuǎn)化和生成。生成獨(dú)特的內(nèi)容。我向你們展示了 generative AI 與計(jì)算機(jī)圖形學(xué)的融合,它讓計(jì)算機(jī)圖形變得栩栩如生。各位,世界上的每個(gè)人都應(yīng)該使用 ChatGPT。ChatGPT 代表了 generative AI 的時(shí)代。

第二點(diǎn),generative computing(生成式計(jì)算)與我們過(guò)去進(jìn)行計(jì)算的方式相比,是不同的。Generative AI 是軟件的一種能力,但它深刻改變了計(jì)算的方式。過(guò)去的計(jì)算是基于檢索的,現(xiàn)在則是生成式的。

當(dāng)我在談?wù)撃承┦虑闀r(shí),請(qǐng)記住這個(gè)想法,你會(huì)意識(shí)到為什么我們所做的一切將改變計(jì)算機(jī)的架構(gòu)設(shè)計(jì),改變計(jì)算機(jī)的供應(yīng)方式,改變計(jì)算機(jī)的構(gòu)建方式,以及計(jì)算本身的意義到底是什么。

Generative AI, 2022 年底,2023 年。接下來(lái),推理 AI,o1,隨后的 o3 更是讓它一飛沖天。推理使它能夠反思,使它能夠自我思考,使它能夠計(jì)劃,分解問(wèn)題,并將它不理解的問(wèn)題分解成它能理解的步驟或部分。它可以將自己扎根于研究之中。o1 使 generative AI 變得值得信賴(lài)并建立在事實(shí)之上。這使得 ChatGPT 直接起飛,這是一個(gè)非常非常重要的時(shí)刻。

為了生成內(nèi)容所需的輸入 tokens 數(shù)量,以及為了推理生成的輸出 tokens 數(shù)量,模型變得稍微大了一些。當(dāng)然,你可以擁有更大的模型。o1 模型稍微大了一點(diǎn),但大不了多少。它用于語(yǔ)境的輸入 token 用量和用于思考的輸出 token 增加了極其龐大的計(jì)算量。

第三,是Claude Code,第一個(gè)agentic模型。它能夠讀取文件、編寫(xiě)代碼、編譯它、測(cè)試它、評(píng)估它,然后返回并對(duì)其進(jìn)行迭代。如大家所知,Claude Code 徹底改變了軟件工程。NVIDIA 100% 的人都在使用 Claude Code、Codex 和 Cursor 的其中之一,或者通常是這三者同時(shí)使用,這在 NVIDIA 內(nèi)部隨處可見(jiàn)。

今天,沒(méi)有一個(gè)軟件工程師不在一個(gè)或多個(gè)協(xié)助他們編寫(xiě)代碼的 AI agents 的幫助下工作。Cloud Code 徹底帶來(lái)了新的拐點(diǎn)。這是第一次,你不再問(wèn) AI 什么、在哪里、什么時(shí)候、怎么做。你要求它去創(chuàng)造、去執(zhí)行、去構(gòu)建。

你要求它使用工具,獲取你的語(yǔ)境,閱讀文件。它能夠以代理(agentic)的方式分解問(wèn)題,進(jìn)行推理,進(jìn)行反思。它能夠解決問(wèn)題并實(shí)際執(zhí)行任務(wù)。一個(gè)能夠感知的 AI 變成了一個(gè)能夠生成的 AI。一個(gè)能夠生成的 AI 變成了一個(gè)能夠推理的 AI。一個(gè)能夠推理的 AI 現(xiàn)在變成了一個(gè)可以實(shí)際工作、非常具有生產(chǎn)力的 AI。過(guò)去兩年里的計(jì)算量,我們知道,這個(gè)房間里的每個(gè)人都知道,對(duì)NVIDIA GPU 的計(jì)算需求已經(jīng)爆表了。

現(xiàn)貨定價(jià)正在飆升。你就算想找也很難找到一顆 GPU,然而與此同時(shí),我們正在不斷出貨 GPUs,數(shù)量驚人,而需求還在不斷攀升。這背后是有原因的,那就是這種根本性的轉(zhuǎn)變。最終,AI 能夠從事生產(chǎn)性工作。

因此,推理的拐點(diǎn)已經(jīng)到來(lái)。AI 的每一個(gè)環(huán)節(jié),每當(dāng)它需要思考,需要講道理,需要執(zhí)行,需要生成tokens 時(shí),它都必須進(jìn)行推理?,F(xiàn)在早已經(jīng)過(guò)了訓(xùn)練的階段?,F(xiàn)在是推理的領(lǐng)域。

推理的拐點(diǎn)已經(jīng)到來(lái)。當(dāng)時(shí),tokens的數(shù)量、所需的計(jì)算量增加了大約 10,000 倍?,F(xiàn)在,當(dāng)我把這兩個(gè)因素結(jié)合起來(lái),即在過(guò)去兩年里,工作的計(jì)算需求增長(zhǎng)了10,000倍,而使用量可能增長(zhǎng)了100 倍。大家聽(tīng)我說(shuō)過(guò),我相信在過(guò)去兩年里,計(jì)算需求增長(zhǎng)了 100 萬(wàn)倍。這是我們所有人的感受,這是每一家初創(chuàng)公司的感受。這是 OpenAI 的感受。這是 Anthropic 的感受。

如果他們能獲得更多的算力,他們就能生成更多的 tokens,他們的收入就會(huì)上升,就會(huì)有更多的人使用它,AI 就會(huì)變得更高級(jí)、更聰明。我們現(xiàn)在正處于那種正向的飛輪系統(tǒng)中。我們已經(jīng)到達(dá)了那個(gè)時(shí)刻。


推理的拐點(diǎn)已經(jīng)到來(lái)。去年這個(gè)時(shí)候,我說(shuō)站在當(dāng)時(shí)那個(gè)時(shí)間點(diǎn)上,我們看到了大約 5000 億美元。我們看到了截至2026 年,對(duì) Blackwell 和 Rubin 高達(dá) 5000 億美元的高信心需求和采購(gòu)訂單。那是去年我說(shuō)的?,F(xiàn)在,我不知道你們是否有同感,但 5000 億美元是一筆龐大的收入。沒(méi)有人感到驚訝。我知道你們?yōu)槭裁床惑@訝,因?yàn)槟銈兌加瓉?lái)了創(chuàng)紀(jì)錄的一年。

那么,我在這里告訴你們,就在現(xiàn)在我所站的地方,在 GTCDC 之后的短短幾個(gè)月,在去年 GTC 之后的一年,就在我所站的這里,我看到了截至 2027 年至少 1 萬(wàn)億美元的需求。

那么,這有意義嗎?這就是我接下來(lái)要講的內(nèi)容。事實(shí)上,我們甚至?xí)┎粦?yīng)求。我敢肯定計(jì)算需求會(huì)遠(yuǎn)高于這個(gè)數(shù)字,這背后是有原因的。第一件事是,我們?cè)谶^(guò)去的一年里做了很多工作。當(dāng)然,如你們所知,2025 年是 NVIDIA 的推理之年。

我們想確保不僅在訓(xùn)練和后期訓(xùn)練方面表現(xiàn)出色,而且在 AI 的每個(gè)階段都表現(xiàn)得極其出色。這樣,對(duì)我們基礎(chǔ)設(shè)施的投資就能隨心所欲地?cái)U(kuò)展使用時(shí)長(zhǎng),并且 NVIDIA 基礎(chǔ)設(shè)施的有用壽命會(huì)很長(zhǎng),從而使得成本極低——你使用它的時(shí)間越長(zhǎng),成本就越低。

在我心里毫無(wú)疑問(wèn),NVIDIA 的系統(tǒng)是你能在世界上獲得成本最低的 AI 基礎(chǔ)設(shè)施。

與此同時(shí),作為一個(gè)整體,作為一個(gè)群體,這代表了全球 1/3 的 AI 計(jì)算量,開(kāi)源模型已經(jīng)逼近了前沿水平,而且它簡(jiǎn)直無(wú)處不在。

NVIDIA,如你所知,今天,我們是當(dāng)今世界上唯一一個(gè)跨越每一個(gè) AI 模型運(yùn)行在每個(gè) AI 領(lǐng)域的平臺(tái),無(wú)論是在語(yǔ)言和生物學(xué)、計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)、語(yǔ)音、蛋白質(zhì)和化學(xué)物質(zhì)、機(jī)器人技術(shù)或其他領(lǐng)域,邊緣或云端,任何語(yǔ)言。NVIDIA 的架構(gòu)對(duì)所有這些都是通用的,而且我們?cè)谒羞@些方面都表現(xiàn)得不可思議。

這讓我們成為成本最低、信心最高的平臺(tái),因?yàn)檎缥姨岬降?,?dāng)你構(gòu)建這些系統(tǒng)時(shí),1 萬(wàn)億美元是極其龐大的基礎(chǔ)設(shè)施。

你必須擁有絕對(duì)的信心,你投入的這 1 萬(wàn)億美元將被充分利用,將具有高性能,將極具成本效益,并且在你能預(yù)見(jiàn)的未來(lái)里擁有使用壽命。你在 NVIDIA 上進(jìn)行的基礎(chǔ)設(shè)施投資,你可以帶著十足的信心去進(jìn)行。

它是世界上唯一的基礎(chǔ)設(shè)施,讓你可以走到世界任何地方,充滿(mǎn)信心地進(jìn)行構(gòu)建。我們 60% 的業(yè)務(wù)來(lái)自hyperscalers(超大規(guī)模云服務(wù)商),排名前五的 hyperscalers。

然而,即使在這前 5 大 hyperscalers 內(nèi)部,也有一些是內(nèi)部的 AI 消耗。內(nèi)部 AI 消耗,比如非常重要的 RecSys(推薦系統(tǒng))正在從圖表、協(xié)同過(guò)濾和內(nèi)容過(guò)濾的 recommender systems 轉(zhuǎn)變?yōu)?deep learning 和 large language models。搜索,正在轉(zhuǎn)向 deep learning,large language models。幾乎所有這些不同的hyperscale 工作負(fù)載現(xiàn)在都在轉(zhuǎn)移,正在轉(zhuǎn)向 NVIDIA GPUs 極其擅長(zhǎng)的工作負(fù)載。

最重要的是,因?yàn)槲覀兣c每一個(gè) AI 實(shí)驗(yàn)室合作,我們加速每一個(gè) AI 模型,并且因?yàn)槲覀冇幸粋€(gè)龐大的 AI natives 生態(tài)系統(tǒng)與我們合作,我們可以把他們帶到云端,因此,那筆投資無(wú)論有多大,無(wú)論有多快,算力都將被消耗掉。這占據(jù)了我們 60% 的業(yè)務(wù)。其余 40% 的業(yè)務(wù)遍布各地。

區(qū)域云、主權(quán)云、企業(yè)、工業(yè)、機(jī)器人、邊緣、大型系統(tǒng)、超級(jí)計(jì)算系統(tǒng)、小型服務(wù)器、企業(yè)級(jí)服務(wù)器。系統(tǒng)的數(shù)量驚人。AI 的多樣性也是它的韌性。AI 覆蓋范圍的廣度就是它的韌性。毫無(wú)疑問(wèn),這不是一項(xiàng)單一應(yīng)用的科技。這現(xiàn)在已經(jīng)成為了基礎(chǔ)。這絕對(duì)是一次新的計(jì)算平臺(tái)轉(zhuǎn)變。那么,我們的工作是繼續(xù)推進(jìn)技術(shù),去年我提到的最重要的事情之一是我們的推理之年。我們傾注了一切。

人們過(guò)去常對(duì)我說(shuō),“ Jensen,推理太簡(jiǎn)單了?!?/p>

推理才是終極的難題。它也是終極重要的部分,因?yàn)樗?qū)動(dòng)著你的收入。這就是結(jié)果。這是來(lái)自 SemiAnalysis 的數(shù)據(jù)。

這是有史以來(lái)對(duì) AI 推理進(jìn)行的最大規(guī)模、最全面的掃描。你在這里左側(cè)看到的,這一邊是每瓦的tokens 數(shù)(tokens per watt)。每瓦 tokens 數(shù)很重要,因?yàn)槊總€(gè)數(shù)據(jù)中心,每個(gè)工廠(chǎng),根據(jù)定義,都是受電力限制的。一個(gè)1 吉瓦的工廠(chǎng)永遠(yuǎn)不會(huì)變成 2 吉瓦。它受到物理規(guī)律的限制,原子的規(guī)律,物理的規(guī)律。

對(duì)于那個(gè) 1 吉瓦的數(shù)據(jù)中心,你希望驅(qū)動(dòng)最大數(shù)量的 tokens,也就是那個(gè)工廠(chǎng)的產(chǎn)出、產(chǎn)品。你希望位于這條曲線(xiàn)的頂端,越高越好。這個(gè),x軸是交互性,推理的速度,每次推理的速度。你的推理速度越快,當(dāng)然,你的響應(yīng)就越快。

但非常重要的一點(diǎn)是,你的推理速度越快,模型就越大,你可以處理的語(yǔ)境就越多,你可以思考的 tokens 就越多。


這個(gè)軸等同于 AI 的聰明程度。這就是 AI 的吞吐量。這是 AI 的聰明程度。注意,AI 越聰明,你的吞吐量就越低。這說(shuō)得通。你思考的時(shí)間變長(zhǎng)了,對(duì)吧?

這個(gè)軸是速度,我回頭再來(lái)講這個(gè)。這就是我折磨你們所有人的地方,但它太重要了。你看世界上的每一位 CEO,從現(xiàn)在起,世界上的每一位CEO 都會(huì)以我將要描述的方式研究他們的業(yè)務(wù),因?yàn)檫@就是你們的 token 工廠(chǎng)。這就是你們的 AI 工廠(chǎng)。這就是你們的收入。這在未來(lái)是毫無(wú)疑問(wèn)的,這就是吞吐量,這就是智能。在數(shù)據(jù)中心的給定功率下,每瓦的性能越好,吞吐量就越高,你能生產(chǎn)的 tokens 就越多。這一側(cè)是成本。注意,NVIDIA 擁有世界上最高的性能。沒(méi)有人會(huì)對(duì)此感到驚訝。

他們會(huì)驚訝的是,在一代產(chǎn)品中,而 Moore’s Law 如果通過(guò)晶體管來(lái)實(shí)現(xiàn),通常只能給我們 50% 的提升,也就是翻倍的時(shí)間。Moore’s Law 大概能讓我們獲得 1.5 倍的性能。你原本預(yù)期從 Hopper H200 那里獲得 1.5 倍的提升。沒(méi)有人會(huì)預(yù)料到是 35 倍的提升。

去年這個(gè)時(shí)候我說(shuō)過(guò),NVIDIA 的 Grace Blackwell NVLink 72 的每瓦性能是之前的 35 倍。沒(méi)有人相信我。后來(lái) SemiAnalysis 發(fā)布了報(bào)告,Dylan Patel 說(shuō)了一句話(huà)。他指責(zé)我有所保留(sandbagging)。他說(shuō),“Jensen 隱藏了實(shí)力,實(shí)際上是 50 倍。”他沒(méi)說(shuō)錯(cuò)。我們的單 token 成本是世界上最低的。你無(wú)法擊敗它。

我之前說(shuō)過(guò),如果你的架構(gòu)是錯(cuò)誤的,即使它是免費(fèi)的,它也不夠便宜。原因在于,無(wú)論發(fā)生什么,你仍然必須建立一個(gè)吉瓦的數(shù)據(jù)中心。你仍然必須建立一個(gè)吉瓦的工廠(chǎng)。那個(gè)吉瓦的工廠(chǎng)要在 15 年內(nèi)攤銷(xiāo),那個(gè)吉瓦的工廠(chǎng)大約需要 400 億美元。

即使你在里面什么都不放,也投入了 400 億美元。你最好確保把最好的計(jì)算機(jī)系統(tǒng)放進(jìn)去,這樣你才能擁有最佳的 token 成本。NVIDIA 的 token 成本是世界級(jí)的,目前基本上是無(wú)法企及的。這之所以成真,是因?yàn)闃O致的協(xié)同設(shè)計(jì)(co-design)。我很高興他稱(chēng)呼我們?yōu)?Monkey King,Token King。

我們整合了我們所有的軟件和我們所有的技術(shù),無(wú)論我們?nèi)绾螌⑺鼈兇虬⒄系绞澜缟系耐评矸?wù)提供商那里。這些公司正在飛速發(fā)展。他們正在飛速發(fā)展。Fireworks,Lin 在這里,他們一起正在以難以置信的速度增長(zhǎng)。去年增長(zhǎng)了 100 倍。他們是 token 工廠(chǎng)。這些工廠(chǎng)的有效性、性能和 token 成本生產(chǎn)能力對(duì)他們來(lái)說(shuō)就是一切。這就是發(fā)生的事情。我們更新了他們的軟件,在同一系統(tǒng)上,注意看他們的 token 速度。令人難以置信。

在 NVIDIA 更新一切之前,包含我們引入的所有算法、軟件和所有技術(shù)之前,平均每秒約700 tokens,變成了將近 5000,高出了 7 倍。這就是極致協(xié)同設(shè)計(jì)不可思議的力量。

我之前提到了工廠(chǎng)的重要性,這就是工廠(chǎng)的重要性。你的數(shù)據(jù)中心,過(guò)去是用于存放文件的數(shù)據(jù)中心?,F(xiàn)在它是生成 tokens 的工廠(chǎng)。無(wú)論如何,你的工廠(chǎng)容量是有限的。每個(gè)人都在尋找土地、電力和外殼。一旦你建好它,你就會(huì)受到電力限制。在那個(gè)受電力限制的基礎(chǔ)設(shè)施內(nèi),你最好確保你的推理系統(tǒng),因?yàn)槟阒劳评硎悄愕墓ぷ髫?fù)載,而 tokens 是你新的商品,這些算力是你的收入,所以你想確保架構(gòu)得到盡可能優(yōu)化。

在未來(lái),每一個(gè) CSP(云服務(wù)提供商),每一家計(jì)算機(jī)公司,每一家云公司,每一家 AI 公司,坦白說(shuō),每一家公司,都將考慮其 token 工廠(chǎng)的效率。這就是你未來(lái)的工廠(chǎng)。我之所以知道這一點(diǎn),是因?yàn)檫@個(gè)房間里的每個(gè)人都受到智能的驅(qū)動(dòng)。在未來(lái),這種智能將得到 tokens 的增強(qiáng)。


談?dòng)布軜?gòu)的重大突破與路線(xiàn)圖

讓我向你們展示我們是如何走到這一步的。

2016 年4 月6日,也就是十年前,我們推出了DGX-1,世界上第一臺(tái)專(zhuān)為 deep learning 設(shè)計(jì)的計(jì)算機(jī)。8 塊 Pascal GPUs ,通過(guò)第一代 NVLink 連接。一臺(tái)計(jì)算機(jī)的算力達(dá) 170 萬(wàn)億次浮點(diǎn)運(yùn)算(teraflops),那是世界上第一臺(tái)為 AI 研究人員設(shè)計(jì)的計(jì)算機(jī)。

Volta時(shí)期,我們引入了 NVLink Switch。16 塊 GPUs 滿(mǎn)配帶寬全互聯(lián)(all-to-all),就像一個(gè)巨大的 GPU 一樣運(yùn)行。這是向前邁出的一大步,但模型規(guī)模繼續(xù)增長(zhǎng)。因數(shù)據(jù)中心需要變成一個(gè)單一的計(jì)算單元,于是 Mellanox 加入了 NVIDIA。

2020 年,DGX A100 SuperPOD 成為第一臺(tái)結(jié)合了scale-up(縱向擴(kuò)展)和scale-out(橫向擴(kuò)展)架構(gòu)的 GPU 超級(jí)計(jì)算機(jī)。NVLink 3 用于縱向擴(kuò)展,ConnectX-6 和 Quantum InfiniBand 用于橫向擴(kuò)展。

接著是Hopper。第一款搭載了開(kāi)啟生成式AI時(shí)代的 FP8 Transformer 引擎的 GPU。NVLink 4,ConnectX-7,BlueField-3 DPUs,第二代 Quantum InfiniBand。它徹底改變了計(jì)算。

Blackwell用NVLink 72 重新定義了AI超級(jí)計(jì)算系統(tǒng)的架構(gòu)。72塊GPUs由NVLink 主干(Spine)連接。全互聯(lián)帶寬達(dá)到130 TB/s。計(jì)算托盤(pán)集成了 Blackwell GPUs、Grace CPUs、ConnectX-8 和 BlueField-3。通過(guò) Spectrum-4 Ethernet 進(jìn)行橫向擴(kuò)展運(yùn)行。隨著三大定律(預(yù)訓(xùn)練、后期訓(xùn)練和推理)全速推進(jìn),現(xiàn)在又迎來(lái)了智能體系統(tǒng)的出現(xiàn),計(jì)算需求繼續(xù)呈指數(shù)級(jí)增長(zhǎng)。

現(xiàn)在,Vera Rubin的架構(gòu),專(zhuān)門(mén) agentic AI 的每個(gè)階段架構(gòu)設(shè)計(jì),推動(dòng)計(jì)算的每一個(gè)支柱發(fā)展,包括 CPU、存儲(chǔ)、網(wǎng)絡(luò)和安全。Vera Rubin NVLink 72,3.6 百億億次(exaflops)的算力,260 TB/s 的全互聯(lián) NVLink 帶寬。為 agentic AI 時(shí)代注入超級(jí)動(dòng)力的引擎,Vera CPU base(raft),專(zhuān)為編排和agentic 工作流設(shè)計(jì)。STX Rack,采用 BlueField-4 構(gòu)建的 AI 原生存儲(chǔ),利用 Spectrum-X 共封裝光學(xué)器件(co-packaged optics)進(jìn)行橫向擴(kuò)展,從而提高能效和恢復(fù)力。

現(xiàn)在有一項(xiàng)令人難以置信的新加入,即Groq 3 LPX 機(jī)架。它緊密連接到 Vera Rubin,Groq 的 LPU 擁有龐大的片上 SRAM,為本已快得驚人的 Vera Rubin 加裝了一個(gè) token 加速器。加在一起,每兆瓦的吞吐量增加了 35 倍。這就是全新的 Vera Rubin 平臺(tái)。7 種芯片,5 臺(tái)機(jī)架級(jí)計(jì)算機(jī),1 臺(tái)專(zhuān)為 agentic AI 打造的革命性 AI 超級(jí)計(jì)算機(jī)。僅僅 10 年,算力就提升了 4000 萬(wàn)倍。

過(guò)去,當(dāng)我說(shuō)起 Hopper 時(shí),我會(huì)舉起一塊芯片。那真可愛(ài)。而這是 Vera Rubin,當(dāng)我們想到 Vera Rubin 時(shí),我們想到的是整個(gè)系統(tǒng)。通過(guò)軟件實(shí)現(xiàn)了徹底的垂直整合,端到端延伸,作為一個(gè)巨大的系統(tǒng)進(jìn)行了優(yōu)化。

它專(zhuān)為智能體系統(tǒng)設(shè)計(jì),原因非常明確——對(duì)于 agents 而言,毫無(wú)疑問(wèn),最主要的工作負(fù)載就是讓大語(yǔ)言模型進(jìn)行思考。大語(yǔ)言模型將會(huì)變得越來(lái)越大,它將以更快的速度生成越來(lái)越多的 tokens,從而能夠思考得更快。

但它也必須訪(fǎng)問(wèn)內(nèi)存,那會(huì)對(duì)內(nèi)存打來(lái)極大的壓力,比如KV緩存、結(jié)構(gòu)化數(shù)據(jù)(cuDF)、非結(jié)構(gòu)化數(shù)據(jù)(cuVS)。它會(huì)對(duì)存儲(chǔ)系統(tǒng)造成極其猛烈的沖擊,這就是我們重新發(fā)明存儲(chǔ)系統(tǒng)的原因。

它也將使用各種工具。與對(duì)慢速計(jì)算機(jī)有較高容忍度的人類(lèi)不同,AI 希望這些工具越快越好。這些工具,比如網(wǎng)絡(luò)瀏覽器。未來(lái),它們也可能變成云端的虛擬 PC。這些 PC 和計(jì)算機(jī)必須盡可能快。我們創(chuàng)造了一款全新的 CPU。

這款全新的 CPU 專(zhuān)為極高的單線(xiàn)程性能、令人難以置信的高數(shù)據(jù)輸出、極佳的數(shù)據(jù)處理能力以及極致的能源效率而設(shè)計(jì)。它是世界上唯一采用 LPDDR5 的數(shù)據(jù)中心 CPU,其無(wú)與倫比的單線(xiàn)程性能和每瓦性能表現(xiàn)出色。

我們打造它是為了讓它與這些機(jī)架的其余部分配合,進(jìn)行 agentic 處理。這就是 Vera Rubin 系統(tǒng)。

大家注意,自上次以來(lái),它實(shí)現(xiàn)了 100% 液冷,所有的線(xiàn)纜也都不見(jiàn)了。以前需要兩天才能安裝完的設(shè)備,現(xiàn)在只需兩小時(shí),制造周期將大幅縮短。這同時(shí)也是一臺(tái)由 45 攝氏度熱水冷卻的超級(jí)計(jì)算機(jī),它減輕了數(shù)據(jù)中心的壓力,省去了用于冷卻數(shù)據(jù)中心的所有成本和能源,并將其全部供給系統(tǒng)使用。這就是我們的秘密武器。

我們是當(dāng)今世界上唯一一家打造出第六代縱向擴(kuò)展交換系統(tǒng)的公司。這不是以太網(wǎng)。也不是 InfiniBand,這是NVLink,這是第六代 NVLink。

坦白講,僅僅是把它做出來(lái)就極其困難。我為這個(gè)團(tuán)隊(duì)感到超級(jí)自豪。NVLink,完全采用液冷技術(shù)。這是全新的 Groq 系統(tǒng),稍后我會(huì)向你們展示更多相關(guān)內(nèi)容。這個(gè)系統(tǒng),包含 8 塊 Groq 芯片,這就是 LP30。之前面世的都只是 V1 版本,這是第三代,而且我們現(xiàn)在已經(jīng)進(jìn)入量產(chǎn)階段。等一下我會(huì)向大家展示更多相關(guān)信息。

世界首個(gè) CPO Spectrum-X 交換機(jī),這款產(chǎn)品也已全面投產(chǎn)。Co-packaged optics(共封裝光學(xué)),光學(xué)器件直接連接到這塊芯片上,與硅片直接接口。電子轉(zhuǎn)化為光子,直接與這塊芯片相連。我們與 TSMC 共同發(fā)明了這項(xiàng)工藝技術(shù)。我們是目前唯一將其投入量產(chǎn)的公司。它被稱(chēng)為CPO。這是徹底革命性的技術(shù)。NVIDIA 的 Spectrum-X 已全面投產(chǎn)。

這是 Vera 系統(tǒng),其每瓦性能是當(dāng)今世界上任何 CPUs 的兩倍,它也已經(jīng)投產(chǎn)了。你知道,我們之前從未想過(guò)我們會(huì)單獨(dú)銷(xiāo)售 CPUs。而現(xiàn)在我們正在單獨(dú)銷(xiāo)售大量的 CPU。毫無(wú)疑問(wèn),這已經(jīng)成為我們一項(xiàng)價(jià)值數(shù)十億美元的業(yè)務(wù)。所以我對(duì)我們的CPU 架構(gòu)師感到非常滿(mǎn)意。我們?cè)O(shè)計(jì)出了一款具有革命性的 CPU。這是由 Vera CPU 驅(qū)動(dòng)的 ConnectX-9,BlueField-4 STX,我們?nèi)碌拇鎯?chǔ)平臺(tái)。

這些是機(jī)架,而且它們是連接在一起的,這正是 NVLink 機(jī)架。我以前給你們看過(guò)這個(gè)。它超級(jí)重,而且感覺(jué)每年都在變重。因?yàn)槲艺J(rèn)為每年里面的線(xiàn)纜都在增加。這就是 NVLink 機(jī)架。由于這項(xiàng)技術(shù)效率極高,我們還利用這些布線(xiàn)系統(tǒng)、結(jié)構(gòu)化電纜來(lái)創(chuàng)建數(shù)據(jù)中心。

我們決定將其用在以太網(wǎng)上。這是一個(gè)包含 256 個(gè)液冷節(jié)點(diǎn)的以太網(wǎng)機(jī)架,并且它也通過(guò)這些令人難以置信的連接器連接在一起。你們想看看Rubin Ultra 嗎?這就是 Rubin Ultra 計(jì)算節(jié)點(diǎn)。

不同于水平插入的 Rubin,Rubin Ultra 放入的是一個(gè)全新的機(jī)架中。它叫做 Kyber,使我們能夠在一個(gè) NVLink 域內(nèi)連接 144 個(gè) GPUs。Kyber 機(jī)架,這個(gè)我肯定能舉起來(lái),但我不會(huì)這么做。它很重。這是一個(gè)計(jì)算節(jié)點(diǎn),它垂直滑入 Kyber 機(jī)架。它就是連接在這里的,這是中板(midplane)。Kyber 機(jī)架頂部的那四個(gè)NVLink 連接器滑入并與之連接,這就成了其中一個(gè)節(jié)點(diǎn)。這些機(jī)架中的每一個(gè)都是不同的計(jì)算節(jié)點(diǎn),接下來(lái)是令人驚嘆的部分。

這就是中板,而在中板的背面,取代了由于銅纜傳輸距離限制而存在局限的線(xiàn)纜系統(tǒng),我們現(xiàn)在有了這個(gè)系統(tǒng)來(lái)連接 144 個(gè) GPUs。這就是新型的 NVLink。它同樣垂直放置,并連接到背面的中板上。前面是計(jì)算單元,背面是NVLink 交換機(jī),共同組成了一臺(tái)巨型計(jì)算機(jī)。明白了嗎?這就是 Rubin Ultra。

你知道,只有在 NVIDIA 的主題演講中,你才會(huì)看到去年的幻燈片再次被展示。之所以這么做,我只想讓大家知道,去年我告訴過(guò)你們一件非常、非常重要的事情,因?yàn)樗匾耍灾档迷俑嬖V你們一次。


這可能是未來(lái)AI工廠(chǎng)最重要的一張圖表,世界上每一位 CEO 都會(huì)追蹤它,并深入研究它。實(shí)際情況比這要復(fù)雜和多維,但你們將研究各自AI工廠(chǎng)的吞吐量和 token 速度。

也就是誰(shuí),在恒定功耗條件下的吞吐量 token 速度,這就是你所擁有的全部電力,你的工廠(chǎng)在未來(lái)的吞吐量和 token 速度。這項(xiàng)分析將直接轉(zhuǎn)化為你的收入。你今年所做的,將準(zhǔn)確無(wú)誤地體現(xiàn)在明年的收入中,而這張圖表說(shuō)明了一切。剛才,我說(shuō)過(guò)縱軸是吞吐量,橫軸是 token 生成率。

今天,我要給你們看這個(gè)。因?yàn)槲覀儸F(xiàn)在有能力提高 token 的速度,同時(shí)也因?yàn)槟P鸵?guī)模在不斷增加,取決于不同應(yīng)用場(chǎng)景不同等級(jí)的需要,token的長(zhǎng)度、語(yǔ)境的長(zhǎng)度,不斷從10 萬(wàn)個(gè) token 的輸入長(zhǎng)度增長(zhǎng)到數(shù)百萬(wàn)個(gè)。輸入的 token 長(zhǎng)度在增長(zhǎng),輸出的 token 長(zhǎng)度也在增長(zhǎng)。所有這些最終都會(huì)影響未來(lái) tokens 的營(yíng)銷(xiāo)和定價(jià)。

Tokens 是新的商品,就像所有的商品一樣,一旦它到達(dá)一個(gè)拐點(diǎn),一旦它成熟或正在走向成熟,它就會(huì)細(xì)分為不同的部分。高吞吐量、低速度的可以作為免費(fèi)層(free tier)使用。下一層可能是中級(jí)層。也許是更大的模型,肯定是更高的速度,更長(zhǎng)的輸入語(yǔ)境長(zhǎng)度,這會(huì)轉(zhuǎn)化為不同的價(jià)格點(diǎn)。你可以從所有這些不同的服務(wù)中看到,這個(gè)是免費(fèi)的。它是一個(gè)免費(fèi)層。第一層可能是每百萬(wàn) tokens 3 美元。下一層可能是每百萬(wàn) tokens 6 美元。


你希望能夠不斷推動(dòng)這個(gè)邊界,因?yàn)槟P驮酱笤铰斆?,輸?token 的語(yǔ)境長(zhǎng)度越長(zhǎng),相關(guān)性就越強(qiáng)。速度越快,你就能思考和迭代得越多,AI 模型也就越聰明。這關(guān)乎于更聰明的 AI 模型。

當(dāng)你擁有更聰明的 AI 模型時(shí),這里的每一次升級(jí)都允許你提高價(jià)格。這是 45 美元,也許有一天會(huì)有一個(gè)高級(jí)模型,允許你提供一項(xiàng)高級(jí)服務(wù),提供極高的token 生成速度,因?yàn)槟闾幱陉P(guān)鍵路徑上,或者你正在進(jìn)行一項(xiàng)非常長(zhǎng)期的研究,那么每百萬(wàn) tokens 150 美元根本不算什么事。讓我們算算看。假設(shè)你作為一名研究人員每天使用 5000 萬(wàn)個(gè) tokens,按每百萬(wàn) tokens 150 美元計(jì)算。

事實(shí)證明,作為一個(gè)研究團(tuán)隊(duì),這點(diǎn)錢(qián)根本不算什么。我們相信這就是未來(lái)。這就是 AI 想要發(fā)展的方向。這就是它今天的現(xiàn)狀。它必須從這里開(kāi)始建立其價(jià)值和實(shí)用性,并且變得越來(lái)越好。在未來(lái),你將看到大多數(shù)服務(wù)涵蓋所有這些層級(jí)。

這是 Hopper。Hopper 從這里開(kāi)始,然后我移動(dòng)了圖表。


這是50,這是100。Hopper看起來(lái)像這樣,你原本會(huì)期望 Hopper 的下一代產(chǎn)品比它高,但沒(méi)有人會(huì)想到它會(huì)高出這么多。這就是 Grace Blackwell。Grace Blackwell 所做的是,在你的免費(fèi)層,極大地提高了你的吞吐量。然而,在你主要盈利的服務(wù)層,它將你的吞吐量提高了 35 倍。

這與世界上任何公司生產(chǎn)的任何產(chǎn)品沒(méi)有什么不同。層級(jí)越高,質(zhì)量越高,性能越高,產(chǎn)量越低,產(chǎn)能越低,所以這與世界上任何其他業(yè)務(wù)沒(méi)有什么不同?,F(xiàn)在我們能夠把這個(gè)層級(jí)提升 35 倍,并且我們引入了一個(gè)全新的層級(jí)。這就是 Grace Blackwell 帶來(lái)的好處,相對(duì) Hopper 是一個(gè)巨大的飛躍。

那么,這是我們?cè)?Grace Blackwell 上所做的事情。好的,這就是 Grace Blackwell。現(xiàn)在想想剛才發(fā)生了什么。在每一個(gè)層級(jí),我們都提高了吞吐量。在你平均售價(jià)(ASP)最高、最具價(jià)值的細(xì)分市場(chǎng),我們將它提高了 10 倍。

那就是最艱難的工作。在這個(gè)區(qū)域?qū)崿F(xiàn)這一點(diǎn)是極其困難的。這就是NVLink 72 帶來(lái)的好處。這就是極低延遲帶來(lái)的好處。這就是極致協(xié)同設(shè)計(jì)帶來(lái)的好處,讓我們能夠?qū)⒄麄€(gè)區(qū)域向上推移。

那么,從客戶(hù)的角度來(lái)看,最終這意味著什么?假設(shè)我拿 25% 的電力用于免費(fèi)層,25% 的電力用于中級(jí)層,25% 的電力用于高級(jí)層,最后 25% 的電力用于白金級(jí)/尊享層。我的數(shù)據(jù)中心只有一吉瓦,所以我得自己決定如何分配。免費(fèi)層讓我能吸引更多客戶(hù),而尊享層讓我能服務(wù)于最有價(jià)值的客戶(hù)。

所有這些的結(jié)合、這些要素的乘積,從根本上決定了你的收入,你可以產(chǎn)生的收入,在這個(gè)簡(jiǎn)化的例子中,Blackwell 能夠創(chuàng)造 5 倍的收入,Vera Rubin 能夠創(chuàng)造 5 倍的收入。是的,你應(yīng)該盡快部署 Vera Rubin,原因在于你生產(chǎn) tokens 的成本下降了,而你的吞吐量上升了。

正如我告訴你們的,這種吞吐量需要海量的浮點(diǎn)運(yùn)算(flops)。這種延遲,這種交互性需要極大的帶寬。計(jì)算機(jī)并不喜歡極高的浮點(diǎn)運(yùn)算和極大的帶寬同時(shí)存在,因?yàn)槿魏蜗到y(tǒng)的芯片表面積都是有限的。

對(duì)高吞吐量進(jìn)行優(yōu)化和對(duì)低延遲進(jìn)行優(yōu)化,實(shí)際上是一對(duì)死敵。當(dāng)我們與Groq 結(jié)合時(shí),情況就變成了這樣,明白嗎?我們收購(gòu)了研發(fā) Groq 芯片的團(tuán)隊(duì)并獲得了技術(shù)授權(quán),現(xiàn)在我們正攜手整合這個(gè)系統(tǒng)。它看起來(lái)就像這樣。在這個(gè)最具價(jià)值的層級(jí)上,我們現(xiàn)在要把性能提升 35 倍。


現(xiàn)在,這張簡(jiǎn)單的圖表向你揭示了,為什么 NVIDIA 迄今為止在絕大部分工作負(fù)載中如此強(qiáng)大。原因在于,在上面這個(gè)區(qū)域,吞吐量極其重要。NVLink 72 是如此具有顛覆性,它正是最正確的架構(gòu),即使在你加入 Groq 之后,也很難打敗它。

然而,如果你把這張圖表延伸到很遠(yuǎn)的地方,并且你說(shuō)你想要擁有一項(xiàng)服務(wù),它不僅能每秒提供400個(gè)tokens,而是每秒提供1000個(gè)tokens,突然之間,NVLink 72就會(huì)耗盡所有動(dòng)力,它就是達(dá)不到那個(gè)目標(biāo)。我們就是沒(méi)有足夠的帶寬。這正是Groq 的用武之地,當(dāng)我們把邊界向外推時(shí),這就是所發(fā)生的事情。它超出了 NVLink 72能力的極限。

如果你這樣做,把它轉(zhuǎn)化為相對(duì)于 Blackwell 的收入,Vera Rubin 是 5 倍。如果你絕大多數(shù)的工作負(fù)載是高吞吐量的,我建議你堅(jiān)持 100% 使用 Vera Rubin。如果你有很多工作負(fù)載是需要編寫(xiě)代碼和生成具有極高價(jià)值的工程 token,我就會(huì)把 Groq 加進(jìn)去。

我可能會(huì)在數(shù)據(jù)中心總量的約 25% 中加入 Groq。我數(shù)據(jù)中心的其余部分 100% 都是 Vera Rubin。這讓你了解了如何將 Groq 加入到 Vera Rubin 中,以進(jìn)一步擴(kuò)展其性能和價(jià)值。這正是發(fā)生的事情。這是一個(gè)對(duì)比。

Groq 之所以對(duì)我如此有吸引力,是因?yàn)樗麄兊挠?jì)算系統(tǒng),一種確定性的數(shù)據(jù)流處理器,它是靜態(tài)編譯的,由編譯器調(diào)度的,意思是編譯器能計(jì)算出何時(shí)進(jìn)行計(jì)算,數(shù)據(jù)和計(jì)算任務(wù)同時(shí)到達(dá)。所有這些都是提前靜態(tài)完成并在軟件中完全調(diào)度好的。不存在動(dòng)態(tài)調(diào)度。該架構(gòu)在設(shè)計(jì)上擁有海量的 SRAM。它專(zhuān)為推理而設(shè)計(jì),就針對(duì)這一種工作負(fù)載。

現(xiàn)在,正如事實(shí)證明的,這單一的工作負(fù)載,正是 AI factories 的核心工作負(fù)載。隨著世界不斷渴望利用超級(jí)聰明的 tokens 生成高速的 tokens,這種整合的價(jià)值將會(huì)變得越來(lái)越高。你們可以看到,這是兩款走向極端的處理器。

一顆芯片,500 MB(指Groq)。一顆 Vera Rubin 芯片,一顆 Rubin 芯片,288 GB。你需要數(shù)量龐大的 Groq 芯片才能裝下 Rubin 級(jí)別的參數(shù)規(guī)模,以及隨之而來(lái)的所有上下文環(huán)境,即必須配套的 KV cache。這限制了 Groq 真正走向主流、真正起飛的能力,直到我們有了一個(gè)偉大的主意。如果我們將一款名為 Dynamo 的軟件與推理完全解耦會(huì)怎樣?

如果我們?cè)诹魉€(xiàn)中重構(gòu)推理的進(jìn)行方式,將最適合在 Vera Rubin 上運(yùn)行的任務(wù)交給它,然后把面臨延遲要求低、受限于帶寬挑戰(zhàn)的 decode生成任務(wù)卸載給 Groq 會(huì)怎樣?我們將兩款截然不同的處理器合二為一,一款用于高吞吐量,一款用于低延遲。這仍然改變不了一個(gè)事實(shí),那就是我們需要大量的內(nèi)存。關(guān)于 Groq,我們只需要加入一大堆Groq 芯片,從而擴(kuò)展它的內(nèi)存容量。大家可以想象一下,對(duì)于一個(gè)萬(wàn)億參數(shù)的模型,我們必須把所有參數(shù)都存儲(chǔ)在 Groq 芯片中。

然而,它緊挨著 NVIDIA Vera Rubin,在這里我們可以容納處理所有這些 agentic AI 系統(tǒng)所必需的海量 KV cache。它就是基于這個(gè)分解推理的想法。我們進(jìn)行 prefill(預(yù)填充),那是簡(jiǎn)單的部分,但我們也緊密整合了 decode(解碼)。

Decode 中的 attention(注意力機(jī)制)部分在 NVIDIA 的 Vera Rubin 上完成,這部分需要大量的數(shù)學(xué)運(yùn)算,而前饋網(wǎng)絡(luò)(feed forward network)部分,即 decode 部分,token 的生成部分則在 Groq 芯片上完成。這兩者在今天的 Ethernet 上緊密耦合地協(xié)同工作,采用一種特殊的模式將其延遲降低約一半。這種能力讓我們得以將這兩個(gè)系統(tǒng)整合在一起。

我們?cè)谄渖线\(yùn)行了 Dynamo,這是一款專(zhuān)為 AI factories 打造的不可思議的操作系統(tǒng),然后你獲得了 35 倍的性能提升。35 倍的提升,更不用說(shuō)在 token 生成方面為推理性能開(kāi)辟了世界從未見(jiàn)過(guò)的新層級(jí)。

就是這個(gè),這是 Groq。Vera Rubin 系統(tǒng),包括 Groq,我要感謝 Samsung(三星),他們?yōu)槲覀冎圃炝?Groq LP30 芯片,他們正開(kāi)足馬力拼命生產(chǎn)。我真的非常感謝你們。我們的 Groq 芯片已經(jīng)投產(chǎn),正如大家所知,我們將在下半年發(fā)貨,大概在第三季度左右。Vera Rubin,大家知道,很難想象還有更多的客戶(hù)了。

真正棒的是,Grace Blackwell 的早期樣品測(cè)試因?yàn)檎狭?NVLink 72 變得非常復(fù)雜,但 Vera Rubin 的樣品測(cè)試進(jìn)展得非常順利。事實(shí)上,我想 Satya 已經(jīng)發(fā)信息告訴我,第一臺(tái) Vera Rubin 機(jī)架已經(jīng)在 Microsoft Azure 上啟動(dòng)并運(yùn)行了,所以我為他們感到超級(jí)興奮。我們將繼續(xù)大量生產(chǎn)這些設(shè)備。

我們現(xiàn)在已經(jīng)建立了一個(gè)供應(yīng)鏈,可以每周生產(chǎn)數(shù)以千計(jì)的這種系統(tǒng),本質(zhì)上相當(dāng)于在我們的供應(yīng)鏈內(nèi)部每月生產(chǎn)數(shù)吉瓦的 AI factories。我們將在全力生產(chǎn) GB300 機(jī)架的同時(shí),源源不斷地生產(chǎn)這些 Vera Rubin 機(jī)架。我們已經(jīng)全面投產(chǎn)。Vera CPUs 取得了令人難以置信的成功。

原因在于 AI 在使用工具時(shí)需要 CPUs,而 Vera CPU 的設(shè)計(jì)完美契合了這一黃金位置(sweet spot)。對(duì)于下一代數(shù)據(jù)處理來(lái)說(shuō),它不可思議的棒。Vera CPU 是理想的選擇。Vera CPU 加上 CX9 連接到 BlueField-4 堆棧。全球 100% 的存儲(chǔ)行業(yè)都在與我們一起加入這個(gè)系統(tǒng)。原因在于他們看到了完全相同的情況。存儲(chǔ)系統(tǒng)將會(huì)受到猛烈沖擊。它會(huì)受到猛烈沖擊是因?yàn)槲覀冞^(guò)去是由人類(lèi)使用存儲(chǔ)系統(tǒng),我們過(guò)去是由人類(lèi)使用 SQL?,F(xiàn)在我們要讓 AIs 來(lái)使用這些存儲(chǔ)系統(tǒng),它將存儲(chǔ) cuDF 加速存儲(chǔ)內(nèi)容、cuVS 加速存儲(chǔ)內(nèi)容,以及非常重要的,KV caching。這就是Vera Rubin 系統(tǒng)?,F(xiàn)在,令人驚嘆的是這個(gè)。


在短短兩年時(shí)間里,在一個(gè) 1 吉瓦的工廠(chǎng)中,利用我剛才向你們展示的數(shù)學(xué)計(jì)算,原本 Moore’s Law 可能只會(huì)帶給我們幾個(gè)小步幅的進(jìn)步,我們本可以讓晶體管數(shù)量翻倍,本可以讓浮點(diǎn)運(yùn)算數(shù)翻倍,本可以讓帶寬容量翻倍。但借助于這種架構(gòu),我們將把我們的 token 生成速度、token 生成率從 200 萬(wàn)提升到 7 億,這是 350 倍的飛躍。這就是極致協(xié)同設(shè)計(jì)的力量。這就是我所說(shuō)的我們?cè)诖怪睂用孢M(jìn)行整合與優(yōu)化,然后在水平層面面向所有人開(kāi)放的含義,讓每個(gè)人都能享受到紅利。這是我們的路線(xiàn)圖。

我們始終保持向后兼容,因此如果你不想做任何更改,只想繼續(xù)使用新架構(gòu),你完全可以做到。標(biāo)準(zhǔn)的機(jī)架系統(tǒng),Oberon,依然可用。Oberon 是基于銅線(xiàn)的 scale-up(縱向擴(kuò)展),并且通過(guò) Oberon,我們還可以使用光學(xué) scale-up 將連接擴(kuò)展到 NVLink 576。明白了嗎?關(guān)于 NVIDIA 將使用銅線(xiàn) scale-up 還是光學(xué) scale-up 有很多討論?我們兩者都會(huì)做。我們將提供采用 Kyber 機(jī)架的 NVLink 144,然后使用 Oberon 機(jī)架,我們將提供 NVLink 72 加上光學(xué)連接,以達(dá)到 NVLink 576。Rubin 的下一代產(chǎn)品配備了 Rubin Ultra,我們即將推出 Rubin Ultra 芯片,目前正在流片階段,并且我們還有一款全新芯片,LP35。

LP35 ,將首次集成 NVIDIA 的 NVFP4 計(jì)算結(jié)構(gòu),為你帶來(lái)又一個(gè)數(shù)倍的 X 因子速度提升。明白了嗎?這就是 Oberon,NVLink 72,光學(xué) scale-up,并且它使用了 Spectrum-6,世界上首個(gè)共封裝光學(xué)系統(tǒng)(co-packaged optical),所有這些都已投產(chǎn)。由此往后的下一代是Feynman。

Feynman 顯然有一款新的 GPU。它還擁有一款新的 LPU,LP40。這是很大的一步跨越。令人難以置信的新技術(shù)?,F(xiàn)在融合了 NVIDIA 的規(guī)模以及攜手打造的 Groq 團(tuán)隊(duì),這就是 LP40。它將不可思議。一款名為 Rosa 的全新 CPU,它是 Rosalind 的縮寫(xiě)。BlueField-5,它將下一代 CPU 與下一代 SuperNIC(超級(jí)網(wǎng)卡)CX10 連接起來(lái)。我們將提供 Kyber,也就是基于銅線(xiàn)的 scale-up。我們也將提供 Kyber 的 CPO scale-up。我們將破天荒第一次同時(shí)采用銅線(xiàn)和共封裝光學(xué)技術(shù)(co-packaged optics)進(jìn)行 scale up。

很多人一直在問(wèn),“Jensen,銅線(xiàn)還會(huì)重要嗎?”答案是肯定的?!癑ensen,你會(huì)用光學(xué)進(jìn)行 scale up 嗎?”會(huì)的?!澳銜?huì)用光學(xué)進(jìn)行 scale out 嗎?”會(huì)的。

對(duì)于我們生態(tài)系統(tǒng)中的每一個(gè)人來(lái)說(shuō),我們需要更多的容量,這才是真正的關(guān)鍵。我們需要用于銅線(xiàn)的更多容量。我們需要用于光學(xué)的更多容量。我們需要用于 CPO 的更多容量,這就是我們一直與大家合作,為這種程度的增長(zhǎng)奠定基礎(chǔ)的原因。Feynman 將擁有這一切。讓我看看我有沒(méi)有遺漏什么。就是這些。每一年,都有全新的架構(gòu)。


談數(shù)字孿生與NVIDIA DSX平臺(tái),“榨干”每一瓦電

NVIDIA 正在飛速地英偉達(dá)從一家芯片公司變成了一家AI工廠(chǎng)公司,或者說(shuō) AI 基礎(chǔ)設(shè)施公司、AI 計(jì)算公司,打造這些系統(tǒng),而現(xiàn)在我們正在構(gòu)建完整的AI工廠(chǎng)。

在這些AI工廠(chǎng)中有太多的能源被浪費(fèi)了。我們想要確保這些AI工廠(chǎng)以最佳的方式組合和設(shè)計(jì)在一起。過(guò)去,這里的多數(shù)組件彼此之間毫無(wú)交集。而在座的我們大多是技術(shù)供應(yīng)商,現(xiàn)在我們彼此都認(rèn)識(shí)了,但在過(guò)去,直到進(jìn)了數(shù)據(jù)中心我們才碰面。這種事絕不能發(fā)生。

我們正在構(gòu)建極其復(fù)雜的系統(tǒng),所以我們必須在其他地方以虛擬的方式會(huì)面。所以,我們創(chuàng)造了OmniverseOmniverse DSX世界——一個(gè)讓大家都能聚集在一起,在系統(tǒng)中通過(guò)虛擬方式設(shè)計(jì)這些千兆瓦級(jí)的工廠(chǎng),這些千兆瓦級(jí)的工廠(chǎng)AI平臺(tái)。

我們擁有在機(jī)械、熱力學(xué)、電氣和網(wǎng)絡(luò)方面的機(jī)架模擬系統(tǒng)。這些模擬系統(tǒng)集成到了我們生態(tài)系統(tǒng)合作伙伴令人難以置信的工具軟件中。我們?cè)谶\(yùn)行時(shí)還連接到了電網(wǎng),這樣我們就可以互相交互,互相發(fā)送信息,以便我們能夠相應(yīng)地調(diào)整電網(wǎng)電力和數(shù)據(jù)中心電力,從而節(jié)約能源。

在數(shù)據(jù)中心內(nèi)部使用 Max-Q 技術(shù),這樣我們就可以跨電力、冷卻系統(tǒng)以及我們共同研發(fā)的所有不同技術(shù),動(dòng)態(tài)地調(diào)整系統(tǒng),從而確保我們不浪費(fèi)一絲電力,讓我們以最優(yōu)化的速率運(yùn)行,從而提供海量的 token 吞吐量。在我的心里毫無(wú)疑問(wèn),這里面潛藏著兩倍(的提升空間),而在我們所討論的這種規(guī)模下,兩倍的意義是極其巨大的。

我們將其稱(chēng)為 NVIDIA DSX 平臺(tái),并且就像我們所有的平臺(tái)一樣,它有硬件層,有庫(kù)層,還有生態(tài)系統(tǒng)層。運(yùn)作方式完全一樣。

Omniverse 的初衷是為了承載世界的數(shù)字孿生,從地球開(kāi)始,它將承載各種規(guī)模的數(shù)字孿生。我們擁有極其出色的合作伙伴生態(tài)系統(tǒng)。我想感謝你們所有人。所有這些公司對(duì)我們的世界來(lái)說(shuō)都是全新的面孔。僅僅在幾年前,我們還不認(rèn)識(shí)你們當(dāng)中的許多人,而現(xiàn)在我們緊密合作,共同努力建造世界上前所未有的最龐大的計(jì)算機(jī),并且要在行星的尺度上實(shí)現(xiàn)這一目標(biāo)。

NVIDIA DSX 是我們?nèi)碌?/strong> AI工廠(chǎng)平臺(tái)。我這次只會(huì)花很少的時(shí)間談?wù)撨@個(gè)。然而,我們正在進(jìn)軍太空。我們已經(jīng)進(jìn)入了太空,Thor 已經(jīng)通過(guò)了防輻射認(rèn)證,并且我們正搭載在衛(wèi)星上。你將在衛(wèi)星上進(jìn)行成像處理。


未來(lái),我們還將在太空中建造數(shù)據(jù)中心。顯然,這樣做非常復(fù)雜。我們正與我們的合作伙伴合作研發(fā)一款名為Vera Rubin Space One 的新計(jì)算機(jī),它將進(jìn)入太空并開(kāi)始在那里建立數(shù)據(jù)中心。現(xiàn)在,當(dāng)然,在太空中沒(méi)有傳導(dǎo),沒(méi)有對(duì)流,只有輻射。我們必須弄清楚如何在太空中冷卻這些系統(tǒng),但我們已經(jīng)有許多優(yōu)秀的工程師在研究這個(gè)問(wèn)題了。


OpenClaw引發(fā)的軟件界大地震

Peter Steinberger (彼得·斯坦伯格)就在現(xiàn)場(chǎng),他編寫(xiě)了OpenClaw。我不知道他是否意識(shí)到了它將會(huì)取得多大的成功,但它的重要性是極其深遠(yuǎn)的。OpenClaw 是人類(lèi)歷史上排名第一、最受歡迎的開(kāi)源項(xiàng)目,它在短短幾周內(nèi)就實(shí)現(xiàn)了這一壯舉,它超越了 Linux 在 30 年內(nèi)所取得的成就。


讓我快速給大家演示一下。我想給你們展示兩樣?xùn)|西。你只要簡(jiǎn)單輸入這個(gè)。你把它輸入到控制臺(tái),它就會(huì)運(yùn)行,找到 OpenClaw,下載它并為你構(gòu)建一個(gè) AI agent,然后你可以告訴它任何你需要它做的事情。

不可思議。剛才我以大家都能理解的方式,直觀(guān)地演示了什么是OpenClaw,但讓我們想一想究竟發(fā)生了什么。

什么是 OpenClaw?

它是連接件,它是一個(gè)智能體系統(tǒng)。它調(diào)用并連接到大語(yǔ)言模型。首先它擁有它所管理的資源,它可以訪(fǎng)問(wèn)工具,可以訪(fǎng)問(wèn)文件系統(tǒng),還可以訪(fǎng)問(wèn)大語(yǔ)言模型。它能做調(diào)度安排。它能運(yùn)行定時(shí)任務(wù)(cron jobs)。它能夠把你給它的 prompt 分解成一步步的操作。它可以衍生并調(diào)用其他次級(jí) agents。它擁有 IO 接口。你可以用任何模態(tài)與它對(duì)話(huà)。你可以向它揮手,它就能理解你。你可以用任何你想要的模態(tài)與它交談。它會(huì)發(fā)信息給你,給你發(fā)短信,發(fā)電子郵件。

它有輸入輸出(I/O)?;谶@一點(diǎn),你可能會(huì)說(shuō),實(shí)際上,它就是一個(gè)操作系統(tǒng)。我剛才用來(lái)描述它的語(yǔ)句,就和我描述一個(gè)操作系統(tǒng)用的語(yǔ)句一模一樣。OpenClaw 本質(zhì)上就是開(kāi)源了 agentic computers 的操作系統(tǒng)。這與 Windows 讓我們得以創(chuàng)造出個(gè)人電腦沒(méi)有什么不同?,F(xiàn)在,OpenClaw 讓我們得以創(chuàng)造出個(gè)人智能體(personal agents)。其影響是不可思議的。

首先,它的采納速度本身就說(shuō)明了問(wèn)題。然而,最重要的事情是這個(gè)——現(xiàn)在的每一家公司,每一家軟件公司,每一家技術(shù)公司,對(duì)于這些公司的 CEOs 來(lái)說(shuō),他們面臨的問(wèn)題是,“你的 OpenClaw 戰(zhàn)略是什么?”

就像我們都需要有一個(gè) Linux 戰(zhàn)略一樣,我們過(guò)去都需要有一個(gè) HTTP、HTML 戰(zhàn)略,它開(kāi)啟了互聯(lián)網(wǎng)時(shí)代。我們都需要有一個(gè) Kubernetes 戰(zhàn)略,它使得移動(dòng)云成為可能。當(dāng)今世界上的每一家公司都需要有一個(gè) OpenClaw 戰(zhàn)略,一個(gè)智能體系統(tǒng)戰(zhàn)略。

接下來(lái)才是激動(dòng)人心的部分。這就是擁有 OpenClaw 之前的企業(yè) IT,你們知道嗎?我之前提到了企業(yè) IT 的工作方式,之所以把它們稱(chēng)為數(shù)據(jù)中心,是因?yàn)檫@些大房間、大樓里保存著數(shù)據(jù),保存著人們的文件,保存著商業(yè)運(yùn)作的 structured data。

它會(huì)經(jīng)過(guò)包含工具的軟件,你知道,包含記錄系統(tǒng)以及所有這些被編纂進(jìn)軟件的工作流,然后這些就變成了供人類(lèi)使用、供數(shù)字工作者使用的工具。那就是舊的 IT 產(chǎn)業(yè),軟件公司創(chuàng)建工具,保存文件,當(dāng)然還有 GSI 的顧問(wèn)們來(lái)幫助公司弄清楚如何使用和集成這些工具。這些工具在管理、安全、隱私和合規(guī)性方面極具價(jià)值,而所有這些在今天依然是真理。

只不過(guò),在后OpenClaw時(shí)代,在后agentic時(shí)代,它將會(huì)變成這副模樣。這就是非同尋常的部分。每一家IT公司,每一家公司,每一家SaaS公司,每一家SaaS公司都將成為一家AaaS公司。這一點(diǎn)毫無(wú)疑問(wèn)。每一家SaaS公司都將成為一家AaaS公司,一家agentic as a service(代理即服務(wù))公司。

令人驚嘆的是:大家知道,OpenClaw 在最恰當(dāng)?shù)臅r(shí)機(jī)給了整個(gè)行業(yè)最需要的東西。就像 Linux 在最恰當(dāng)?shù)臅r(shí)機(jī)給了整個(gè)行業(yè)最需要的東西一樣,就像 Kubernetes 在最恰當(dāng)?shù)臅r(shí)機(jī)出現(xiàn)一樣,就像 HTML 的出現(xiàn)一樣。它使整個(gè)行業(yè)能夠抓住這個(gè)開(kāi)源軟件棧去做點(diǎn)什么。

只是有一個(gè)問(wèn)題。公司網(wǎng)絡(luò)中的智能體系統(tǒng)可能會(huì)訪(fǎng)問(wèn)敏感信息,它可能執(zhí)行代碼,并且可能向外部通信。仔細(xì)想想。訪(fǎng)問(wèn)敏感信息,執(zhí)行代碼,向外部通信。當(dāng)然,你可以訪(fǎng)問(wèn)員工信息,訪(fǎng)問(wèn)財(cái)務(wù)信息、敏感信息,并把它發(fā)送出去,向外部通信。顯然,這絕對(duì)不能被允許。

我們所做的是與 Peter 合作。我們召集了世界上最頂尖的安全和計(jì)算專(zhuān)家,與 Peter 合作,讓 OpenClaw 具備保障企業(yè)級(jí)安全和企業(yè)級(jí)隱私的能力。我們將其稱(chēng)為 NemoClaw——它包含了所有這些 agentic AI 工具包,其中第一部分就是我們稱(chēng)為 OpenShell 的技術(shù),它現(xiàn)在已經(jīng)被整合到了 OpenClaw 中。


現(xiàn)在它已經(jīng)具備了企業(yè)級(jí)就緒(enterprise-ready)能力。這個(gè)包含我們稱(chēng)為 NemoClaw 的參考設(shè)計(jì)的技術(shù)棧,明白嗎?

有了名為 NemoClaw 的參考棧,你就可以下載它,體驗(yàn)它,你可以將世界上所有 SaaS 公司的策略引擎連接到它上面,而你們的策略引擎極其重要,極具價(jià)值。

NemoClaw或者搭載OpenShell的OpenClaw將能夠執(zhí)行那個(gè)策略引擎。它有網(wǎng)絡(luò)護(hù)欄,它有隱私路由器,這樣一來(lái),我們就可以保護(hù)并阻止爪子(claws,指代agents)在我們的公司內(nèi)部執(zhí)行危險(xiǎn)操作,并且安全地運(yùn)行。

我們還在智能體系統(tǒng)中添加了一些功能,你想對(duì)你自己定制的爪子做的最重要的一件事,就是讓你可以擁有你的定制模型,這就是NVIDIA的Open Model Initiative。我們現(xiàn)在處于每個(gè)AI模型領(lǐng)域的前沿,無(wú)論是在Nemotron、Cosmos world foundation model、Groot、通用人工智能機(jī)器人、人形機(jī)器人模型,用于自動(dòng)駕駛車(chē)輛的Alpamayo,用于數(shù)字生物學(xué)的BioNeMo,還是用于 AI 物理的 Earth-2。我們?cè)诿恳粋€(gè)領(lǐng)域都處于前沿。

以下為視頻內(nèi)容:世界是多樣的。沒(méi)有哪個(gè)單一的模型能夠服務(wù)于所有的行業(yè)。Open Models 是世界上最大、最多樣化的AI 生態(tài)系統(tǒng)之一。近 300 萬(wàn)個(gè)跨越語(yǔ)言、視覺(jué)、生物、物理和自主系統(tǒng)的開(kāi)放模型,使專(zhuān)業(yè)領(lǐng)域的 AI 構(gòu)建成為可能。NVIDIA 是開(kāi)源 AI 的最大貢獻(xiàn)者之一,我們構(gòu)建并發(fā)布了六個(gè)系列的開(kāi)放前沿模型,外加訓(xùn)練數(shù)據(jù)、配方和框架,以幫助開(kāi)發(fā)者定制和采用。每個(gè)系列都有霸榜的新模型發(fā)布。處于核心的是 Nemotron,用于語(yǔ)言、視覺(jué)理解、RAG、安全和語(yǔ)音的推理模型。

Groot,通用機(jī)器人的foundation models。BioNeMo,用于生物學(xué)、化學(xué)和分子設(shè)計(jì)的開(kāi)放模型。Earth-2,根植于 AI 物理學(xué)的用于天氣和氣候預(yù)測(cè)的模型。NVIDIA 的開(kāi)放模型為研究人員和開(kāi)發(fā)人員提供了為他們自己的專(zhuān)業(yè)領(lǐng)域構(gòu)建和部署 AI的基礎(chǔ)。我們的模型對(duì)你們所有人都有價(jià)值,因?yàn)榈谝?,它位居排行榜榜首,它是世界?jí)的。最重要的是,我們絕不會(huì)放棄在這上面繼續(xù)努力。我們將日復(fù)一日地繼續(xù)開(kāi)發(fā)它。

Nemotron-3 之后將會(huì)有 Nemotron-4。Cosmos-1 之后是 Cosmos-2。Groot 將進(jìn)化到第二代。所有這其中的每一個(gè),我們將繼續(xù)推進(jìn)這些模型。垂直整合,橫向開(kāi)放,以便我們能夠讓每個(gè)人都加入這場(chǎng) AI 革命。

在研究、語(yǔ)音和 world models、人工通用機(jī)器人、自動(dòng)駕駛汽車(chē)以及推理等方面位居排行榜榜首,當(dāng)然,其中最重要的一項(xiàng)是,這是在 OpenClaw 中的 Nemotron-3,看看前 3 名,它們是世界上最好的 3 個(gè)模型。我們處于前沿。而且,我們確實(shí)想創(chuàng)建基礎(chǔ)模型,這樣你們所有人都可以對(duì)其進(jìn)行 fine-tune(微調(diào))和 post-train(后期訓(xùn)練),使之成為你們所需要的那種智能。這是 Nemotron-3 Ultra。它將成為世界上曾被創(chuàng)造出的最優(yōu)秀的 base model(基礎(chǔ)模型)。這使得我們能夠幫助每個(gè)國(guó)家建立他們的 sovereign AI(主權(quán)AI),我們正在與外面的許許多多不同的公司合作。

我們今天正在做的,也是我今天正在宣布的最令人興奮的事情之一,是一個(gè)Nemotron 聯(lián)盟。我們對(duì)此非常專(zhuān)注,已經(jīng)在 AI 基礎(chǔ)設(shè)施上投資了數(shù)十億美元。這樣我們就可以開(kāi)發(fā) AI 所必需的核心引擎,包括用于推理的所有庫(kù)等等,而且還創(chuàng)建激活世界上每一個(gè)行業(yè)所需的 AI 模型。大語(yǔ)言模型確實(shí)非常重要。人類(lèi)智能怎么可能不重要呢?然而,在世界上的不同行業(yè)中,在世界上的不同國(guó)家里,你需要具備定制自己模型的能力,而這些模型涉及的領(lǐng)域截然不同,從生物學(xué)到物理學(xué),到自動(dòng)駕駛汽車(chē),到通用機(jī)器人,當(dāng)然,再到人類(lèi)語(yǔ)言。

我們有能力與每一個(gè)地區(qū)合作,創(chuàng)建屬于他們特定領(lǐng)域的、他們的sovereign AI。

這是一次重塑,這是企業(yè) IT 的一場(chǎng)文藝復(fù)興。這個(gè)原本規(guī)模達(dá) 2 萬(wàn)億美元的產(chǎn)業(yè),將變成一個(gè)價(jià)值數(shù)萬(wàn)億美元的產(chǎn)業(yè),不僅僅提供給人們使用的工具,而是提供深耕于你們所擅長(zhǎng)的特定領(lǐng)域的 agents,我們可以租用這些 agents。我可以完全想象在未來(lái),我們公司的每一位工程師都需要一筆年度 token 預(yù)算,他們每年的底薪會(huì)是幾十萬(wàn)美元。

在那基礎(chǔ)之上,我很可能會(huì)額外提供一半的價(jià)值作為 tokens 給他們,這樣他們的產(chǎn)出就能被放大 10 倍。我們當(dāng)然會(huì)這樣做,它現(xiàn)在已經(jīng)成為了硅谷招聘的籌碼之一。我的工作附帶多少 tokens?其原因非常明顯,因?yàn)槊總€(gè)能使用 tokens 的工程師都將更具生產(chǎn)力。

大家知道,這些 tokens 將由AI工廠(chǎng)生產(chǎn)出來(lái),那是我們與你們所有人合作建立的,明白嗎?當(dāng)今的每家企業(yè)級(jí)公司都建立在文件系統(tǒng)和數(shù)據(jù)中心之上。未來(lái)的每家軟件公司都將是 agentic 的,他們將成為 token 制造商。他們將成為其工程師的 token 用戶(hù),并且他們將成為他們所有客戶(hù)的 token 制造商。

OpenClaw 這一事件的影響怎么強(qiáng)調(diào)都不為過(guò)。這絕不亞于 HTML 的重要性。這絕不亞于Linux 的重要性。我們現(xiàn)在擁有了一個(gè)世界級(jí)的開(kāi)放 agentic 框架,我們所有人都可以使用它來(lái)構(gòu)建我們的 OpenClaw 戰(zhàn)略。我們創(chuàng)建了一個(gè)我們稱(chēng)之為 NemoClaw 的參考設(shè)計(jì),供你們所有人使用,它經(jīng)過(guò)了優(yōu)化,性能卓越,并且安全可靠。


談物理 AI 與機(jī)器人

說(shuō)到 agents,你們知道,它們會(huì)感知、推理和執(zhí)行。我剛才談到的世界上絕大多數(shù)agents 都是 digital agents。它們?cè)跀?shù)字世界里行動(dòng)。它們進(jìn)行推理,它們編寫(xiě)軟件。一切都是數(shù)字化的。但很長(zhǎng)一段時(shí)間,我們也一直致力于研發(fā)具有物理實(shí)體的 agents。我們稱(chēng)之為機(jī)器人,而它們需要的 AI 是物理 AI 。

這里有 110 個(gè)機(jī)器人,我就簡(jiǎn)單帶大家過(guò)幾個(gè)。


我想不出世界上幾乎有哪一家制造機(jī)器人的公司沒(méi)有在與 NVIDIA 合作。我們有三臺(tái)計(jì)算機(jī):用于訓(xùn)練的計(jì)算機(jī),用于合成數(shù)據(jù)生成和模擬的計(jì)算機(jī),當(dāng)然,還有內(nèi)置于機(jī)器人本身的機(jī)器人計(jì)算機(jī)。我們擁有做到這一點(diǎn)所需的所有軟件堆棧。幫助你的 AI 模型。所有這些都被整合到了世界各地的生態(tài)系統(tǒng)中,并且我們有來(lái)自 Siemens、Cadence 的不可思議的合作伙伴遍布各地。

今天,我們宣布了一大批新的合作伙伴。如你們所知,我們?cè)谧詣?dòng)駕駛汽車(chē)領(lǐng)域深耕已久,自動(dòng)駕駛汽車(chē)的 ChatGPT 時(shí)刻已經(jīng)到來(lái)。我們現(xiàn)在知道我們可以成功地讓汽車(chē)自動(dòng)駕駛,今天我們宣布了 NVIDIA robotaxi-ready 平臺(tái)的四位新合作伙伴。


BYD、Hyundai、Nissan、Geely,加在一起每年生產(chǎn) 1800 萬(wàn)輛汽車(chē)。加上我們之前的合作伙伴,Mercedes、Toyota、GM ,未來(lái) robotaxi-ready 汽車(chē)的數(shù)量將令人驚嘆。我們也宣布了與 Uber 達(dá)成的一項(xiàng)重大合作。在多個(gè)城市,我們將把這些robotaxi-ready 車(chē)輛部署并連接到他們的網(wǎng)絡(luò)中。我們有 ABB、Universal Robots、KUKA 以及很多機(jī)器人公司在這里,我們正在與他們合作,將我們的 physical AI 模型整合到模擬系統(tǒng)中,以便我們可以將這些機(jī)器人部署到世界各地的生產(chǎn)線(xiàn)上。我們有 Caterpillar 在這里。我們甚至有 T-Mobile 在這里,其原因是,在未來(lái),過(guò)去被稱(chēng)為無(wú)線(xiàn)電塔的設(shè)施,將變成一座 NVIDIA Aerial AI RAN。

它將變成一座機(jī)器人無(wú)線(xiàn)電塔,這意味著它可以對(duì)交通情況進(jìn)行推理,計(jì)算出如何調(diào)整其波束成形(beam forming),從而能夠盡可能多地節(jié)省能源并盡可能地提高信號(hào)保真度。這里有許許多多的人形機(jī)器人,但我最喜歡的是迪士尼的機(jī)器人。

這是 physical AI 和機(jī)器人技術(shù)的時(shí)代。在世界各地,開(kāi)發(fā)人員正在構(gòu)建各種各樣的機(jī)器人。真實(shí)世界是極其龐大且多樣化的、不可預(yù)測(cè)的,充滿(mǎn)了邊緣情況?,F(xiàn)實(shí)世界的數(shù)據(jù)永遠(yuǎn)不足以用來(lái)針對(duì)所有場(chǎng)景進(jìn)行訓(xùn)練。我們需要從 AI 和模擬中生成數(shù)據(jù)。對(duì)于機(jī)器人來(lái)說(shuō),計(jì)算就是數(shù)據(jù)。開(kāi)發(fā)者在互聯(lián)網(wǎng)規(guī)模的視頻和人類(lèi)演示動(dòng)作上預(yù)訓(xùn)練 world foundation models,并評(píng)估模型的表現(xiàn),為后期訓(xùn)練做準(zhǔn)備。利用經(jīng)典和神經(jīng)模擬,他們大規(guī)模生成海量的合成數(shù)據(jù)并訓(xùn)練策略(policies)。

為了加速開(kāi)發(fā)人員的進(jìn)度,NVIDIA 構(gòu)建了用于機(jī)器人訓(xùn)練、評(píng)估和模擬的開(kāi)源 Isaac Lab,用于可擴(kuò)展且 GPU 加速的可微物理模擬的 Newton,用于神經(jīng)模擬的 Cosmos world models,以及用于機(jī)器人推理和動(dòng)作生成的GROOT開(kāi)放機(jī)器人基礎(chǔ)模型。只要有足夠的算力,各地的開(kāi)發(fā)人員正在填補(bǔ)物理AI 數(shù)據(jù)的空白。

Peritas AI 在 NVIDIA Isaac Lab 中訓(xùn)練他們的手術(shù)室助手機(jī)器人,借助 NVIDIA Cosmos world models 將他們的數(shù)據(jù)成倍增加。Skilled AI 使用 Isaac Lab 和 Cosmos 為他們的 skilled AI 腦生成后期訓(xùn)練數(shù)據(jù)。

他們使用強(qiáng)化學(xué)習(xí)在數(shù)千種變化場(chǎng)景中對(duì)模型進(jìn)行強(qiáng)化。Humanoid 使用 Isaac Lab 來(lái)訓(xùn)練全身控制和操作策略。Hexagon Robotics 將 Isaac Lab 用于訓(xùn)練和數(shù)據(jù)生成。Foxconn 在 Isaac Lab 中對(duì) Groot 模型進(jìn)行 fine-tunes,Noble Machines 也是如此。Disney Research 使用他們?cè)?Newton 和 Isaac Lab 中的 Camino 物理模擬器來(lái)訓(xùn)練他們?cè)谒杏钪嬷械慕巧珯C(jī)器人的策略。

AI 工廠(chǎng)正在蘇醒,Agents 正在學(xué)習(xí)如何駕駛。從開(kāi)放模型一直說(shuō)到機(jī)器人,現(xiàn)在我們?yōu)槟闳坎鸾?,?jì)算量如爆炸般呈現(xiàn)。從 CNNs 一路進(jìn)化到 OpenClaw,Agents 在大地上勞作,但它們需要電力來(lái)滿(mǎn)足需求。所以我們聰明地解決了問(wèn)題,我們將算力翻了 4000 萬(wàn)倍。

曾幾何時(shí),在 AI 的過(guò)往歲月里。訓(xùn)練是主流的范式。毫無(wú)疑問(wèn),它教會(huì)了模型該怎么做。但如今,是推理驅(qū)動(dòng)著整個(gè)世界,Vera 向我們展示了誰(shuí)才是王者。成本下降 35 倍,Blackwell 讓 tokens 歡快地歌唱。NVIDIA,推理之王。AI 工廠(chǎng)過(guò)去一建就是好幾年。供應(yīng)商們拽著機(jī)架和齒輪緩慢前行。像拼圖一樣?xùn)|拼西湊慢慢搭建。根本沒(méi)有清晰的辦法來(lái)擴(kuò)展這頭巨獸。DSX 和 Dynamo 懂得該怎么做。

把電力轉(zhuǎn)化為實(shí)實(shí)在在的收入。過(guò)去,Agents 只能袖手旁觀(guān)?,F(xiàn)在,它們可以自主行動(dòng)了。如果它們敢跑偏。安全的claws 就會(huì)立刻攔截并說(shuō),“沒(méi)門(mén)”。NemoClaw在那兒為整個(gè)旅程保駕護(hù)航。是的,我的朋友,它是開(kāi)源的。會(huì)思考的汽車(chē)和奔跑的機(jī)器人。這可不是在演電影,一切都已經(jīng)開(kāi)始了。Alpamayo 掌控全局。屬于機(jī)器人的 GPT 時(shí)刻已經(jīng)到來(lái)。從虛擬模擬走上真實(shí)的街頭,現(xiàn)在看它們一路馳騁。工業(yè)時(shí)代造就了往昔的一切。

現(xiàn)在我們?yōu)?AI 建造更宏偉的藍(lán)圖。Vera、Rubin 加上 Groq 掀起了推理的狂潮。把它們組合在一起,現(xiàn)在下起了鈔票雨。我們每年都在打造全新的架構(gòu)。因?yàn)?claws 在不停地呼喊,“把更多的 tokens 丟過(guò)來(lái)?!边@個(gè) AI 技術(shù)棧屬于所有人去構(gòu)建。讓我們共同品嘗這塊五層蛋糕。此刻無(wú)比閃耀,前路清晰明了。

因?yàn)槭情_(kāi)放模型引領(lǐng)我們來(lái)到了這里。當(dāng)數(shù)據(jù)不足時(shí),我們不再爭(zhēng)論。我們只用算力生成更多數(shù)據(jù)。機(jī)器人完美無(wú)瑕地進(jìn)行學(xué)習(xí)。為四大擴(kuò)展定律(scaling laws)注入燃料。未來(lái)已來(lái),你們不想來(lái)看看嗎?

歡迎在評(píng)論區(qū)留言~如需開(kāi)白請(qǐng)加微信:YPYP01234567

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
一覺(jué)醒來(lái),大量美軍逃匿!伊朗全力搜捕!美議長(zhǎng)透露重要信息

一覺(jué)醒來(lái),大量美軍逃匿!伊朗全力搜捕!美議長(zhǎng)透露重要信息

安安說(shuō)
2026-03-26 13:00:12
伊朗進(jìn)入伊拉克模式

伊朗進(jìn)入伊拉克模式

墨心人
2026-03-26 21:47:55
伊朗女藥劑師拒絕撤離,空襲第10天在“精準(zhǔn)”打擊下被“誤殺”

伊朗女藥劑師拒絕撤離,空襲第10天在“精準(zhǔn)”打擊下被“誤殺”

網(wǎng)易新聞出品
2026-03-26 11:16:13
重磅!伊朗已回復(fù)15點(diǎn)停火協(xié)議,最關(guān)鍵的48小時(shí)來(lái)了

重磅!伊朗已回復(fù)15點(diǎn)停火協(xié)議,最關(guān)鍵的48小時(shí)來(lái)了

風(fēng)風(fēng)順
2026-03-27 03:15:05
有沒(méi)有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒(méi)有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深?lèi)?ài)雜談
2026-02-18 20:55:58
伊朗稱(chēng)已組織超百萬(wàn)人為地面戰(zhàn)斗做準(zhǔn)備

伊朗稱(chēng)已組織超百萬(wàn)人為地面戰(zhàn)斗做準(zhǔn)備

財(cái)聯(lián)社
2026-03-26 22:50:26
盲目的大學(xué)擴(kuò)招,正在反噬整個(gè)社會(huì)

盲目的大學(xué)擴(kuò)招,正在反噬整個(gè)社會(huì)

凡人志
2026-03-25 01:34:53
惡毒詆毀張雪峰離世:千萬(wàn)粉絲“留幾手”被罰!網(wǎng)友:應(yīng)永久封殺

惡毒詆毀張雪峰離世:千萬(wàn)粉絲“留幾手”被罰!網(wǎng)友:應(yīng)永久封殺

影像溫度
2026-03-26 11:25:05
首個(gè)因中東戰(zhàn)爭(zhēng)宣布進(jìn)入緊急狀態(tài)的國(guó)家,為何是菲律賓?

首個(gè)因中東戰(zhàn)爭(zhēng)宣布進(jìn)入緊急狀態(tài)的國(guó)家,為何是菲律賓?

上觀(guān)新聞
2026-03-26 19:36:04
安徽美女道士遠(yuǎn)近聞名,靠身體“日進(jìn)斗金”,九個(gè)男徒弟曝光內(nèi)幕

安徽美女道士遠(yuǎn)近聞名,靠身體“日進(jìn)斗金”,九個(gè)男徒弟曝光內(nèi)幕

林林故事揭秘
2025-03-07 14:02:09
多地將舉辦“紀(jì)念張國(guó)榮”演唱會(huì),行情火爆?張國(guó)榮摯友:請(qǐng)停止所有非法行為

多地將舉辦“紀(jì)念張國(guó)榮”演唱會(huì),行情火爆?張國(guó)榮摯友:請(qǐng)停止所有非法行為

上觀(guān)新聞
2026-03-26 15:06:07
日本東京商業(yè)區(qū)發(fā)生持刀傷人事件2人死亡

日本東京商業(yè)區(qū)發(fā)生持刀傷人事件2人死亡

新華社
2026-03-26 21:10:15
把劉濤抱在懷里,有誰(shuí)注意到他手上的小動(dòng)作,人品如何一目了然。

把劉濤抱在懷里,有誰(shuí)注意到他手上的小動(dòng)作,人品如何一目了然。

TVB的四小花
2026-03-27 01:19:43
曾在恒大賺上億!40歲郜林吐槽:在中乙當(dāng)老總1個(gè)月工資不夠油費(fèi)

曾在恒大賺上億!40歲郜林吐槽:在中乙當(dāng)老總1個(gè)月工資不夠油費(fèi)

我愛(ài)英超
2026-03-26 20:47:14
萬(wàn)科高管被要求退還薪酬

萬(wàn)科高管被要求退還薪酬

地產(chǎn)微資訊
2026-03-26 12:22:04
張雪峰去世僅兩天!公司宣布重大決定:收回他所有肖像使用權(quán)

張雪峰去世僅兩天!公司宣布重大決定:收回他所有肖像使用權(quán)

娛樂(lè)圈圈圓
2026-03-26 21:47:07
網(wǎng)易號(hào)平臺(tái)每日辟謠公告(三月二十六日)

網(wǎng)易號(hào)平臺(tái)每日辟謠公告(三月二十六日)

網(wǎng)易號(hào)官方平臺(tái)
2026-03-26 18:04:59
和富商離婚后,上海知名主持淪為網(wǎng)紅,如今8歲兒子成她唯一依靠

和富商離婚后,上海知名主持淪為網(wǎng)紅,如今8歲兒子成她唯一依靠

往史過(guò)眼云煙
2026-03-25 14:51:15
蔡正元即將入獄,國(guó)臺(tái)辦做出回應(yīng),內(nèi)容不尋常,已看透他的真面目

蔡正元即將入獄,國(guó)臺(tái)辦做出回應(yīng),內(nèi)容不尋常,已看透他的真面目

北緯的咖啡豆
2026-03-26 22:20:06
沒(méi)想到不翻不知道,一翻嚇一跳,張雪峰幾乎每個(gè)月都在網(wǎng)上喊累

沒(méi)想到不翻不知道,一翻嚇一跳,張雪峰幾乎每個(gè)月都在網(wǎng)上喊累

歲月有情1314
2026-03-26 12:13:10
2026-03-27 05:23:00
盒飯財(cái)經(jīng) incentive-icons
盒飯財(cái)經(jīng)
約會(huì)最好的商業(yè)思想
1306文章數(shù) 16871關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)發(fā)布外賣(mài)大戰(zhàn)后成績(jī)單:虧損超200億

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

體育要聞

申京努力了,然而杜蘭特啊

娛樂(lè)要聞

劉曉慶妹妹發(fā)聲!稱(chēng)姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車(chē)要聞

一汽奧迪A6L e-tron開(kāi)啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

房產(chǎn)
親子
教育
時(shí)尚
藝術(shù)

房產(chǎn)要聞

突發(fā),三亞又有大批征遷補(bǔ)償方案出爐!

親子要聞

試工育兒嫂被查出傳染病,寶媽崩潰!家政服務(wù)“健康關(guān)”如何保障?

教育要聞

2026年高考可能“扎堆報(bào)考”的五大專(zhuān)業(yè):就業(yè)缺口大,穩(wěn)定且高薪

400萬(wàn)人愛(ài)過(guò)的女孩,被黃謠網(wǎng)暴180天后

藝術(shù)要聞

北京大興機(jī)場(chǎng)和青島膠東機(jī)場(chǎng)“撞臉”,長(zhǎng)得像就是抄襲?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版