国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

黃仁勛GTC完整演講:生成Token的成本與效率,決定科技企業(yè)的營(yíng)收與生死

0
分享至


本文來(lái)自微信公眾號(hào):劃重點(diǎn)KeyPoints,作者:常遠(yuǎn),頭圖來(lái)自:視覺(jué)中國(guó)

3月17日凌晨,2026年英偉達(dá)GTC大會(huì)在圣何塞正式開(kāi)幕。黃仁勛表示,要支撐未來(lái)數(shù)兆美元規(guī)模的智能經(jīng)濟(jì),必須從系統(tǒng)工程的視角重新設(shè)計(jì)整個(gè)計(jì)算堆棧。英偉達(dá)正試圖通過(guò)全面掌控能源、芯片、基礎(chǔ)設(shè)施、模型、應(yīng)用這五層蛋糕,完成從芯片制造商到AI時(shí)代發(fā)電商的歷史性蛻變。

而對(duì)于AI時(shí)代進(jìn)程的判斷,黃仁勛拋出了一個(gè)極其宏大的產(chǎn)業(yè)愿景:?jiǎn)渭兊臄?shù)字生成時(shí)代正在走向深化,我們正在迎來(lái)物理AI的大爆炸以及代理式AI的全面普及。如果說(shuō)過(guò)去幾年AI只是在屏幕內(nèi)作答,那么從2026年開(kāi)始,AI將擁有在三維物理世界中行動(dòng)與交互的實(shí)體能力,并具備自主執(zhí)行復(fù)雜任務(wù)的代理系統(tǒng)。英偉達(dá)正試圖通過(guò)軟硬一體化的全棧生態(tài),再次重新定義計(jì)算基礎(chǔ)設(shè)施。

我們梳理了這場(chǎng)發(fā)布會(huì)的核心信息,以下是重點(diǎn)內(nèi)容:

1.算力需求重估:到2027年計(jì)算市場(chǎng)規(guī)模將突破1萬(wàn)億美元

黃仁勛在演講中為AI基礎(chǔ)設(shè)施的未來(lái)需求定下了基調(diào):到2027年,全球計(jì)算需求將突破1萬(wàn)億美元大關(guān)。他強(qiáng)調(diào),在這個(gè)全新的AI時(shí)代,Token(詞元)就是新的基礎(chǔ)貨幣。生成Token的成本與效率直接決定了科技企業(yè)的營(yíng)收與生死。英偉達(dá)致力于打造全球每Token成本最低的計(jì)算方案,因?yàn)檫@關(guān)乎整個(gè)行業(yè)運(yùn)轉(zhuǎn)的經(jīng)濟(jì)學(xué)底層邏輯。

2.加速計(jì)算才是時(shí)代答案:Vera Rubin平臺(tái)全面接棒計(jì)算霸權(quán)

面對(duì)外界對(duì)摩爾定律終結(jié)的探討,黃仁勛給出的答案是不斷進(jìn)化的加速計(jì)算架構(gòu)。繼Blackwell之后,下一代Vera CPU + Rubin GPU架構(gòu)(Vera Rubin Ultra)正式成為全場(chǎng)焦點(diǎn)。

這一專為AI代理系統(tǒng)打造的平臺(tái)展現(xiàn)了驚人的擴(kuò)展能力,能夠在一個(gè)系統(tǒng)中連接多達(dá)144個(gè)GPU,并實(shí)現(xiàn)了硬件與軟件的徹底垂直整合。在能效與回報(bào)率方面,這一新架構(gòu)的潛力令人側(cè)目,結(jié)合全面普及的液冷技術(shù)(Liquid Cooling)和封裝光學(xué)器件(Co-packaged optics),新架構(gòu)不僅極大優(yōu)化了能耗比,更被預(yù)期能為企業(yè)帶來(lái)高達(dá)5倍的營(yíng)收產(chǎn)出比,進(jìn)一步鞏固了英偉達(dá)在數(shù)據(jù)中心領(lǐng)域的絕對(duì)統(tǒng)治力。

3.鞏固圖圖形與生態(tài)護(hù)城河:CUDA二十周年積累數(shù)億GPU裝機(jī),DLSS 5也快來(lái)了

除了硬核的AI基建,英偉達(dá)的傳統(tǒng)藝能同樣在持續(xù)進(jìn)化。時(shí)值CUDA生態(tài)誕生20周年,CUDA已在全球范圍內(nèi)累積了數(shù)億GPU的裝機(jī)量,并滲透進(jìn)了每一個(gè)技術(shù)生態(tài)中,飛輪正在以前所未有的速度加速運(yùn)轉(zhuǎn)。同時(shí),大會(huì)還透露了處于研發(fā)前沿的DLSS 5技術(shù),預(yù)示著基于神經(jīng)渲染的技術(shù)迭代將再次顛覆AI驅(qū)動(dòng)的圖形和高端游戲體驗(yàn)。

4.押注代理式AI:推出NemoClaw,構(gòu)建AI Agent的專用操作系統(tǒng)

在軟件與生態(tài)側(cè),英偉達(dá)正式推出了NemoClaw參考堆棧。這相當(dāng)于為代理式計(jì)算機(jī)打造了一個(gè)專用的操作系統(tǒng)底座。借助NemoClaw,開(kāi)發(fā)者能夠在保障底層隱私與安全的前提下,通過(guò)簡(jiǎn)單的指令快速構(gòu)建、部署和加速屬于自己的個(gè)性化AI Agent。這標(biāo)志著AI的交互邏輯正在發(fā)生根本性轉(zhuǎn)變:從被動(dòng)響應(yīng)的對(duì)話工具,進(jìn)化為具備自主規(guī)劃和執(zhí)行能力的超級(jí)個(gè)人助理。

5.物理AI大爆炸:從自動(dòng)駕駛到具身智能的全面落地

通用語(yǔ)言模型并不是智能的終點(diǎn),真正的下一代AI必須擁有物理軀殼。黃仁勛強(qiáng)調(diào)了物理AI(Physical AI)的概念,AI必須學(xué)會(huì)理解重力、摩擦力以及復(fù)雜的三維物理空間。

在自動(dòng)駕駛領(lǐng)域,比亞迪、現(xiàn)代、日產(chǎn)等頭部車企已紛紛加入英偉達(dá)的Robotaxi就緒平臺(tái);而在通用機(jī)器人領(lǐng)域,英偉達(dá)發(fā)布了專為人形機(jī)器人打造的通用基礎(chǔ)模型 Project GR00T。它能夠讓機(jī)器人通過(guò)觀察人類行為來(lái)學(xué)習(xí)自然語(yǔ)言和模仿動(dòng)作。此外,英偉達(dá)還大幅更新了Isaac機(jī)器人平臺(tái),推出了專為機(jī)械臂控制和3D視覺(jué)環(huán)境感知打造的全新軟硬件庫(kù)。英偉達(dá)與迪士尼幻想工程合作打造的《冰雪奇緣》雪寶(Olaf)實(shí)體機(jī)器人也踏上GTC舞臺(tái),與黃仁勛親密互動(dòng)。

在演講的最后,黃仁勛的愿景已不再局限于傳統(tǒng)的硬件廠商范疇,英偉達(dá)正在構(gòu)建統(tǒng)治下一個(gè)時(shí)代的AI工廠。從底層的Vera Rubin超算集群,到NemoClaw代理操作系統(tǒng),再到物理機(jī)器人生態(tài),英偉達(dá)正試圖包攬AI賦能現(xiàn)實(shí)世界的每一層基礎(chǔ)設(shè)施,讓加速計(jì)算像一百多年前的電力一樣,徹底融入人類文明的日常運(yùn)轉(zhuǎn)之中。

以下為黃仁勛演講內(nèi)容全文:

一、歡迎來(lái)到GTC:探討AI生態(tài)與“五層蛋糕”架構(gòu)

歡迎來(lái)到GTC!我只想提醒大家,這是一場(chǎng)技術(shù)大會(huì)。這么多人在清晨就排起了長(zhǎng)隊(duì),很高興見(jiàn)到在座的各位。在GTC我們將探討技術(shù)與平臺(tái)。NVIDIA擁有三大平臺(tái),大家可能以為我們主要討論的是CUDA X,但系統(tǒng)是我們的另一個(gè)平臺(tái),現(xiàn)在我們還有一個(gè)名為AI Factories的新平臺(tái)。我們將討論所有這些內(nèi)容,但最重要的是我們要討論生態(tài)系統(tǒng)。

在開(kāi)始之前,我要感謝賽前節(jié)目主持人Sarah Go和Alfred Lin,以及NVIDIA的首家風(fēng)險(xiǎn)投資機(jī)構(gòu)Sequoia Capital的Gavin Baker。作為首位主要機(jī)構(gòu)投資者,他們深耕技術(shù)領(lǐng)域,洞悉行業(yè)動(dòng)態(tài),擁有廣泛的技術(shù)生態(tài)系統(tǒng)。當(dāng)然也要感謝我親手挑選并邀請(qǐng)的各位全明星VIP嘉賓,此外我還要感謝所有到場(chǎng)的贊助公司。NVIDIA是一家平臺(tái)公司,擁有技術(shù)、平臺(tái)以及豐富的生態(tài)系統(tǒng)。今天這里匯聚了全球100萬(wàn)億美元產(chǎn)業(yè)的代表,共有450家公司贊助了本次活動(dòng),擁有一千場(chǎng)技術(shù)分會(huì)和2000位演講嘉賓。

本次大會(huì)將涵蓋人工智能五層蛋糕架構(gòu)的每一層,從土地、電力和建筑等基礎(chǔ)設(shè)施,到芯片、平臺(tái)和模型,而最終讓整個(gè)行業(yè)騰飛的將是所有的應(yīng)用程序。

二、CUDA問(wèn)世20周年:龐大裝機(jī)量驅(qū)動(dòng)飛輪效應(yīng)

一切都始于這里,今年是CUDA問(wèn)世20周年。20年來(lái)我們一直致力于這一架構(gòu)的研發(fā)。這項(xiàng)革命性的發(fā)明通過(guò)單指令多線程編寫(xiě)標(biāo)量代碼即可衍生出多線程應(yīng)用,這比SIMD更容易編程。我們最近還添加了Tiles,以幫助開(kāi)發(fā)者對(duì)Tensor Core及當(dāng)今人工智能基礎(chǔ)數(shù)學(xué)結(jié)構(gòu)進(jìn)行編程。目前已有數(shù)千個(gè)工具、編譯器、框架、庫(kù)和數(shù)十萬(wàn)個(gè)公開(kāi)的開(kāi)源項(xiàng)目,CUDA已經(jīng)深度集成到每一個(gè)生態(tài)系統(tǒng)中。最難實(shí)現(xiàn)的一點(diǎn)是龐大的裝機(jī)量。

我們花了20年時(shí)間在全球構(gòu)建起數(shù)以億計(jì)運(yùn)行CUDA的GPU和計(jì)算系統(tǒng),覆蓋了每一個(gè)云平臺(tái)和計(jì)算機(jī)公司,服務(wù)于幾乎所有行業(yè)。CUDA的裝機(jī)量正是推動(dòng)飛輪加速轉(zhuǎn)動(dòng)的核心動(dòng)力。裝機(jī)量吸引了開(kāi)發(fā)者,開(kāi)發(fā)者隨后創(chuàng)造出如深度學(xué)習(xí)等實(shí)現(xiàn)突破的新算法。這些突破催生了全新市場(chǎng)并建立起新的生態(tài)系統(tǒng),吸引更多公司加入,從而創(chuàng)造了更大的裝機(jī)量。這種飛輪效應(yīng)目前正在加速,NVIDIA庫(kù)的下載量正以驚人的速度增長(zhǎng)。這種效應(yīng)不僅讓計(jì)算平臺(tái)能支持眾多應(yīng)用和突破,還賦予了基礎(chǔ)設(shè)施極長(zhǎng)的使用壽命。

有如此多的應(yīng)用可以在NVIDIA CUDA上運(yùn)行,我們支持AI生命周期的每個(gè)階段和每個(gè)數(shù)據(jù)處理平臺(tái),加速各種基于科學(xué)原理的求解器。正因應(yīng)用范圍如此之廣,一旦安裝NVIDIA GPU,其使用壽命周期就極長(zhǎng)。這也是為什么早在六年前出貨的Ampere架構(gòu)在云端的定價(jià)依然在上漲。

高裝機(jī)量、顯著的飛輪效應(yīng)和極廣的開(kāi)發(fā)者覆蓋范圍,加上我們持續(xù)更新軟件,使得計(jì)算成本不斷下降。加速計(jì)算極大提升了應(yīng)用速度,隨著我們?cè)谲浖芷趦?nèi)的持續(xù)培育和更新,用戶不僅能獲得初次使用的性能提升,還能獲得加速計(jì)算帶來(lái)的持續(xù)成本降低。因?yàn)檠b機(jī)量龐大,我們發(fā)布的新優(yōu)化方案能惠及數(shù)以百萬(wàn)計(jì)兼容架構(gòu)的GPU,覆蓋全球用戶。動(dòng)態(tài)組合擴(kuò)大了NVIDIA架構(gòu)的影響力,加速增長(zhǎng)的同時(shí)降低了計(jì)算成本并促進(jìn)新增長(zhǎng),這就是CUDA的核心價(jià)值。

但我們的旅程實(shí)際上始于25年前的GeForce。GeForce是NVIDIA最偉大的營(yíng)銷活動(dòng),許多人是伴隨它長(zhǎng)大的。早在你們自己負(fù)擔(dān)得起之前,父母就付錢讓你們成為了NVIDIA的客戶,直到有一天你們成為出色的計(jì)算機(jī)科學(xué)家和真正的開(kāi)發(fā)者。GeForce造就了今天的NVIDIA并孕育了CUDA。25年前我們發(fā)明了全球首款可編程加速器——像素著色器,旨在讓加速器具備可編程性。5年后CUDA誕生了。

我們當(dāng)年傾盡全公司利潤(rùn)所做的最大投資,就是憑借GeForce將CUDA推廣到每臺(tái)電腦上。歷經(jīng)20年和13代產(chǎn)品,CUDA現(xiàn)已無(wú)處不在。十年前我們推出了RTX,針對(duì)現(xiàn)代計(jì)算機(jī)圖形時(shí)代徹底重新設(shè)計(jì)了架構(gòu)。GeForce將CUDA推向世界,也讓眾多先驅(qū)發(fā)現(xiàn)GPU是加速深度學(xué)習(xí)的良師益友,從而開(kāi)啟了AI大爆炸。十年前我們決定融合可編程著色技術(shù)并引入硬件光線追蹤,當(dāng)時(shí)我們就認(rèn)為AI將徹底變革計(jì)算機(jī)圖形學(xué)。正如GeForce將AI帶給世界,現(xiàn)在AI將反過(guò)來(lái)徹底變革計(jì)算機(jī)圖形學(xué)。

今天我將展示下一代圖形技術(shù)——神經(jīng)渲染,這是3D圖形與人工智能的融合,也就是DLSS 5.0。我們?nèi)诤狭丝煽氐?D圖形、虛擬世界的結(jié)構(gòu)化數(shù)據(jù)與生成式AI的概率計(jì)算。結(jié)構(gòu)化數(shù)據(jù)完美受控,結(jié)合生成式AI,創(chuàng)造出精美令人驚嘆且具備可控性的內(nèi)容。這種將結(jié)構(gòu)化信息與生成式AI融合的概念將接連不斷地影響各個(gè)行業(yè),結(jié)構(gòu)化數(shù)據(jù)正是值得信賴的AI的基石。

接下來(lái)我們要詳細(xì)探討結(jié)構(gòu)化數(shù)據(jù)。大家熟知的SQL、Spark、Pandas、Velox以及Snowflake、Databricks、Amazon EMR、Azure Fabric、Google Cloud BigQuery等超大型平臺(tái)都在處理數(shù)據(jù)框。這些數(shù)據(jù)框是巨大的電子表格,保存著企業(yè)計(jì)算和業(yè)務(wù)的單一真值。

過(guò)去我們努力加速結(jié)構(gòu)化數(shù)據(jù)處理,以更低成本和更高頻率讓公司高效運(yùn)行。未來(lái)AI將以極快的速度使用這些結(jié)構(gòu)化數(shù)據(jù)庫(kù)。除此之外,還有代表全球絕大部分信息的非結(jié)構(gòu)化生成式數(shù)據(jù)庫(kù),如向量數(shù)據(jù)庫(kù)、PDF、視頻和演講等。每年生成的90%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù)。直到現(xiàn)在由于缺乏簡(jiǎn)便的索引方式且難以理解其含義,這些數(shù)據(jù)一直無(wú)法被高效查詢和搜索。

現(xiàn)在我們讓AI來(lái)解決這個(gè)問(wèn)題。利用多模態(tài)感知與理解技術(shù),AI能夠閱讀PDF并理解其含義,將其嵌入到可搜索和查詢的更大結(jié)構(gòu)中。為此NVIDIA創(chuàng)建了兩個(gè)基礎(chǔ)庫(kù):用于數(shù)據(jù)框和結(jié)構(gòu)化數(shù)據(jù)的cuDF,以及用于向量存儲(chǔ)和非結(jié)構(gòu)化AI數(shù)據(jù)的cuVS。這兩個(gè)平臺(tái)將成為未來(lái)最重要的平臺(tái),我們正將其深度融入全球復(fù)雜的數(shù)據(jù)處理系統(tǒng)網(wǎng)絡(luò)中。

三、賦能全球企業(yè)與云服務(wù):AI時(shí)代的加速計(jì)算

今天我們將發(fā)布幾項(xiàng)重要合作。IBM作為領(lǐng)域特定語(yǔ)言SQL的發(fā)明者,正在使用cuDF加速watsonx的數(shù)據(jù)處理。60年前IBM推出了開(kāi)啟計(jì)算時(shí)代的System/360,隨后SQL和數(shù)據(jù)倉(cāng)庫(kù)構(gòu)成了現(xiàn)代企業(yè)計(jì)算的基石。

今天IBM與NVIDIA正通過(guò)利用GPU計(jì)算庫(kù)加速watsonx.data的SQL引擎,為AI時(shí)代重新定義數(shù)據(jù)處理。由于當(dāng)前CPU數(shù)據(jù)處理系統(tǒng)已無(wú)法滿足AI對(duì)海量數(shù)據(jù)集的快速訪問(wèn)需求,企業(yè)必須轉(zhuǎn)型。例如雀巢每天要做數(shù)千次供應(yīng)鏈決策,在CPU上每天只能刷新幾次匯總了全球交付事件的訂單到現(xiàn)金數(shù)據(jù)集市,而在NVIDIA GPU上運(yùn)行加速的watsonx后,速度提升了5倍且成本降低了83%。

AI時(shí)代的加速計(jì)算已經(jīng)到來(lái)。我們不僅加速了云端數(shù)據(jù)處理,也加速了本地部署。全球領(lǐng)先的系統(tǒng)和存儲(chǔ)制造商Dell與我們合作,將cuDF和cuVS集成到Dell AI數(shù)據(jù)平臺(tái)中以迎接AI時(shí)代。我們還與Google Cloud合作加速了Vertex AI和BigQuery。

在與Snapchat的合作中,我們將其計(jì)算成本降低了近80%。當(dāng)你加速計(jì)算和數(shù)據(jù)處理時(shí),不僅獲得了速度和規(guī)模優(yōu)勢(shì),最重要的是獲得了成本優(yōu)勢(shì)。摩爾定律的核心是性能每隔幾年翻倍,但它現(xiàn)在已經(jīng)后勁不足。加速計(jì)算讓我們能夠?qū)崿F(xiàn)跨越。

NVIDIA作為一家算法公司,憑借廣泛的市場(chǎng)觸達(dá)和龐大的裝機(jī)量,通過(guò)持續(xù)優(yōu)化算法不斷降低計(jì)算成本,為大家擴(kuò)大規(guī)模并提升速度。NVIDIA構(gòu)建了加速計(jì)算平臺(tái)并提供RTX、cuDF、cuVS等一系列庫(kù),最終將其集成到全球的云服務(wù)和OEM廠商中觸達(dá)全球。

這種合作模式正在Google Cloud、Snapchat等平臺(tái)上不斷重復(fù)。我們?yōu)樵贘AX、XLA和PyTorch上所做的出色工作感到自豪。我們是全球唯一在這些框架上都表現(xiàn)卓越的加速器。像Baseten、CrowdStrike、Puma、Salesforce等不僅是我們的客戶也是開(kāi)發(fā)者。

我們將NVIDIA技術(shù)整合到他們的產(chǎn)品中,并將他們帶入云端。我們與云服務(wù)提供商的關(guān)系本質(zhì)就是為他們帶來(lái)客戶。大多數(shù)云服務(wù)提供商都非常樂(lè)意與我們合作,因?yàn)槲覀儗⒃丛床粩嗟貫樗腥颂峁┘铀?。最后,今年讓我非常興奮的一件事是,我們將把OpenAI引入AWS,這將帶動(dòng)AWS云計(jì)算的巨大消耗并擴(kuò)展OpenAI的計(jì)算能力。

在AWS,我們加速了EMR、SageMaker和Bedrock。NVIDIA與AWS進(jìn)行了深度集成,他們也是我們的首個(gè)云合作伙伴。在Microsoft Azure方面,我們?yōu)槠浯蛟觳惭b了首臺(tái)NVIDIA A100超級(jí)計(jì)算機(jī),這為后來(lái)與OpenAI的巨大成功合作奠定了基礎(chǔ)。我們與Azure的合作由來(lái)已久,不僅為其云服務(wù)和Bing Search提供加速,還與他們的AIFoundry開(kāi)展了深度合作。隨著AI在全球范圍內(nèi)的擴(kuò)展,Azure Regions的合作也變得極其重要。

我們提供的一項(xiàng)核心功能是機(jī)密計(jì)算(Confidential Computing)。機(jī)密計(jì)算能夠確保操作員無(wú)法觸碰或查看數(shù)據(jù)和模型。NVIDIA GPU是全球首款實(shí)現(xiàn)該功能的GPU,它能夠支持并在不同云端和地區(qū)安全部署OpenAI和Anthropic等極其寶貴的模型。這一切都要?dú)w功于至關(guān)重要的機(jī)密計(jì)算技術(shù)。

在客戶合作方面,Synopsis是我們的重要合作伙伴,我們正在加速其所有的EDA和CAU工作流,并落地于Microsoft Azure。我們既是Oracle的首家供應(yīng)商,也是他們的首位AI客戶。讓我非常自豪的是,我首次向Oracle解釋了AI云的概念,并成為了他們的首位客戶,從那時(shí)起Oracle便開(kāi)始騰飛。

我們?cè)谀抢锫涞亓税≦uark、Cohere、Fireworks以及OpenAI在內(nèi)的一大批合作伙伴。CoreWeave是全球首個(gè)AI原生云,其建立的核心目標(biāo)就是在加速計(jì)算時(shí)代提供并托管GPU,為AI云提供托管服務(wù)。他們擁有出色的客戶群,并且增長(zhǎng)速度驚人。

我還非??春肞alantir和Dell平臺(tái)。我們?nèi)夜竟餐Υ蛟炝艘环N全新類型的AI平臺(tái)——Palantir Ontology平臺(tái)。該平臺(tái)可以在任何國(guó)家、任何物理隔離(air-gapped)區(qū)域?qū)崿F(xiàn)完全本地化的現(xiàn)場(chǎng)部署。AI幾乎可以部署在任何地方。

如果沒(méi)有我們的機(jī)密計(jì)算能力,沒(méi)有我們構(gòu)建端到端系統(tǒng)以及提供整個(gè)加速計(jì)算和AI堆棧的能力(涵蓋從向量或結(jié)構(gòu)化數(shù)據(jù)處理到AI時(shí)代的完整流程),這一切都不可能實(shí)現(xiàn)。這些例子展示了我們與全球云服務(wù)提供商之間的特殊合作關(guān)系,他們今天都在現(xiàn)場(chǎng),我由衷感謝大家的辛勤付出。


四、NVIDIA的公司特質(zhì):垂直整合但同時(shí)橫向開(kāi)放

NVIDIA是一家垂直整合但同時(shí)橫向開(kāi)放的公司,這是大家會(huì)反復(fù)看到的主題。其必要性非常簡(jiǎn)單:加速計(jì)算不僅僅是芯片或系統(tǒng)的問(wèn)題,它的核心在于應(yīng)用加速。如果只是讓電腦運(yùn)行得更快,那是CPU的工作,但CPU已經(jīng)后勁不足了。未來(lái)實(shí)現(xiàn)巨大性能提升和成本降低的唯一方式,就是通過(guò)應(yīng)用或特定領(lǐng)域的加速來(lái)實(shí)現(xiàn),即應(yīng)用加速計(jì)算。因此NVIDIA必須針對(duì)不同的垂直行業(yè)和領(lǐng)域,開(kāi)發(fā)一個(gè)又一個(gè)的庫(kù)。

作為一家垂直整合的計(jì)算公司,我們別無(wú)選擇,必須深入理解應(yīng)用、領(lǐng)域和算法的底層邏輯。我們還必須弄清楚如何將算法部署在數(shù)據(jù)中心、云端、本地(on-prem)、邊緣端或機(jī)器人系統(tǒng)等各種截然不同的計(jì)算系統(tǒng)中。

從底層芯片到系統(tǒng),我們實(shí)現(xiàn)了垂直整合。而NVIDIA之所以無(wú)比強(qiáng)大,是因?yàn)槲覀儥M向開(kāi)放。我們致力于將NVIDIA的軟件、庫(kù)和技術(shù)與合作伙伴的技術(shù)相結(jié)合,集成到任何目標(biāo)平臺(tái)中,從而將加速計(jì)算帶給世界上的每一個(gè)人。本次GTC大會(huì)正是這一理念的絕佳展示。

目前我們擁有觸達(dá)各大垂直領(lǐng)域的領(lǐng)域特定庫(kù),以解決各行各業(yè)的關(guān)鍵問(wèn)題。例如在金融服務(wù)業(yè)(這也是本屆GTC參會(huì)人數(shù)最多的群體),算法交易正從依賴人類進(jìn)行特征工程的傳統(tǒng)機(jī)器學(xué)習(xí),轉(zhuǎn)向由超級(jí)計(jì)算機(jī)分析海量數(shù)據(jù)并自動(dòng)發(fā)現(xiàn)洞察與模式,這正是金融業(yè)的深度學(xué)習(xí)和Transformer時(shí)刻。醫(yī)療保健行業(yè)也迎來(lái)了ChatGPT時(shí)刻。我們正在將AI物理學(xué)和AI生物學(xué)應(yīng)用于藥物研發(fā),并開(kāi)發(fā)用于客戶服務(wù)和輔助診斷的AI Agent。

在工業(yè)領(lǐng)域,我們正在開(kāi)啟人類歷史上規(guī)模最大的擴(kuò)建工程,全球大多數(shù)行業(yè)都在建造AI工廠,今天也有許多芯片和計(jì)算機(jī)制造廠的代表來(lái)到現(xiàn)場(chǎng)。在媒體與娛樂(lè)方面,實(shí)時(shí)AI平臺(tái)正在支持翻譯、廣播、直播游戲和視頻,絕大部分內(nèi)容都將通過(guò)AI進(jìn)行增強(qiáng)。

在量子計(jì)算領(lǐng)域,有35家公司正利用我們的Holoscan平臺(tái)構(gòu)建下一代量子GPU混合系統(tǒng)。零售和消費(fèi)品(CPG)行業(yè)正利用NVIDIA優(yōu)化供應(yīng)鏈,并構(gòu)建代理式購(gòu)物系統(tǒng)和客服AI Agent,這是一個(gè)價(jià)值35萬(wàn)億美元的龐大市場(chǎng)。

在規(guī)模達(dá)50萬(wàn)億美元的制造業(yè)機(jī)器人領(lǐng)域,NVIDIA已深耕十年,構(gòu)建了重建機(jī)器人系統(tǒng)所需的基礎(chǔ)計(jì)算機(jī),并與所有主流機(jī)器人制造公司展開(kāi)合作,此次展會(huì)我們就展出了110臺(tái)機(jī)器人。電信行業(yè)的規(guī)模約為2萬(wàn)億美元,其遍布全球的基站作為上一代計(jì)算時(shí)代的基礎(chǔ)設(shè)施,即將迎來(lái)徹底重塑。未來(lái)的基站將成為AI基礎(chǔ)設(shè)施平臺(tái),讓AI在邊緣運(yùn)行。我們的Aerial(即AIRAN)平臺(tái)正在與Nokia、T-Mobile等多家公司開(kāi)展重大合作。

在這一切的核心是我們自主發(fā)明的CUDA-X庫(kù)算法,這是NVIDIA作為一家算法公司的立身之本,也是我們區(qū)別于其他公司的特別之處。算法讓我們能夠深入各個(gè)行業(yè),將世界頂尖計(jì)算機(jī)科學(xué)家解決問(wèn)題的方法重構(gòu)并轉(zhuǎn)化為庫(kù)。

在本次展會(huì)上,我們將發(fā)布大量庫(kù)和模型,這些不斷更新的庫(kù)是我們公司的瑰寶,它們激活了計(jì)算平臺(tái),真正解決了實(shí)際問(wèn)題。比如引發(fā)現(xiàn)代AI大爆發(fā)的cuDNN,以及用于決策優(yōu)化的cuOPT、計(jì)算光刻的cuLitho、直接稀疏求解器的cuDSS、基因組學(xué)的Parabricks等上千個(gè)CUDA-X庫(kù),正助力開(kāi)發(fā)者在科學(xué)和工程領(lǐng)域取得突破。

大家所看到的一切都不是人工動(dòng)畫(huà),而是基于基礎(chǔ)物理求解器、AI物理模型和物理AI機(jī)器人模型的完全模擬。憑借對(duì)算法的理解與計(jì)算平臺(tái)的結(jié)合,NVIDIA作為一家垂直整合且橫向開(kāi)放的公司,正不斷解鎖新機(jī)遇。

如今除了傳統(tǒng)巨頭,還涌現(xiàn)了一大批像OpenAI、Anthropic這樣的AI原生(AInative)初創(chuàng)公司。隨著計(jì)算被重新發(fā)明,創(chuàng)投圈向初創(chuàng)企業(yè)投入了史無(wú)前例的1500億美元資金。因?yàn)闅v史上第一次,這些公司全都需要龐大的算力和海量的Token,他們要么自己生成Token,要么為現(xiàn)有的Token增值。正如PC、互聯(lián)網(wǎng)和移動(dòng)云時(shí)代誕生了Google、Amazon和Meta一樣,我們正處于新平臺(tái)轉(zhuǎn)型的開(kāi)端,必將涌現(xiàn)出對(duì)未來(lái)具有重大影響力的新公司。

過(guò)去兩年的爆發(fā)源于三大里程碑。首先,ChatGPT開(kāi)啟了生成式AI時(shí)代,它不僅能感知和領(lǐng)悟,還能翻譯并生成原創(chuàng)內(nèi)容。其次,生成式計(jì)算徹底改變了計(jì)算的實(shí)現(xiàn)方式,從過(guò)去的基于檢索轉(zhuǎn)變?yōu)楝F(xiàn)在的生成式,這也深刻改變了計(jì)算機(jī)的架構(gòu)和構(gòu)建方式。第三是推理AI的崛起,O1和O3模型的出現(xiàn)讓AI能夠反思、獨(dú)立思考、分解問(wèn)題并進(jìn)行自我驗(yàn)證,使生成式AI變得更值得信賴且基于事實(shí)。

這種推理能力大幅增加了上下文輸入和思考輸出的Token使用量,顯著提高了計(jì)算量需求。隨后ClaudeCode作為首個(gè)智能體模型問(wèn)世,它能夠自動(dòng)讀取文件、編寫(xiě)代碼、編譯測(cè)試并迭代,徹底變革了軟件工程。

我們有100%的員工正在使用ClaudeCode、Codex和Cursor等運(yùn)行在NVIDIA上的AI工具來(lái)輔助編寫(xiě)代碼?,F(xiàn)在,你不再需要詢問(wèn)AI該做什么,而是直接讓它結(jié)合上下文去創(chuàng)作、執(zhí)行和構(gòu)建。AI已經(jīng)從感知進(jìn)化到生成,再到推理,如今已經(jīng)能夠真正開(kāi)展高效的工作。正因?yàn)锳I終于能夠進(jìn)行生產(chǎn)性工作,過(guò)去兩年市場(chǎng)對(duì)NVIDIAGPU的計(jì)算需求徹底爆表,盡管我們已經(jīng)大量出貨,但需求仍在持續(xù)攀升。

AI現(xiàn)在必須思考、行動(dòng)并進(jìn)行閱讀,而要做到這些,它必須進(jìn)行推理并進(jìn)行邏輯推演。AI的每一個(gè)部分在思考、行動(dòng)和生成Token時(shí)都必須進(jìn)行推理?,F(xiàn)在早已過(guò)了訓(xùn)練階段,我們正處于推理領(lǐng)域,推理的拐點(diǎn)已經(jīng)到來(lái)。

在過(guò)去的兩年里計(jì)算需求增長(zhǎng)了10000倍,而使用量可能增長(zhǎng)了100倍。相信計(jì)算需求在過(guò)去兩年里增長(zhǎng)了一百萬(wàn)倍,這也是每一家初創(chuàng)公司、OpenAI和Anthropic的共同感受。如果他們能獲得更多算力就能生成更多Token,營(yíng)收就會(huì)增長(zhǎng),越先進(jìn)的AI就會(huì)變得越聰明。

我們現(xiàn)在正處于這個(gè)正向飛輪系統(tǒng)中,推理的拐點(diǎn)已經(jīng)到來(lái)。去年此時(shí)我說(shuō)過(guò)到2026年Blackwell和Rubin的高置信度需求和采購(gòu)訂單總額將達(dá)到5000億美元。雖然大家可能因?yàn)閯?chuàng)下年度營(yíng)收紀(jì)錄而對(duì)這個(gè)數(shù)字不為所動(dòng),但我現(xiàn)在要告訴大家,到2027年這一數(shù)字將至少達(dá)到1萬(wàn)億美元。事實(shí)上我們將面臨算力短缺,計(jì)算需求將遠(yuǎn)高于此。


五、NVIDIA的推理之年

我們?cè)谶^(guò)去一年里做了大量工作,2025年是NVIDIA的推理之年。我們希望確保不僅擅長(zhǎng)訓(xùn)練和后訓(xùn)練,而且在AI的每一個(gè)階段都表現(xiàn)出色。對(duì)基礎(chǔ)設(shè)施的投資可以長(zhǎng)期擴(kuò)展,NVIDIA基礎(chǔ)設(shè)施使用壽命長(zhǎng)且成本極低。毫無(wú)疑問(wèn)NVIDIA系統(tǒng)是世界上成本最低的AI基礎(chǔ)設(shè)施。

去年的一切都是圍繞推理AI展開(kāi)的,這推動(dòng)了拐點(diǎn)的到來(lái)。同時(shí)Anthropic和Meta的Llama等代表全球三分之一AI開(kāi)源模型算力的平臺(tái)都選擇了NVIDIA。開(kāi)源模型已接近前沿水平且無(wú)處不在。NVIDIA是當(dāng)今世界上唯一能夠跨越所有語(yǔ)言和AI領(lǐng)域運(yùn)行的平臺(tái),涵蓋生物學(xué)、計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)、語(yǔ)音、蛋白質(zhì)、化學(xué)和機(jī)器人技術(shù)等領(lǐng)域。我們的架構(gòu)從邊緣到云端通用,使其成為成本最低且最值得信賴的平臺(tái)。

面對(duì)一萬(wàn)億美元的龐大基礎(chǔ)設(shè)施規(guī)模,必須確保投資具有高性能、成本效益和長(zhǎng)期使用壽命。你可以滿懷信心地選擇NVIDIA,無(wú)論部署在云端、本地還是世界任何地方,我們都能提供支持。我們現(xiàn)在是一個(gè)運(yùn)行所有AI的計(jì)算平臺(tái),這已體現(xiàn)在業(yè)務(wù)中。我們60%的業(yè)務(wù)來(lái)自前五大超大規(guī)模云服務(wù)商,其中一部分用于內(nèi)部AI消耗。

推薦系統(tǒng)和搜索等內(nèi)部工作負(fù)載正從傳統(tǒng)方法轉(zhuǎn)向深度學(xué)習(xí)和大語(yǔ)言模型,這些負(fù)載正向NVIDIA極具優(yōu)勢(shì)的GPU上遷移。通過(guò)與各大AI實(shí)驗(yàn)室合作并擁有龐大的原生生態(tài)系統(tǒng),我們能將算力帶入云端并被迅速消耗。另外40%的業(yè)務(wù)遍布區(qū)域云、主權(quán)云、企業(yè)、工業(yè)領(lǐng)域、機(jī)器人技術(shù)、邊緣計(jì)算和超級(jí)計(jì)算系統(tǒng)等。AI廣泛的觸達(dá)范圍和多樣性正是其韌性所在,它現(xiàn)已成為一項(xiàng)基礎(chǔ)技術(shù)和全新的計(jì)算平臺(tái)變革。

我們的職責(zé)是繼續(xù)推動(dòng)技術(shù)進(jìn)步。去年作為推理之年,我們?cè)贖opper架構(gòu)巔峰時(shí)冒著巨大風(fēng)險(xiǎn)進(jìn)行了徹底重塑。我們決定將架構(gòu)提升到全新水平,徹底重構(gòu)系統(tǒng)以解耦計(jì)算并創(chuàng)造了NVLINK-72。其構(gòu)建、制造和編程方式都發(fā)生了徹底改變。GraceBlackwell和NVLINK-72是一場(chǎng)巨大的賭注,感謝所有合作伙伴的辛勤努力。

NVFP4不僅僅是精度上的提升,它代表了完全不同類型的TensorCore和計(jì)算單元。我們證明了可以在不損失精度的情況下進(jìn)行推理并大幅提升性能和能效,同時(shí)還能將其用于訓(xùn)練。結(jié)合NVLINK-72、NVFP4、Dynamo、TensorRT-LLM以及一系列新算法,我們甚至投入數(shù)十億美元建造了DGXCloud超級(jí)計(jì)算機(jī)來(lái)優(yōu)化內(nèi)核和軟件棧。

過(guò)去人們常說(shuō)推理很簡(jiǎn)單,但實(shí)際上推理是終極難題,也是驅(qū)動(dòng)收入的核心動(dòng)力。對(duì)AI推理最全面的掃描數(shù)據(jù)顯示每瓦特Token數(shù)至關(guān)重要。每個(gè)數(shù)據(jù)中心都受到功率限制,物理法則決定了1吉瓦的工廠不可能變成2吉瓦。因此必須在有限功率下產(chǎn)出最大數(shù)量的Token,力求處于效能曲線的頂端。

推理速度決定了響應(yīng)速度,也就是單次推理的交互性。推理速度越快,能處理的上下文和思考的Token就越多,這等同于AI的智能程度和吞吐量。AI越聰明,思考時(shí)間變長(zhǎng),吞吐量就會(huì)隨之降低。從現(xiàn)在起,全世界的每一位CEO都會(huì)將業(yè)務(wù)視作Token工廠并將其直接與收入掛鉤。在給定功率下,更好的每瓦性能意味著更高的吞吐量和更多的Token產(chǎn)出。NVIDIA擁有全球最高的性能,摩爾定律原本預(yù)期帶來(lái)1.5倍的提升,但我們實(shí)現(xiàn)了35倍的跨越。

去年我說(shuō)GraceBlackwell和NVLink72的每瓦性能提升了35倍時(shí)沒(méi)人相信,甚至有分析師認(rèn)為我保留實(shí)力實(shí)際提升高達(dá)50倍。這使得我們的每Token成本成為全球最低。如果架構(gòu)錯(cuò)誤即使免費(fèi)也不夠便宜,因?yàn)榻ㄔ觳⒎謹(jǐn)傄粋€(gè)吉瓦級(jí)工廠的成本高達(dá)400億美元。必須部署最頂尖的系統(tǒng)以獲得最佳成本效益。通過(guò)極致的協(xié)同設(shè)計(jì),我們進(jìn)行垂直整合并水平開(kāi)放,將所有軟件和技術(shù)打包給全球推理服務(wù)提供商。

例如Fireworks和Together等平臺(tái)增長(zhǎng)迅速,生產(chǎn)效能就是他們的一切。在我們更新軟件后系統(tǒng)硬件不變的情況下,平均速度從每秒約700個(gè)Token提升到了接近5000個(gè),整整提高了七倍。過(guò)去用于存儲(chǔ)文件的數(shù)據(jù)中心現(xiàn)在已經(jīng)變成了受功率限制的Token工廠。推理是新的工作負(fù)載,Token是新的商品,計(jì)算即收入。未來(lái)每一家云服務(wù)和AI公司都將思考其Token工廠的效能,這種智能將由Token來(lái)增強(qiáng)。


六、算力十年躍遷與智能體超級(jí)引擎

回顧過(guò)去十年的發(fā)展,我們?cè)?016年推出了全球首款專為深度學(xué)習(xí)設(shè)計(jì)的計(jì)算機(jī)DGX-1,八個(gè)Pascal架構(gòu)GPU通過(guò)第一代NVLink連接提供170Teraflops算力。隨后通過(guò)Volta架構(gòu)引入NVLink交換機(jī),將16顆GPU作為巨型GPU運(yùn)行。

隨著模型增長(zhǎng)數(shù)據(jù)中心需成為單一計(jì)算單元,于是Mellanox加入了NVIDIA。2020年推出的DGXA100SuperPOD結(jié)合了縱向與橫向擴(kuò)展架構(gòu)。之后開(kāi)啟生成式AI時(shí)代的Hopper架構(gòu)配備了FP8,而B(niǎo)lackwell通過(guò)NVLINK-72重新定義了AI超級(jí)計(jì)算,實(shí)現(xiàn)130TB/s的全對(duì)全帶寬。

如今智能體系統(tǒng)的算力需求呈指數(shù)級(jí)增長(zhǎng)。專為智能體AI設(shè)計(jì)的VeraRubin推進(jìn)了計(jì)算領(lǐng)域的各個(gè)支柱,提供3.6Exaflops算力和每秒260Terabytes的全對(duì)全帶寬。搭配專為編排設(shè)計(jì)的VeraCPU機(jī)架、基于BlueField-4的STX存儲(chǔ)機(jī)架、提升能效的Spectrum-X交換機(jī),以及增加Token加速器的Grock-3LPX機(jī)架,合力實(shí)現(xiàn)了每兆瓦35倍的吞吐量提升。這個(gè)包含七顆芯片、五臺(tái)機(jī)架級(jí)計(jì)算機(jī)的全新平臺(tái),讓算力在短短10年內(nèi)提升了4000萬(wàn)倍。

過(guò)去介紹Hopper時(shí)我還能舉起一顆芯片,但VeraRubin是一個(gè)需要整體優(yōu)化的龐大系統(tǒng)。智能體系統(tǒng)最關(guān)鍵的是大語(yǔ)言模型的思考過(guò)程,模型不斷增大對(duì)內(nèi)存和存儲(chǔ)系統(tǒng)產(chǎn)生了巨大壓力,因此我們重新發(fā)明了存儲(chǔ)系統(tǒng)。

AI需要工具盡可能快地運(yùn)行,為此我們打造了全新VeraCPU,它專為極高單線程性能設(shè)計(jì),是全球唯一采用LPDDR5的數(shù)據(jù)中心CPU,能效比傲視群雄。該CPU旨在與機(jī)架其他部分協(xié)同進(jìn)行智能體處理。

VeraRubin系統(tǒng)已實(shí)現(xiàn)100%液冷,取消了線纜,安裝時(shí)間從兩天縮短至兩小時(shí)。它使用45度溫水冷卻,大幅降低了數(shù)據(jù)中心的散熱成本與能源消耗。這是目前世界上唯一構(gòu)建到第六代的縱向擴(kuò)展交換系統(tǒng),實(shí)現(xiàn)難度極高。此外采用共封裝光學(xué)技術(shù)的Spectrum-X交換機(jī)也已全面量產(chǎn),光子直接連接芯片硅片,工藝完全是革命性的。VeraCPU作為獨(dú)立產(chǎn)品已成為價(jià)值數(shù)十億美元的業(yè)務(wù)。

這四個(gè)機(jī)架組成的系統(tǒng)通過(guò)結(jié)構(gòu)化布纜構(gòu)建,極為高效。而RubinUltra計(jì)算節(jié)點(diǎn)則更進(jìn)一步,安裝進(jìn)名為Kyber的全新機(jī)架中,可在一個(gè)NVLINK域中連接144個(gè)GPU。計(jì)算節(jié)點(diǎn)垂直插入中板,不再受限于銅纜的驅(qū)動(dòng)距離,背面連接NVLINK交換機(jī),組成一臺(tái)巨大的計(jì)算機(jī)。最后再次強(qiáng)調(diào),在給定的功率下AI工廠的吞吐量和Token生成速度將直接決定明年的收入,這是對(duì)AI工廠未來(lái)最重要的一項(xiàng)指標(biāo)。

縱軸是吞吐量,橫軸是Token速率。隨著Token生成速度的提升和模型規(guī)模的不斷擴(kuò)大,不同應(yīng)用場(chǎng)景對(duì)Token和上下文長(zhǎng)度的需求也在持續(xù)激增。輸入和輸出的Token長(zhǎng)度正從十萬(wàn)級(jí)別向數(shù)百萬(wàn)級(jí)別跨越。這些因素最終都將深刻影響未來(lái)Token的商業(yè)化營(yíng)銷與定價(jià)。

Token正在成為一種新的大宗商品。像所有大宗商品一樣,一旦技術(shù)走向成熟并到達(dá)拐點(diǎn),市場(chǎng)就會(huì)出現(xiàn)細(xì)分。高吞吐量但低生成速度的版本適用于免費(fèi)層級(jí);中等層級(jí)則會(huì)提供更大的模型、更快的生成速度以及更長(zhǎng)的上下文輸入窗口,對(duì)應(yīng)不同的定價(jià)區(qū)間。正如大家在各類云服務(wù)中所見(jiàn),從免費(fèi)層級(jí)到每百萬(wàn)Token收費(fèi)3美元、6美元的階梯定價(jià)模式已經(jīng)出現(xiàn)。

業(yè)界都在致力于不斷突破能力邊界,因?yàn)槟P蛥?shù)越大就越智能,輸入的上下文越長(zhǎng)則相關(guān)性越高。而在更快的生成速度下,系統(tǒng)能更好地進(jìn)行思考與迭代,從而催生出更聰明的AI模型,每一次性能的躍升都賦予了服務(wù)更高的溢價(jià)空間。

未來(lái)可能會(huì)出現(xiàn)收費(fèi)高達(dá)45美元甚至每百萬(wàn)Token收費(fèi)150美元的高級(jí)模型服務(wù),專門為處于關(guān)鍵研發(fā)路徑或進(jìn)行長(zhǎng)期復(fù)雜研究、對(duì)Token生成速度有極高要求的用戶提供支持。不過(guò)從現(xiàn)實(shí)來(lái)看,如果一個(gè)研究團(tuán)隊(duì)每天消耗五千萬(wàn)個(gè)Token,以每百萬(wàn)150美元計(jì)價(jià),這樣的成本是難以承受的。但我們堅(jiān)信階梯化與細(xì)分化就是AI產(chǎn)業(yè)的未來(lái)發(fā)展方向。AI技術(shù)必須從確立自身價(jià)值和實(shí)用性起步,不斷迭代升級(jí),未來(lái)大多數(shù)AI服務(wù)都將采用這種多層級(jí)的模式。

七、從Hopper到Vera Rubin:突破性能與吞吐量極限

回顧Hopper架構(gòu),大家本就預(yù)期下一代產(chǎn)品性能會(huì)有所提升,但Grace Blackwell的飛躍幅度超乎所有人想象。Grace Blackwell在免費(fèi)層級(jí)實(shí)現(xiàn)了吞吐量的極大提升,而這正是企業(yè)實(shí)現(xiàn)服務(wù)變現(xiàn)的核心領(lǐng)域,其吞吐量直接躍升了35倍。

正如各行各業(yè)的商業(yè)邏輯一樣:服務(wù)層級(jí)越高,對(duì)應(yīng)的質(zhì)量與性能越好,但可用容量相對(duì)越低。我們?cè)趯⒒A(chǔ)層級(jí)性能提升35倍的同時(shí),還引入了全新的服務(wù)層級(jí),這就是Grace Blackwell相較于Hopper實(shí)現(xiàn)的巨大跨越。

接下來(lái)登場(chǎng)的是Vera Rubin。在每一個(gè)細(xì)分服務(wù)層級(jí)上我們都實(shí)現(xiàn)了吞吐量的飛躍。特別是在平均售價(jià)最高、最具商業(yè)價(jià)值的頂層細(xì)分市場(chǎng)中,我們將吞吐量提升了整整10倍。在頂尖領(lǐng)域?qū)崿F(xiàn)如此幅度的性能跨越是極其艱難的工程挑戰(zhàn)。這正是NVLink72的優(yōu)勢(shì)所在,也是極低延遲架構(gòu)帶來(lái)的巨大紅利。通過(guò)極致的軟硬件協(xié)同設(shè)計(jì),我們成功拔高了整個(gè)行業(yè)的技術(shù)上限。

從客戶的實(shí)際運(yùn)營(yíng)角度來(lái)看,假設(shè)一個(gè)數(shù)據(jù)中心只有1吉瓦的電力總?cè)萘?,我們需要進(jìn)行精細(xì)的算力分配:比如將各25%的算力分別投入到免費(fèi)、中級(jí)、高級(jí)和Premium層級(jí)中。免費(fèi)層級(jí)用于獲客,而頂層服務(wù)則面向最具價(jià)值的客戶群,兩者結(jié)合最終轉(zhuǎn)化為業(yè)務(wù)營(yíng)收。

在相同的資源限制下,Blackwell架構(gòu)能夠創(chuàng)造五倍以上的收入,而Vera Rubin同樣能實(shí)現(xiàn)五倍的營(yíng)收增長(zhǎng)。因此客戶應(yīng)該盡早向Vera Rubin架構(gòu)遷移,這不僅能顯著提升吞吐量,還能大幅降低單Token的生成成本。

八、擁抱Groq:解耦推理與算力架構(gòu)的深度融合

但我們的追求不止于此。實(shí)現(xiàn)超高吞吐量需要海量的FLOPS算力支撐,而實(shí)現(xiàn)極低延遲和高頻交互則高度依賴龐大的內(nèi)存帶寬。由于系統(tǒng)芯片的物理表面積總是有限的,計(jì)算機(jī)架構(gòu)往往難以同時(shí)兼顧極高的FLOPS與極致的帶寬。在底層設(shè)計(jì)上,優(yōu)化高吞吐量與優(yōu)化低延遲本質(zhì)上是相互矛盾的。

為了打破這一物理瓶頸,我們收購(gòu)了Groq芯片研發(fā)團(tuán)隊(duì)并獲得了相關(guān)技術(shù)授權(quán)。雙方一直在通力合作整合系統(tǒng)架構(gòu)。如今在最具商業(yè)價(jià)值的高端層級(jí)中,我們將性能再度提升了35倍。NVIDIA之所以能在絕大多數(shù)AI工作負(fù)載中占據(jù)絕對(duì)的主導(dǎo)地位,根本原因就在于我們深刻理解吞吐量在這一領(lǐng)域的重要性。NVLink72展現(xiàn)出了顛覆性的架構(gòu)優(yōu)勢(shì),它是目前最正確的技術(shù)路徑,即使在引入Groq技術(shù)后,其核心地位依然堅(jiān)如磐石。

然而如果我們向外大幅延伸需求場(chǎng)景,假設(shè)你需要提供的服務(wù)不再是每秒400個(gè)Token,而是每秒1000個(gè)Token的超高速生成,NVLink72受限于帶寬瓶頸將力不從心。這正是Groq大顯身手的領(lǐng)域。Groq技術(shù)超越了現(xiàn)有極限,甚至突破了NVLink72所能觸及的性能天花板。如果將技術(shù)轉(zhuǎn)化為實(shí)際收益,Vera Rubin的創(chuàng)收能力是Blackwell的5倍。

如果你的主要業(yè)務(wù)是高吞吐量工作負(fù)載,我建議100%部署Vera Rubin;但如果你的業(yè)務(wù)涉及大量代碼編寫(xiě)或極高價(jià)值的Token生成任務(wù),引入Groq將是明智之舉。一種合理的資源配置是將Groq部署在約25%的數(shù)據(jù)中心節(jié)點(diǎn)中,剩余75%全部采用Vera Rubin。通過(guò)將兩者深度融合,我們可以進(jìn)一步拓展系統(tǒng)的性能邊界。

Groq的計(jì)算系統(tǒng)之所以極具吸引力,是因?yàn)樗捎昧舜_定性的數(shù)據(jù)流處理器架構(gòu)。它完全依賴靜態(tài)編譯和編譯器調(diào)度,由軟件預(yù)先精準(zhǔn)計(jì)算并調(diào)度執(zhí)行時(shí)機(jī),確保算力與數(shù)據(jù)同步到達(dá)。這種架構(gòu)徹底摒棄了動(dòng)態(tài)調(diào)度并配備了海量的SRAM,是專門為AI推理這一單一工作負(fù)載量身定制的。隨著全球?qū)Τ悄堋⒏咚賂oken的生成需求呈指數(shù)級(jí)爆發(fā),這種系統(tǒng)集成的價(jià)值將日益凸顯。

在這個(gè)體系中存在著兩種走向極端的處理器架構(gòu):一顆Vera Rubin芯片擁有288GB的龐大顯存;而如果要承載Rubin級(jí)別的海量模型參數(shù)以及龐大的上下文和KV緩存(KV Cache),則需要堆疊數(shù)量驚人的Groq芯片。龐大的內(nèi)存需求曾一度限制了Groq進(jìn)入主流市場(chǎng),直到我們構(gòu)思出一個(gè)絕妙的解決方案——通過(guò)一款名為Dynamo的軟件實(shí)現(xiàn)完全的解耦推理(Disaggregated Inference)。

我們徹底重構(gòu)了AI推理流水線的執(zhí)行方式。我們將最擅長(zhǎng)高吞吐量計(jì)算的任務(wù)交給Vera Rubin處理,同時(shí)將解碼生成、低延遲響應(yīng)以及受帶寬瓶頸制約的工作負(fù)載卸載給Groq。就這樣我們將兩種特性截然不同的處理器完美統(tǒng)一。

為了解決海量?jī)?nèi)存需求,我們只需橫向擴(kuò)展大量Groq芯片來(lái)擴(kuò)充內(nèi)存容量。對(duì)于萬(wàn)億參數(shù)級(jí)別的超大模型,我們可以將其完整部署在Groq芯片集群中;同時(shí)Vera Rubin在一旁協(xié)同工作,負(fù)責(zé)存儲(chǔ)處理復(fù)雜智能體(Agentic AI)系統(tǒng)所需的龐大KV緩存。

基于解耦推理的概念,Vera Rubin負(fù)責(zé)處理相對(duì)簡(jiǎn)單的預(yù)填充(Pre-fill)環(huán)節(jié),而Groq則深度參與解碼(Decode)過(guò)程。解碼階段中計(jì)算密集的注意力(Attention)機(jī)制由Vera Rubin承擔(dān),而前饋網(wǎng)絡(luò)(Feedforward Network)以及最終的Token生成則在Groq芯片上執(zhí)行。

這兩大系統(tǒng)通過(guò)以太網(wǎng)(Ethernet)緊密耦合,并通過(guò)特殊傳輸模式將網(wǎng)絡(luò)延遲削減了近一半。在這一強(qiáng)大的硬件底座之上,我們運(yùn)行了專為AI工廠打造的卓越操作系統(tǒng)Dynamo,最終實(shí)現(xiàn)了高達(dá)35倍的性能飛躍,更帶來(lái)了全球前所未見(jiàn)的Token生成層級(jí)推理性能。這就是整合了Groq技術(shù)的新一代Vera Rubin系統(tǒng)。

在此我要特別感謝Samsung。他們?yōu)槲覀兇ぶ圃炝薌roq LP30芯片,目前產(chǎn)線正在全力運(yùn)轉(zhuǎn),芯片已全面進(jìn)入量產(chǎn)階段。預(yù)計(jì)在今年第三季度左右,我們還將發(fā)布升級(jí)版的Groq LPX。

回顧以往,由于NVLink72架構(gòu)的極度復(fù)雜性,Grace Blackwell在早期的樣片測(cè)試階段面臨了巨大挑戰(zhàn);但Vera Rubin的測(cè)試工作推進(jìn)得異常順利。正如Satya所宣布的,第一臺(tái)Vera Rubin機(jī)架已在Microsoft Azure云平臺(tái)上正式點(diǎn)亮運(yùn)行。我們?cè)谌蚍秶鷥?nèi)構(gòu)建了極其強(qiáng)大的供應(yīng)鏈體系,目前每周能夠產(chǎn)出數(shù)千套此類龐大系統(tǒng),相當(dāng)于每個(gè)月都能交付數(shù)吉瓦規(guī)模的AI工廠基礎(chǔ)設(shè)施。在持續(xù)交付GB300機(jī)架的同時(shí),我們也在全面量產(chǎn)Vera Rubin機(jī)架。

與此同時(shí)Vera CPU也取得了空前的成功。當(dāng)前AI在執(zhí)行工具調(diào)用(Tool Use)等復(fù)雜操作時(shí),依然高度依賴CPU的指令處理能力,Vera CPU的架構(gòu)設(shè)計(jì)完美契合了這一核心訴求。Vera CPU與BlueField數(shù)據(jù)處理器以及CX9網(wǎng)卡深度整合,共同接入了BlueField-4網(wǎng)絡(luò)堆棧生態(tài)。

目前全球所有的主流存儲(chǔ)企業(yè)都在積極融入我們的系統(tǒng)生態(tài)。過(guò)去是人類在使用SQL查詢調(diào)用數(shù)據(jù),而未來(lái)將是海量的AI智能體在瘋狂讀取存儲(chǔ)系統(tǒng)。這些系統(tǒng)必須能夠無(wú)縫支持cuDF加速存儲(chǔ)、cuVS加速存儲(chǔ)以及極其關(guān)鍵的海量KV緩存讀取。


九、突破摩爾定律:極致協(xié)同設(shè)計(jì)與路線圖

令人驚嘆的是,在短短兩年內(nèi),我們?cè)谝蛔呒?jí)的AI工廠中,通過(guò)前所未有的軟硬件架構(gòu)創(chuàng)新打破了摩爾定律原本只能帶來(lái)的線性算力增長(zhǎng)。憑借這套全新的架構(gòu),我們將Token生成速率從每秒200萬(wàn)暴增至7億,實(shí)現(xiàn)了整整350倍的驚人跨越。這就是極致協(xié)同設(shè)計(jì)(Extreme Co-design)的力量:先進(jìn)行深度的垂直整合與優(yōu)化,隨后將其水平開(kāi)放給整個(gè)行業(yè)生態(tài)。

關(guān)于我們的產(chǎn)品路線圖:Blackwell架構(gòu)的Oberon系統(tǒng)已經(jīng)全面問(wèn)世,并且在Rubin架構(gòu)中我們將繼續(xù)沿用Oberon系統(tǒng),確??蛻糗浻布Y產(chǎn)的向后兼容。Oberon采用了銅纜縱向擴(kuò)展(Scale-up)技術(shù),同時(shí)我們也支持通過(guò)光通信實(shí)現(xiàn)系統(tǒng)的橫向擴(kuò)展(Scale-out),最高可擴(kuò)展至NVLink576的龐大網(wǎng)絡(luò)。

業(yè)界經(jīng)常討論NVIDIA未來(lái)會(huì)押注銅纜還是光通信,我們的答案是兩者齊頭并進(jìn)。我們將推出配合Kyber架構(gòu)的NVLink144,并通過(guò)光纖連接將采用NVLink72的Oberon系統(tǒng)進(jìn)一步擴(kuò)展為NVLink576集群。

下一代Rubin Ultra芯片正在緊鑼密鼓地流片中。同時(shí)我們還將推出全新的LP35芯片,它將首發(fā)搭載NVIDIA革命性的NVFP4計(jì)算架構(gòu),為系統(tǒng)帶來(lái)指數(shù)級(jí)的X-factor性能加速。目前采用NVLink72光子級(jí)擴(kuò)展、搭載全球首款共封裝光學(xué)(CPO)器件Spectrum 6的Oberon系統(tǒng)已經(jīng)全面投入量產(chǎn)。

在這之后我們將迎來(lái)代號(hào)為Feynman的全新一代架構(gòu)。Feynman不僅擁有全面革新的GPU,還將搭載由NVIDIA與Grok團(tuán)隊(duì)強(qiáng)強(qiáng)聯(lián)手打造的全新LPU——LP40芯片。與之配套的還有代號(hào)為Rosa的全新CPU以及新一代BlueField-5數(shù)據(jù)處理器,負(fù)責(zé)將新一代CPU與SuperNIC CX10緊密連接。

在Feynman架構(gòu)下,我們將提供基于銅纜的Kyber縱向擴(kuò)展方案,以及基于CPO技術(shù)的Kyber光通信縱向擴(kuò)展方案。這是我們首次在縱向擴(kuò)展領(lǐng)域同時(shí)并行推進(jìn)銅纜和共封裝光學(xué)技術(shù)路線。銅纜連接依然至關(guān)重要,但同時(shí)我們也必須大規(guī)模提升光通信的連接規(guī)模和CPO產(chǎn)能,以應(yīng)對(duì)日益暴漲的算力需求。

十、NVIDIA DSX與下一代超級(jí)AI工廠

NVIDIA正以每年一次的極速節(jié)奏推進(jìn)架構(gòu)迭代,并已從一家芯片公司徹底蛻變?yōu)樘峁〢I工廠和基礎(chǔ)設(shè)施的系統(tǒng)級(jí)公司。目前在全球正建設(shè)的龐大AI工廠中,由于缺乏系統(tǒng)級(jí)優(yōu)化存在著巨大的算力和能源浪費(fèi)。許多底層組件在進(jìn)入數(shù)據(jù)中心之前從未進(jìn)行過(guò)聯(lián)合設(shè)計(jì)與調(diào)試。

為了解決這一痛點(diǎn),我們打造了Omniverse及其延伸的DSX平臺(tái)。這是一個(gè)讓全球產(chǎn)業(yè)鏈伙伴能夠在虛擬世界中共同協(xié)作、聯(lián)合設(shè)計(jì)吉瓦級(jí)超級(jí)AI工廠的數(shù)字孿生平臺(tái)。我們擁有涵蓋機(jī)架結(jié)構(gòu)、機(jī)械物理、熱力學(xué)散熱、電氣工程以及復(fù)雜網(wǎng)絡(luò)拓?fù)涞娜孜锢砑?jí)模擬系統(tǒng),這些仿真能力已深度集成到我們?nèi)蛏鷳B(tài)伙伴的專業(yè)工業(yè)軟件中。

此外DSX平臺(tái)還能直接與現(xiàn)實(shí)世界的電網(wǎng)連接,動(dòng)態(tài)統(tǒng)籌調(diào)度數(shù)據(jù)中心功耗與電網(wǎng)負(fù)荷以節(jié)約能源。在數(shù)據(jù)中心內(nèi)部我們引入了Max-Q技術(shù),在供電、冷卻及各類硬件設(shè)施之間進(jìn)行動(dòng)態(tài)負(fù)載均衡,確保每一度電都能轉(zhuǎn)化為最極致的Token吞吐量。在這個(gè)宏大的系統(tǒng)工程中,我深信至少還能挖掘出兩倍以上的性能提升空間。

NVIDIA DSX是一張用于設(shè)計(jì)和運(yùn)營(yíng)AI工廠的Omniverse數(shù)字孿生藍(lán)圖。開(kāi)發(fā)者可以通過(guò)豐富的API接入:使用DSXsim進(jìn)行物理、電氣與熱能仿真;通過(guò)DSxExchange管理AI工廠的運(yùn)營(yíng)數(shù)據(jù);利用DSxFlex實(shí)現(xiàn)與電網(wǎng)的動(dòng)態(tài)功率協(xié)同;最后由DSX Max-Q動(dòng)態(tài)最大化Token吞吐量。這一流程始于NVIDIA與各大設(shè)備制造商提供的仿真就緒(Sim-ready)資產(chǎn),交由PTC Windchill PLM進(jìn)行管理,隨后導(dǎo)入達(dá)索系統(tǒng)的3DExperience平臺(tái)進(jìn)行基于模型的系統(tǒng)工程(MBSE)設(shè)計(jì)。

工程企業(yè)可將數(shù)據(jù)無(wú)縫導(dǎo)入自定義的Omniverse應(yīng)用中完成最終廠房設(shè)計(jì)。在虛擬驗(yàn)證環(huán)節(jié),我們調(diào)用西門子Star-CCM+進(jìn)行外部熱分析,使用Cadence Reality進(jìn)行內(nèi)部熱分析,利用ETAP進(jìn)行電氣仿真,最后依靠NVIDIA的網(wǎng)絡(luò)模擬器DSx Air配合Procore平臺(tái)完成虛擬調(diào)試。

當(dāng)物理站點(diǎn)落成上線后,數(shù)字孿生將轉(zhuǎn)化為工廠的運(yùn)營(yíng)者。AI智能體將與DSX Max-Q協(xié)同工作,動(dòng)態(tài)編排基礎(chǔ)設(shè)施。Phaedrus Agent負(fù)責(zé)監(jiān)督冷卻和電力系統(tǒng)以持續(xù)優(yōu)化能源效率;Emerald AI Agent則負(fù)責(zé)解讀實(shí)時(shí)電網(wǎng)需求信號(hào)并動(dòng)態(tài)調(diào)整功率。Omniverse的初衷就是構(gòu)建世界的數(shù)字孿生,而DSX正是我們?nèi)碌腁I工廠平臺(tái)。

不僅如此,NVIDIA的目光已經(jīng)投向太空。Thor芯片已順利通過(guò)太空輻射認(rèn)證并成功部署在衛(wèi)星中用于軌道成像。未來(lái)我們計(jì)劃在太空中建設(shè)數(shù)據(jù)中心。目前我們正與航天伙伴聯(lián)合研發(fā)名為Vera Rubin Space One的新型計(jì)算機(jī),它將成為人類在太空建立數(shù)據(jù)中心的先驅(qū)。由于太空環(huán)境中沒(méi)有熱傳導(dǎo)和對(duì)流,只能依靠熱輻射,這要求我們的工程師必須攻克前所未有的散熱技術(shù)難關(guān)。


十一、OpenClaw:開(kāi)源智能體生態(tài)的爆發(fā)

今天著名開(kāi)發(fā)者Peter Steinberger也來(lái)到了現(xiàn)場(chǎng),他主導(dǎo)開(kāi)發(fā)了一款名為OpenClaw的軟件。也許連他自己都沒(méi)意識(shí)到這款軟件的深遠(yuǎn)影響力。短短數(shù)周內(nèi)OpenClaw就躥升至榜首,成為人類歷史上最受歡迎的開(kāi)源項(xiàng)目,它極短時(shí)間內(nèi)的成就甚至超越了Linux過(guò)去三十年的積淀。這款軟件具有劃時(shí)代的意義,NVIDIA今天在此正式宣布將全力支持OpenClaw生態(tài)。

它的使用門檻極低,開(kāi)發(fā)者只需在控制臺(tái)中輸入一行簡(jiǎn)短的代碼,系統(tǒng)就會(huì)自動(dòng)下載OpenClaw并為你構(gòu)建一個(gè)專屬的AI Agent,隨后你只需用自然語(yǔ)言下達(dá)指令即可。Andrei Karpathy團(tuán)隊(duì)也剛發(fā)布了意義非凡的研究成果:你可以在睡前給AI Agent布置任務(wù),它會(huì)在夜間全自動(dòng)運(yùn)行上百次實(shí)驗(yàn),自動(dòng)保留有效結(jié)果并剔除無(wú)效路徑。

OpenClaw正在重塑各行各業(yè)。有人分享了一位60歲的父親安裝OpenClaw的案例:他通過(guò)藍(lán)牙將設(shè)備連接到OpenClaw,系統(tǒng)接管了精釀啤酒的全套自動(dòng)化流程,甚至自動(dòng)生成并上線了供客戶下單的完整電商網(wǎng)站。在深圳數(shù)百家商戶正利用它實(shí)現(xiàn)龍蝦銷售的全鏈路自動(dòng)化。連我們自己的工程師也正嘗試使用OpenClaw來(lái)構(gòu)建下一代的OpenClaw?,F(xiàn)在甚至連OpenClaw開(kāi)發(fā)者大會(huì)(Claw Con)都應(yīng)運(yùn)而生了。

那么OpenClaw究竟是什么?本質(zhì)上它是一個(gè)超級(jí)連接器和全局化的智能體系統(tǒng)(Agentic System)。它的核心能力在于調(diào)用并連接大型語(yǔ)言模型,從而接管與管理計(jì)算機(jī)資源。OpenClaw可以訪問(wèn)各類工具和底層文件系統(tǒng);具備強(qiáng)大的任務(wù)調(diào)度能力,能夠執(zhí)行定時(shí)任務(wù)(Cron Jobs);它擁有極強(qiáng)的邏輯拆解能力,能夠根據(jù)分步引導(dǎo)(Step-by-step)的提示詞拆解復(fù)雜問(wèn)題,并自主衍生和喚醒其他子代理(Sub-agents)協(xié)同工作。此外它還擁有極其豐富的全模態(tài)I/O輸入輸出能力,你可以通過(guò)任何模態(tài)與之交互——甚至向它揮手它也能理解,并在執(zhí)行完畢后通過(guò)系統(tǒng)消息、短信或電子郵件向你匯報(bào)結(jié)果。

它還有什么功能?基于這一點(diǎn),可以說(shuō)它事實(shí)上是一個(gè)操作系統(tǒng)。我剛才使用的正是描述操作系統(tǒng)時(shí)會(huì)用到的語(yǔ)法。OpenClaw已經(jīng)開(kāi)源了Agentic計(jì)算機(jī)的核心操作系統(tǒng),這與Windows讓個(gè)人電腦成為可能并無(wú)二致。現(xiàn)在OpenClaw讓創(chuàng)建個(gè)人智能體成為了可能,其影響不可估量。

最重要的一點(diǎn)是,現(xiàn)在每一家軟件公司和技術(shù)公司都意識(shí)到了這一點(diǎn)。對(duì)于CEO們來(lái)說(shuō),問(wèn)題在于你們的OpenClaw戰(zhàn)略是什么。正如我們?cè)?jīng)需要制定Linux戰(zhàn)略、HTTP和HTML戰(zhàn)略從而開(kāi)啟互聯(lián)網(wǎng)時(shí)代,正如我們需要制定Kubernetes戰(zhàn)略從而使移動(dòng)云成為可能,當(dāng)今世界上的每家公司都需要制定OpenClaw戰(zhàn)略和智能體系統(tǒng)戰(zhàn)略,這是全新的計(jì)算機(jī)。

在OpenClaw出現(xiàn)之前,企業(yè)級(jí)IT被稱為數(shù)據(jù)中心的原因是那些巨大的建筑存儲(chǔ)著數(shù)據(jù)、人們的文件以及企業(yè)的結(jié)構(gòu)化數(shù)據(jù)。這些數(shù)據(jù)會(huì)流經(jīng)包含各種工作流和記錄系統(tǒng)的軟件,并轉(zhuǎn)化為人類和數(shù)字員工使用的工具。那是舊的IT行業(yè):軟件公司開(kāi)發(fā)工具、保存文件,全球系統(tǒng)集成商和顧問(wèn)幫助公司研究如何使用并集成這些工具。

這些工具對(duì)于治理、安全、隱私和合規(guī)性來(lái)說(shuō)具有極高的價(jià)值,且這一切將繼續(xù)保持其重要性。但在OpenClaw之后的智能體時(shí)代,情況將發(fā)生改變。每一家IT公司和SaaS公司都將轉(zhuǎn)變?yōu)橐患覄?dòng)力源公司,毫無(wú)疑問(wèn),每一家SaaS公司都將成為智能體即服務(wù)公司。

令人驚嘆的是,OpenClaw在最準(zhǔn)確的時(shí)間為整個(gè)行業(yè)提供了最需要的東西,就像Linux、Kubernetes和HTML在最恰當(dāng)?shù)臅r(shí)機(jī)出現(xiàn)一樣。它讓整個(gè)行業(yè)能夠抓住這個(gè)開(kāi)源技術(shù)棧并大有作為。但目前面臨一個(gè)問(wèn)題:企業(yè)網(wǎng)絡(luò)中的智能體系統(tǒng)可以訪問(wèn)敏感信息、執(zhí)行代碼并進(jìn)行外部通信。這意味著它可以訪問(wèn)員工、供應(yīng)鏈和財(cái)務(wù)等敏感信息并將其發(fā)送出去,這顯然是絕對(duì)不被允許的。因此,我們召集了世界上頂尖的安全和計(jì)算專家與Pieter合作開(kāi)發(fā)了OpenClaw,使其具備企業(yè)級(jí)安全和隱私保護(hù)能力。

我們推出了NVIDIA的OpenClaw參考實(shí)現(xiàn)NemoClaw。它擁有代理式AI工具包,其中第一部分是現(xiàn)已集成到OpenClaw中的OpenShell技術(shù),這讓它具備了企業(yè)級(jí)就緒能力。你可以下載試用NemoClaw參考堆棧,并將全球所有SaaS公司極具價(jià)值的策略引擎連接到它。NemoClaw或帶有OpenShell的OpenClaw將能夠執(zhí)行該策略引擎,它配備了網(wǎng)絡(luò)護(hù)欄和隱私路由器,從而保護(hù)并安全地在公司內(nèi)部執(zhí)行策略。

我們還為智能體系統(tǒng)增加了定制化Claws功能,讓用戶能夠擁有專屬的定制模型,這正是NVIDIA的Open Model Initiative。NVIDIA目前處于每一個(gè)AI模型領(lǐng)域的最前沿,無(wú)論是Nemotron語(yǔ)言模型、Kosmos世界基礎(chǔ)模型、GROOT通用機(jī)器人人工智能、用于自動(dòng)駕駛汽車的AlphaMIO、用于數(shù)字生物學(xué)的VaioNemo,還是用于AI物理學(xué)的Earth-2。因?yàn)槭澜缡嵌鄻踊?,沒(méi)有單一的模型可以服務(wù)于所有行業(yè)。

Open Models是全球規(guī)模最大且最具多樣性的AI生態(tài)系統(tǒng)之一,涵蓋語(yǔ)言、視覺(jué)、生物學(xué)、物理學(xué)和自主系統(tǒng)領(lǐng)域的近三百萬(wàn)個(gè)開(kāi)放模型,助力構(gòu)建特定領(lǐng)域的AI。作為開(kāi)源AI領(lǐng)域最大的貢獻(xiàn)者之一,NVIDIA構(gòu)建并發(fā)布了六個(gè)系列的開(kāi)放前沿模型,提供訓(xùn)練數(shù)據(jù)和框架以幫助開(kāi)發(fā)者進(jìn)行定制和采用。每個(gè)系列都在推出登頂排行榜的新模型。

其核心包括用于語(yǔ)言推理、視覺(jué)理解、RAG、安全和語(yǔ)音的Nemotron模型,用于物理AI世界生成與理解的前沿模型Kosmos,全球首款具備思考與推理能力的自動(dòng)駕駛AIAlphaMIO,通用機(jī)器人基礎(chǔ)模型GROOT,用于生物化學(xué)和分子設(shè)計(jì)的開(kāi)放模型VaioNemo,以及植根于AI物理學(xué)的天氣和氣候預(yù)測(cè)模型Earth-2。

NVIDIA開(kāi)放模型為研究人員和開(kāi)發(fā)人員提供了構(gòu)建其專業(yè)領(lǐng)域AI的基礎(chǔ)。我們的模型是世界級(jí)的并在排行榜上名列前茅,但最重要的是我們將持續(xù)推動(dòng)其進(jìn)化,例如Nemotron 3之后將推出Nemotron 4,Kosmos 1之后推出了Kosmos 2,GROOT也已經(jīng)到了第二代。我們通過(guò)垂直整合與水平開(kāi)放讓每個(gè)人都能加入AI革命。

在研究、語(yǔ)音、世界模型、通用人工智能機(jī)器人、自動(dòng)駕駛汽車和推理領(lǐng)域,我們的模型均位列排行榜第一,其中最重要的是集成在OpenClaw中的Nemotron-3,它是世界上最好的三個(gè)模型之一。我們致力于創(chuàng)建基礎(chǔ)模型以便用戶進(jìn)行微調(diào)和后訓(xùn)練,使其完全符合所需的智能水平。即將推出的Nemotron 3 Ultra將成為世界上最出色的基礎(chǔ)模型,幫助每個(gè)國(guó)家建立其主權(quán)AI。

今天,我們宣布成立Nemotron聯(lián)盟,致力于讓Nemotron-4變得更加出色。我們投入了數(shù)十億美元用于AI基礎(chǔ)設(shè)施建設(shè)以開(kāi)發(fā)AI核心引擎,這不僅對(duì)推理庫(kù)至關(guān)重要,也能激活世界上的每一個(gè)行業(yè)。大語(yǔ)言模型固然重要,但在全球不同的行業(yè)和國(guó)家,由于從生物學(xué)到物理學(xué)、從自動(dòng)駕駛到通用機(jī)器人的專業(yè)領(lǐng)域完全不同,你需要有能力定制自己的模型。我們有能力與每一個(gè)地區(qū)合作,打造特定領(lǐng)域的主權(quán)AI。

加入該聯(lián)盟的出色公司包括影像公司Blackforest Labs、編程公司Cursor、在創(chuàng)建自定義智能體方面擁有十億次下載量的LangChain、Mistral,以及打造了多模態(tài)智能體系統(tǒng)的Perplexity。此外,還有Reflection、來(lái)自印度的Sarvam、Thinking Machine以及Mira Murati的實(shí)驗(yàn)室等優(yōu)秀伙伴加入了我們。世界上每一家軟件公司都需要智能體系統(tǒng)和OpenClaw策略,這些伙伴都對(duì)此表示贊同,并正在與我們合作集成NeMo Claw參考設(shè)計(jì)、NVIDIA Agentic AI Toolkit以及我們所有的開(kāi)源模型。

這是一場(chǎng)企業(yè)級(jí)IT的復(fù)興,將把一個(gè)兩萬(wàn)億美元的行業(yè)重塑為價(jià)值數(shù)萬(wàn)億美元的產(chǎn)業(yè),不僅提供供人們使用的工具,還提供針對(duì)特定領(lǐng)域的智能體租賃服務(wù)。未來(lái),我們公司的每一位工程師除了獲得幾十萬(wàn)美元的基本工資外,還需要一份年度Token預(yù)算,我可能會(huì)給他們相當(dāng)于基本工資一半的Token,這將為他們帶來(lái)十倍的增值空間。Token預(yù)算已成為硅谷的招聘工具之一,因?yàn)槟軌蚴褂肨oken的工程師將擁有更高的生產(chǎn)力。

這些Token將由大家合作共建的AI工廠生產(chǎn)。如今的企業(yè)構(gòu)建在文件系統(tǒng)和數(shù)據(jù)中心之上,而未來(lái)的每一家軟件公司都將是代理化的Token制造商,為工程師和客戶提供Token。OpenClaw的影響力與HTML和Linux的誕生同樣深遠(yuǎn)。我們現(xiàn)在擁有了世界級(jí)的開(kāi)放代理框架供所有人構(gòu)建OpenClaw戰(zhàn)略,同時(shí)還提供了性能卓越且安全可靠的優(yōu)化版參考設(shè)計(jì)Nemo Claw。

十二、物理AI、機(jī)器人技術(shù)與生態(tài)發(fā)展

智能體具備感知、推理和行動(dòng)的能力。目前大多數(shù)智能體都是在數(shù)字世界中進(jìn)行推理和編寫(xiě)軟件的數(shù)字智能體,但我們也一直在研究具有物理實(shí)體的智能體,也就是機(jī)器人,它們需要的是物理AI。世界上幾乎每一家制造機(jī)器人的公司都在與NVIDIA合作。

我們提供由訓(xùn)練計(jì)算機(jī)、合成數(shù)據(jù)生成與仿真計(jì)算機(jī)以及機(jī)器人內(nèi)部計(jì)算機(jī)構(gòu)成的三臺(tái)計(jì)算機(jī)架構(gòu),擁有實(shí)現(xiàn)目標(biāo)所需的所有軟件棧和AI模型,這些都已集成到全球從Siemens到Cadence等合作伙伴的生態(tài)系統(tǒng)中。今天我們宣布了一大批新合作伙伴,自動(dòng)駕駛汽車的ChatGPT時(shí)刻已經(jīng)到來(lái),我們已經(jīng)成功實(shí)現(xiàn)了汽車的自動(dòng)駕駛。

NVIDIA的自動(dòng)駕駛出租車平臺(tái)迎來(lái)了比亞迪、現(xiàn)代、日產(chǎn)和吉利四位新合作伙伴,這四家車企年產(chǎn)量達(dá)1800萬(wàn)輛,他們與梅賽德斯-奔馳、豐田和通用汽車等之前的合作伙伴一起,將使未來(lái)支持自動(dòng)駕駛出租車功能的汽車數(shù)量達(dá)到驚人的規(guī)模。我們還宣布與Uber達(dá)成重大合作,將在多個(gè)城市部署具備自動(dòng)駕駛出租車能力的車輛并將其接入U(xiǎn)ber網(wǎng)絡(luò)。

此外,我們正與ABB、Universal Robotics、KUKA等眾多機(jī)器人公司合作,將物理AI模型集成到仿真系統(tǒng)中,以便將機(jī)器人部署到生產(chǎn)線上。Caterpillar和T-Mobile也參與了合作,未來(lái)的無(wú)線電塔將升級(jí)為NVIDIA Aerial AI RAN,這種機(jī)器人無(wú)線電塔能對(duì)流量進(jìn)行推理,計(jì)算出如何調(diào)整波束成形以節(jié)省能源并提高保真度。

在眾多人形機(jī)器人中,Disney機(jī)器人是我最喜歡的之一。物理AI在全球范圍內(nèi)的首次大規(guī)模部署從自動(dòng)駕駛汽車開(kāi)啟,借助NVIDIA AlphaMIO,車輛現(xiàn)在具備了推理能力,能夠安全智能地應(yīng)對(duì)各種場(chǎng)景。汽車可以對(duì)操作進(jìn)行旁白解說(shuō),解釋繞過(guò)違章停放車輛等決策的思考過(guò)程,并嚴(yán)格遵循加速等指令。

在這個(gè)物理AI與機(jī)器人技術(shù)的時(shí)代,全球開(kāi)發(fā)者正在構(gòu)建各種類型的機(jī)器人。但由于現(xiàn)實(shí)世界充滿了不可預(yù)測(cè)的邊緣情況,僅靠真實(shí)數(shù)據(jù)不足以應(yīng)對(duì)所有場(chǎng)景,因此我們需要由AI和仿真生成的數(shù)據(jù)。對(duì)于機(jī)器人而言,算力即數(shù)據(jù)。開(kāi)發(fā)者在海量視頻和人類演示數(shù)據(jù)上預(yù)訓(xùn)練世界基礎(chǔ)模型,通過(guò)結(jié)合經(jīng)典模擬與神經(jīng)模擬生成海量合成數(shù)據(jù),并進(jìn)行大規(guī)模策略訓(xùn)練。

為加速這一進(jìn)程,NVIDIA構(gòu)建了開(kāi)源的ISAAC Lab用于機(jī)器人的訓(xùn)練、評(píng)估與模擬。Newton用于可擴(kuò)展且GPU加速的可微分物理模擬,Kosmos世界模型用于神經(jīng)模擬,GROOT開(kāi)源機(jī)器人基礎(chǔ)模型用于推理與動(dòng)作生成。憑借充足的算力,各地開(kāi)發(fā)者正彌合物理AI的數(shù)據(jù)鴻溝。

例如,Peritas AI在ISAAC Lab中訓(xùn)練手術(shù)室輔助機(jī)器人并通過(guò)Kosmos成倍增加數(shù)據(jù);Skilled AI利用ISAAC Lab和Kosmos生成訓(xùn)練后數(shù)據(jù),并通過(guò)強(qiáng)化學(xué)習(xí)在數(shù)千種場(chǎng)景中強(qiáng)化模型。Humanoid、Hexagon Robotics、Foxconn和Noble Machines均使用ISAAC Lab進(jìn)行全身控制、操作策略訓(xùn)練及數(shù)據(jù)生成微調(diào)。Disney Research則在Newton和ISAAC Lab中結(jié)合其Kamino物理模擬器為其角色機(jī)器人訓(xùn)練策略。

接下來(lái)請(qǐng)出Disney機(jī)器人Olaf。它的成功運(yùn)行證明了Newton和Omniverse的強(qiáng)大。Olaf肚子里的Jetson計(jì)算機(jī)讓它學(xué)會(huì)了在Omniverse中行走。正是通過(guò)物理學(xué)原理,以及在與Disney和DeepMind共同開(kāi)發(fā)的NVIDIA Warp之上運(yùn)行的Newton解算器,Olaf才能完美適應(yīng)物理世界。

試想一下Disneyland的未來(lái),將會(huì)有無(wú)數(shù)像Olaf這樣自由走動(dòng)的角色機(jī)器人。通常在演講結(jié)束時(shí)我會(huì)復(fù)述重點(diǎn)內(nèi)容,包括推理拐點(diǎn)、AI工廠、正在發(fā)生的OpenClaw智能體革命以及物理AI和機(jī)器人技術(shù)。但今天我們將用一段總結(jié)視頻來(lái)收尾。

視頻回顧了算力爆發(fā)的歷程,從CNN到OpenClaw,我們將算力提升了四千萬(wàn)倍。在AI時(shí)代早期,訓(xùn)練是核心范式,但如今推理正在運(yùn)行整個(gè)世界。通過(guò)Vera等架構(gòu),成本降低了35倍,Blackwell讓推理能力大幅躍升。過(guò)去構(gòu)建AI工廠耗時(shí)數(shù)年且缺乏明確的擴(kuò)展方法,而現(xiàn)在的技術(shù)能直接將電力轉(zhuǎn)化為營(yíng)收。智能體也從被動(dòng)觀望轉(zhuǎn)變?yōu)樽灾餍袆?dòng),一旦偏離航向,開(kāi)源的NeMo Guardrails會(huì)迅速攔截并守護(hù)進(jìn)程。

這不僅是電影場(chǎng)景,會(huì)思考的汽車和機(jī)器玩具已經(jīng)拉開(kāi)序幕,AlphaMIO掌控了自動(dòng)駕駛,機(jī)器人領(lǐng)域迎來(lái)了GPT時(shí)刻。各種架構(gòu)的結(jié)合掀起了推理熱潮,我們每年都在構(gòu)建新架構(gòu)以滿足日益增長(zhǎng)的Token需求。AI技術(shù)棧已向所有人開(kāi)放,開(kāi)源模型正引領(lǐng)前沿。當(dāng)真實(shí)數(shù)據(jù)缺失時(shí),我們利用算力生成合成數(shù)據(jù),助力機(jī)器人完美學(xué)習(xí)并驗(yàn)證縮放法則。未來(lái)已至,感謝大家參加GTC大會(huì)。

本文來(lái)自微信公眾號(hào):劃重點(diǎn)KeyPoints,作者:常遠(yuǎn)

本內(nèi)容由作者授權(quán)發(fā)布,觀點(diǎn)僅代表作者本人,不代表虎嗅立場(chǎng)。如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系 tougao@huxiu.com。

本文來(lái)自虎嗅,原文鏈接:https://www.huxiu.com/article/4842874.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
突發(fā)!上海最大商場(chǎng)砸的62億懸了!

突發(fā)!上海最大商場(chǎng)砸的62億懸了!

新浪財(cái)經(jīng)
2026-03-26 00:14:57
郜林:來(lái)銘途一個(gè)月沒(méi)開(kāi)過(guò)會(huì);當(dāng)總經(jīng)理和踢球不同

郜林:來(lái)銘途一個(gè)月沒(méi)開(kāi)過(guò)會(huì);當(dāng)總經(jīng)理和踢球不同

懂球帝
2026-03-26 22:00:56
中國(guó)最有名的9條家訓(xùn),讀懂一條旺家三代,建議收藏反復(fù)背誦

中國(guó)最有名的9條家訓(xùn),讀懂一條旺家三代,建議收藏反復(fù)背誦

長(zhǎng)風(fēng)文史
2026-03-25 17:58:23
中美衛(wèi)星導(dǎo)航用戶數(shù)量懸殊:GPS用戶數(shù)超60億,中國(guó)北斗令人意外

中美衛(wèi)星導(dǎo)航用戶數(shù)量懸殊:GPS用戶數(shù)超60億,中國(guó)北斗令人意外

混沌錄
2026-03-18 23:54:31
伊朗新最高領(lǐng)袖莫賈塔巴哈梅內(nèi)伊已同意與美國(guó)進(jìn)行談判并達(dá)成協(xié)議

伊朗新最高領(lǐng)袖莫賈塔巴哈梅內(nèi)伊已同意與美國(guó)進(jìn)行談判并達(dá)成協(xié)議

深度報(bào)
2026-03-25 22:47:08
華為、商湯等873家機(jī)構(gòu)遭AI頂會(huì)“封殺”,中國(guó)學(xué)界怒了

華為、商湯等873家機(jī)構(gòu)遭AI頂會(huì)“封殺”,中國(guó)學(xué)界怒了

智東西
2026-03-26 20:49:23
巴基斯坦把稀土賣給美國(guó),以為捏住中國(guó)“七寸”,其實(shí)在玩火自焚

巴基斯坦把稀土賣給美國(guó),以為捏住中國(guó)“七寸”,其實(shí)在玩火自焚

通文知史
2026-03-24 08:35:03
宋美齡書(shū)法對(duì)比:鋼筆字似小學(xué)生,英文手稿如中學(xué)生!

宋美齡書(shū)法對(duì)比:鋼筆字似小學(xué)生,英文手稿如中學(xué)生!

書(shū)畫(huà)相約
2026-03-26 07:49:18
先被里瓦爾多全面逆襲,后遭齊達(dá)內(nèi)強(qiáng)勢(shì)碾壓,全能戰(zhàn)士時(shí)運(yùn)不濟(jì)

先被里瓦爾多全面逆襲,后遭齊達(dá)內(nèi)強(qiáng)勢(shì)碾壓,全能戰(zhàn)士時(shí)運(yùn)不濟(jì)

足籃大世界
2026-03-26 10:52:09
三次精準(zhǔn)躲過(guò)斬首行動(dòng),卡尼突然現(xiàn)身反轉(zhuǎn)劇情,伊朗這局水太深了

三次精準(zhǔn)躲過(guò)斬首行動(dòng),卡尼突然現(xiàn)身反轉(zhuǎn)劇情,伊朗這局水太深了

盛夏微涼
2026-03-24 18:10:08
卡爾森:壞了!原來(lái)小丑不是特朗普,而是我自己

卡爾森:壞了!原來(lái)小丑不是特朗普,而是我自己

朝廷心腹
2026-03-26 09:07:14
真的太孤獨(dú)了!山東47歲母親稱已懷胎8月,兩女遠(yuǎn)嫁卻極力反對(duì)…

真的太孤獨(dú)了!山東47歲母親稱已懷胎8月,兩女遠(yuǎn)嫁卻極力反對(duì)…

火山詩(shī)話
2026-03-25 13:41:56
張近東資產(chǎn)清零,張朝陽(yáng)手握百億現(xiàn)金:兩種人生,一個(gè)忠告

張近東資產(chǎn)清零,張朝陽(yáng)手握百億現(xiàn)金:兩種人生,一個(gè)忠告

老特有話說(shuō)
2026-03-26 14:31:44
一天蒸發(fā)6200億!谷歌算法黑科技擊潰存儲(chǔ)股,華爾街痛批市場(chǎng)“不懂技術(shù)”

一天蒸發(fā)6200億!谷歌算法黑科技擊潰存儲(chǔ)股,華爾街痛批市場(chǎng)“不懂技術(shù)”

每日經(jīng)濟(jì)新聞
2026-03-26 19:00:13
中國(guó)摩托在越南被日本本田打的慘?。‖F(xiàn)在又一路翻盤,太解氣!

中國(guó)摩托在越南被日本本田打的慘敗!現(xiàn)在又一路翻盤,太解氣!

萬(wàn)物知識(shí)圈
2026-03-26 15:19:33
蘋果受追捧,國(guó)產(chǎn)手機(jī)漲價(jià)基本失敗了,正在悄悄降價(jià)

蘋果受追捧,國(guó)產(chǎn)手機(jī)漲價(jià)基本失敗了,正在悄悄降價(jià)

柏銘銳談
2026-03-24 15:38:55
馬英九親自下場(chǎng)后,藍(lán)營(yíng)大佬集體回應(yīng),臺(tái)媒體人:罪在馬英九

馬英九親自下場(chǎng)后,藍(lán)營(yíng)大佬集體回應(yīng),臺(tái)媒體人:罪在馬英九

DS北風(fēng)
2026-03-25 18:50:17
iPhone半夜自動(dòng)打電話,蘋果官網(wǎng)發(fā)文回應(yīng)

iPhone半夜自動(dòng)打電話,蘋果官網(wǎng)發(fā)文回應(yīng)

界面新聞
2026-03-26 15:46:22
公積金新調(diào)整!4月1日起,職工可自愿提高繳存比例

公積金新調(diào)整!4月1日起,職工可自愿提高繳存比例

另子維愛(ài)讀史
2026-03-25 22:28:47
穎兒太敢了!素顏曝光臉頰凹陷,做醫(yī)美全程不藏著,疼到五官扭曲

穎兒太敢了!素顏曝光臉頰凹陷,做醫(yī)美全程不藏著,疼到五官扭曲

圓夢(mèng)的小老頭
2026-03-26 21:31:03
2026-03-27 00:00:49
虎嗅APP incentive-icons
虎嗅APP
個(gè)性化商業(yè)資訊與觀點(diǎn)交流平臺(tái)
25981文章數(shù) 687624關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)發(fā)布外賣大戰(zhàn)后成績(jī)單:虧損超200億

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂(lè)要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開(kāi)啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

親子
家居
手機(jī)
本地
房產(chǎn)

親子要聞

看看把孩子嚇得哈哈哈

家居要聞

傍海而居 靜觀蝴蝶海

手機(jī)要聞

OPPO K15 Pro 系列定檔,嵐影呼吸燈搭配金屬中框

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬(wàn)遍

房產(chǎn)要聞

突發(fā),三亞又有大批征遷補(bǔ)償方案出爐!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版