国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

黃仁勛揭秘Vera Rubin架構(gòu)與物理AI的‘ChatGPT’時刻 | CES 2026演講全文2.5萬字+視頻

0
分享至

|未經(jīng)許可不得轉(zhuǎn)載星標(biāo)本號獲取最新頂級認(rèn)知|


整理: Web3天空之城

在2026.1.6 拉斯維加斯璀璨的燈光下,英偉達(dá)(NVIDIA)創(chuàng)始人兼首席執(zhí)行官黃仁勛拉開了2025年國際消費電子展(CES)的序幕。黃仁勛面對全球數(shù)百萬觀眾宣布:計算機(jī)行業(yè)正在經(jīng)歷每10到15年一次的徹底重置。這一次,傳統(tǒng)的五層技術(shù)棧正在被重新發(fā)明,而英偉達(dá)正試圖通過加速計算、開源模型與物理人工智能(Physical AI),定義下一個十年的生存規(guī)則。

演講視頻完整版:

00:04:14 計算機(jī)平臺演變與推理驅(qū)動的人工智能革命

00:17:35 人工智能智能體與多模態(tài)企業(yè)級應(yīng)用架構(gòu)

00:28:24 物理人工智能:從世界模型到自動駕駛實踐

00:47:34 具身智能機(jī)器人與工業(yè)級物理人工智能生態(tài)

00:57:26 維拉·魯賓架構(gòu):下一代超級計算核心芯片解析

01:09:00 極端協(xié)同設(shè)計與高性能網(wǎng)絡(luò)互聯(lián)系統(tǒng)

01:21:14 語義存儲革新與超級計算工廠的效能飛躍

以下是本次主題演講的核心洞見:

  • ? 平臺轉(zhuǎn)型 :計算行業(yè)每10-15年重置一次,當(dāng)前正處于人工智能與加速計算雙重轉(zhuǎn)型的交匯點,傳統(tǒng)五層技術(shù)棧正在被重新發(fā)明。

  • ? 具身智能與物理AI :2025年是具身智能的爆發(fā)年,通過 Cosmos 世界基礎(chǔ)模型和合成數(shù)據(jù)生成技術(shù),AI 開始理解物理法則并與現(xiàn)實世界互動。

  • ? 自動駕駛飛躍 :發(fā)布了具備推理能力的自動駕駛 AI “Alpamayo”,實現(xiàn)了從傳感器輸入到執(zhí)行器輸出的端到端訓(xùn)練與邏輯解釋。

  • ? Vera Rubin架構(gòu) :新一代 6 芯片系統(tǒng)實現(xiàn)全面投產(chǎn),通過“極端代碼設(shè)計”突破了摩爾定律放緩的限制,大幅提升了 AI 訓(xùn)練與推理的能效比。

  • ? “計算行業(yè)每10到15年重置一次,當(dāng)前我們正處于加速計算與人工智能雙重轉(zhuǎn)型的交匯點?!?/strong>

  • ? “2025年將是具身智能的爆發(fā)年,AI開始理解物理法則并與現(xiàn)實世界深度互動?!?/strong>

  • ? “開源模型已經(jīng)達(dá)到前沿水平,DeepSeek R1等模型的進(jìn)步激活了全球范圍內(nèi)的AI創(chuàng)新運動?!?/strong>

  • ? “未來的應(yīng)用將建立在智能體(Agents)之上,它們具備推理、規(guī)劃并使用工具解決復(fù)雜問題的能力?!?/strong>

  • ? “自動駕駛的未來在于具備推理能力的AI,它不僅是傳感器的反饋,更是對物理世界的邏輯解釋?!?/strong>

  • ? “‘Vera Rubin’架構(gòu)代表了極端的協(xié)同設(shè)計,我們在摩爾定律放緩的背景下,實現(xiàn)了算力的指數(shù)級躍升?!?/strong>

范式轉(zhuǎn)移:從“編程軟件”到“訓(xùn)練軟件”

黃仁勛指出,計算的基礎(chǔ)形態(tài)已經(jīng)發(fā)生了根本性的重塑。過去,我們編寫代碼、預(yù)編譯程序并在CPU上運行;而現(xiàn)在,我們訓(xùn)練軟件,并在GPU上運行。這種轉(zhuǎn)變意味著價值十萬億美元的計算領(lǐng)域正在進(jìn)行現(xiàn)代化改造。

現(xiàn)在的應(yīng)用程序需要理解上下文,并且每一次都從零開始生成每一個像素和標(biāo)記 黃仁勛強(qiáng)調(diào)。這意味著每年數(shù)千億美元的研發(fā)預(yù)算正在從傳統(tǒng)方法轉(zhuǎn)向人工智能。在這個新世界中,人工智能不再僅僅是一個應(yīng)用程序,而是構(gòu)建所有應(yīng)用程序的基石。

開源模型的崛起與“智能體”架構(gòu)


去年是人工智能歷史上的重要節(jié)點,尤其是開源模型的進(jìn)步。黃仁勛特別提到了DeepSeek R1的突破:“它是第一個具有推理系統(tǒng)的開源模型,讓全世界感到驚訝。開源模型已經(jīng)達(dá)到了前沿水平,這讓每個國家和企業(yè)都能參與到這場革命中?!?/strong>

英偉達(dá)的角色正在發(fā)生轉(zhuǎn)變,它不僅是芯片供應(yīng)商,更是前沿人工智能模型的構(gòu)建者。黃仁勛展示了英偉達(dá)如何通過開源模型、數(shù)據(jù)和工具庫(如Nemo、Cosmos)來賦能全球生態(tài)。他認(rèn)為,未來的企業(yè)UI將不再是繁瑣的表格或命令行,而是“智能體系統(tǒng)”。

智能體系統(tǒng)就是界面,它能推理如何解決問題,而不只是機(jī)械地執(zhí)行指令。 在現(xiàn)場演示中,一個基于英偉達(dá)架構(gòu)的個人助理展示了如何跨模型協(xié)作:處理私密郵件時調(diào)用本地模型,處理復(fù)雜創(chuàng)意時調(diào)用云端前沿模型,同時控制物理機(jī)器人完成家務(wù)。這種“多模型、多云、混合云”的架構(gòu),正是未來應(yīng)用的基本框架。

物理人工智能:物理世界的“ChatGPT時刻”


如果說大語言模型讓AI學(xué)會了說話,那么物理人工智能(Physical AI)則讓AI學(xué)會了行動。黃仁勛認(rèn)為,物理AI的“ChatGPT時刻”已經(jīng)迫近。

物理人工智能不僅是與世界互動,更是要理解物理定律。 為了教AI學(xué)會常識——如物體恒存性、因果關(guān)系和重力——英偉達(dá)構(gòu)建了三臺計算機(jī)的閉環(huán):一臺用于訓(xùn)練,一臺用于模擬(Omniverse),一臺用于執(zhí)行(機(jī)器人電腦)。

由于真實世界的物理數(shù)據(jù)極其稀缺,英偉達(dá)推出了Cosmos世界基礎(chǔ)模型。Cosmos將計算轉(zhuǎn)化為數(shù)據(jù),通過合成數(shù)據(jù)生成技術(shù),我們可以在虛擬世界中模擬數(shù)萬億英里的駕駛或機(jī)器人的各種極端操作場景。 這種“以物理定律為約束”的模擬,解決了機(jī)器人訓(xùn)練中最昂貴、最慢的數(shù)據(jù)獲取難題。

Alpamayo:賦予汽車“思考”的能力

在自動駕駛領(lǐng)域,英偉達(dá)發(fā)布了具備推理能力的AI模型——Alpamayo。這是世界上第一個實現(xiàn)了“端到端訓(xùn)練”且具備邏輯解釋能力的自動駕駛系統(tǒng)。

汽車不僅要學(xué)會像人類一樣自然駕駛,更要在遇到突發(fā)狀況時進(jìn)行推理,并告訴你它為什么要這么做。 黃仁勛透露,英偉達(dá)與梅賽德斯-奔馳(Mercedes-Benz)深度合作的這一系統(tǒng)將在2025年第一季度正式上路。為了確保絕對安全,英偉達(dá)采用了雙重棧架構(gòu):一個端到端訓(xùn)練的AI模型負(fù)責(zé)自然駕駛,一個基于規(guī)則的經(jīng)典安全堆棧負(fù)責(zé)兜底護(hù)欄。這種多樣性和冗余性,是英偉達(dá)對未來十年交通自動化的承諾。

Vera Rubin架構(gòu):突破摩爾定律的極限

演講的高潮部分是全新高性能計算架構(gòu)Vera Rubin的發(fā)布。面對摩爾定律的放緩,英偉達(dá)采取了“極端協(xié)同設(shè)計”(Extreme Co-design)的策略。

Vera Rubin架構(gòu)是一個由六個芯片組成的復(fù)雜系統(tǒng),包括性能翻倍的Vera CPU和算力提升5倍的Rubin GPU。“在晶體管數(shù)量僅增加1.6倍的情況下,我們實現(xiàn)了5倍的推理性能飛躍,這完全歸功于極端的代碼設(shè)計和新型張量核心結(jié)構(gòu)?!?/strong>

此外,英偉達(dá)還重塑了數(shù)據(jù)中心的基礎(chǔ)設(shè)施,推出了硅光子交換機(jī)和針對AI優(yōu)化的以太網(wǎng)Spectrum X?!?strong>我們正在用熱水冷卻超級計算機(jī),這使我們能節(jié)省全球約6%的數(shù)據(jù)中心電力。” 這種全棧式的創(chuàng)新,使得在給定時間內(nèi)訓(xùn)練超大規(guī)模模型所需的系統(tǒng)數(shù)量減少到原來的四分之一。

從設(shè)計芯片的EDA工具到制造機(jī)器人的數(shù)字化工廠,英偉達(dá)正與西門子、新思、楷登等巨頭合作,將物理AI帶入完整的工業(yè)生命周期。

“我們正處于一場新的工業(yè)革命的開端,”黃仁勛最后總結(jié)道,“人工智能正在重塑從芯片到基礎(chǔ)設(shè)施、再到應(yīng)用的所有環(huán)節(jié)。我們的任務(wù)是構(gòu)建完整的技術(shù)棧,以便你們可以為全世界創(chuàng)造出令人難以置信的應(yīng)用?!?/p>

Web3天空之城全文整理 計算機(jī)行業(yè)的平臺轉(zhuǎn)型與AI現(xiàn)代化

拉斯維加斯的朋友們,大家好!新年快樂!歡迎來到國際消費電子產(chǎn)品展(CES)!我們這里有大約15場主題演講的內(nèi)容要塞進(jìn)來。

我很高興見到你們所有人。你們這個禮堂里有3,000人。庭院里有2,000人在觀看我們。據(jù)稱,在四樓本該是播放視頻的樓層,還有另外1,000人在觀看這次主題演講,當(dāng)然,全球還有數(shù)百萬人將觀看這次演講以開啟新的一年。

大約每10到15年,計算機(jī)行業(yè)就會重置一次。

一個新的平臺轉(zhuǎn)變會發(fā)生。從大型機(jī)到個人電腦,從個人電腦到互聯(lián)網(wǎng),從互聯(lián)網(wǎng)到云計算,再到移動設(shè)備。每一次,應(yīng)用程序的世界都會瞄準(zhǔn)一個新的平臺。這就是為什么它被稱為平臺轉(zhuǎn)變。你為一臺新計算機(jī)編寫新的應(yīng)用程序。

只不過這一次,實際上同時發(fā)生了兩次平臺轉(zhuǎn)變。我們現(xiàn)在轉(zhuǎn)向人工智能,應(yīng)用程序?qū)⒔⒃谌斯ぶ悄苤稀F鸪?,人們認(rèn)為人工智能就是應(yīng)用程序,事實上,人工智能確實是應(yīng)用程序,但你將會在人工智能之上構(gòu)建應(yīng)用程序,但除此之外,軟件的運行方式和開發(fā)方式也發(fā)生了根本性的改變。

整個計算機(jī)行業(yè)的五層技術(shù)棧正在被重新發(fā)明。你不再是編程軟件,而是訓(xùn)練軟件。你不再在中央處理器上運行它,而是在圖形處理器上運行。而且,過去應(yīng)用程序是預(yù)先錄制、預(yù)先編譯并在你的設(shè)備上運行,而現(xiàn)在應(yīng)用程序需要理解上下文,并且每一次都從零開始生成每一個像素、每一個標(biāo)記。

由于加速計算和人工智能,計算的基礎(chǔ)形態(tài)已經(jīng)發(fā)生了根本性的重塑。那五層蛋糕的每一層現(xiàn)在都在被重新發(fā)明。這意味著過去十年中價值約十萬億美元的計算領(lǐng)域正在以這種新的計算機(jī)方式進(jìn)行現(xiàn)代化改造。這意味著每年數(shù)千億美元,大約兩千億美元的風(fēng)險投資正在投入到現(xiàn)代化和發(fā)明這個新世界中去。這意味著價值十萬億美元的產(chǎn)業(yè),其中百分之幾是研發(fā)預(yù)算,正在轉(zhuǎn)向人工智能。

人們會問,錢從哪里來?這就是資金的來源。人工智能的現(xiàn)代化進(jìn)程,研發(fā)預(yù)算從傳統(tǒng)方法轉(zhuǎn)向現(xiàn)在的人工智能方法的轉(zhuǎn)變。大量資金涌入這個行業(yè),這解釋了我們?yōu)楹稳绱嗣β?。去年也不例外。去年是不可思議的。去年,有一張幻燈片即將展示。這就是不練習(xí)時發(fā)生的情況。這是今年的第一次主題演講。我希望這是你今年的第一次主題演講。否則,你可能已經(jīng)相當(dāng)忙碌了。這是我們今年的第一次主題演講。年。我們要把蜘蛛網(wǎng)清干凈了。

所以2025年是不可思議的一年。這只是,似乎所有事情都同時發(fā)生了,事實上,可能確實如此。首先,當(dāng)然是損失的擴(kuò)大。2015年,我真正認(rèn)為會帶來變革的第一個語言模型產(chǎn)生了巨大的影響。它被稱為Bert。2017年出現(xiàn)了變形金剛。直到五年后,也就是2022年,才出現(xiàn)了ChatGPT時刻,它讓全世界都意識到了人工智能的可能性。一年后發(fā)生了一件非常重要的事情。

ChatGPT的第一個01模型,第一個推理模型,是完全革命性的,它發(fā)明了一個叫做測試時縮放(test time scaling)的想法,這是一個非常符合常識的東西。

我們不僅預(yù)先訓(xùn)練模型以進(jìn)行學(xué)習(xí),還使用真實的強(qiáng)化學(xué)習(xí)對其進(jìn)行后訓(xùn)練,使其能夠?qū)W習(xí)技能?,F(xiàn)在我們也有了測試時縮放,換句話說就是思考。你是在實時思考。人工智能的每一個階段都需要大量的計算能力。而計算定律持續(xù)擴(kuò)展。大型語言模型持續(xù)改進(jìn)。

與此同時,又出現(xiàn)了一項突破。這項突破發(fā)生在2024年。具身智能系統(tǒng)開始涌現(xiàn)。2025年,它開始涌現(xiàn)。滲透、擴(kuò)散到幾乎無處不在。那些具備推理能力、查找信息、進(jìn)行研究、使用工具、規(guī)劃未來、模擬結(jié)果的具身模型,突然間開始解決非常非常重要的問題。

我最喜歡的具身模型之一叫做Cursor(光標(biāo)),它徹底改變了我們在英偉達(dá)進(jìn)行軟件編程的方式。具身智能系統(tǒng)將從這里真正起飛。當(dāng)然,還有其他類型的人工智能。我們知道大型語言模型并非信息的唯一類型。無論宇宙中存在何種信息,無論宇宙存在何種結(jié)構(gòu),我們都可以訓(xùn)練一種大型語言模型,一種語言模型的形態(tài),去理解該信息,理解其表征,并將其轉(zhuǎn)化為人工智能。

其中一個最大、最重要的就是物理人工智能,即理解自然規(guī)律的人工智能。然后,當(dāng)然,物理人工智能是關(guān)于人工智能與世界的互動,但世界本身包含信息,編碼信息,這就被稱為人工智能物理學(xué)。在物理人工智能的案例中,你有與物理世界互動的AI,還有人工智能物理學(xué),即理解物理定律的AI。

開源模型的崛起與物理基礎(chǔ)模型

然后是去年的最后一件,也是最重要的事情之一,即開源模型的進(jìn)步。

我們現(xiàn)在知道,當(dāng)開源、開放創(chuàng)新、全球每家公司和每個行業(yè)的創(chuàng)新同時被激活時,人工智能將無處不在地擴(kuò)散。開源模型去年真的騰飛了。事實上,去年我們看到了DeepSeek R1的進(jìn)步,它是第一個具有推理系統(tǒng)的開源模型。它讓全世界感到驚訝,并真正激活了整個運動。這是一項非常非常令人興奮的工作。我們對此感到非常高興。

現(xiàn)在,世界各地都有各種各樣的開源模型系統(tǒng),我們現(xiàn)在知道開源模型也已經(jīng)達(dá)到了前沿水平。仍然比前沿模型落后整整六個月,但每隔六個月,就會有新的模型出現(xiàn),而且這些模型變得越來越智能。正因為如此,你可以看到下載量已經(jīng)激增。下載量增長如此之快,是因為初創(chuàng)公司想要參與人工智能革命,大公司想要,研究人員想要,學(xué)生想要,幾乎所有國家都想要。智能,即數(shù)字形式的智能,怎么可能把任何人落下?因此,開源模型去年確實徹底改變了人工智能的面貌。整個行業(yè)將因此被重塑。

現(xiàn)在,我們很早以前就有這種預(yù)感了。你可能聽說過,幾年前,我們就開始構(gòu)建和運營自己的人工智能超級計算機(jī)了。我們稱之為DGX云。很多人問,你們是要進(jìn)軍云計算業(yè)務(wù)嗎?答案是否定的。我們正在為我們自己的用途構(gòu)建這些DGX超級計算機(jī)。事實證明,我們有數(shù)十億美元的超級計算機(jī)正在運行,以便我們能夠開發(fā)我們的開源模型。我對我們所做的工作感到非常滿意。

由于我們在眾多不同的領(lǐng)域從事前沿人工智能模型的研發(fā)工作,這開始吸引全球和各行各業(yè)的關(guān)注。我們在蛋白質(zhì)、數(shù)字生物學(xué)領(lǐng)域所做的工作,例如La Pratina,能夠合成和生成蛋白質(zhì)。Open Fold 3,用于理解蛋白質(zhì)的結(jié)構(gòu)。Evo 2。如何理解和生成多個。多個蛋白質(zhì),否則就是細(xì)胞表征的開端。地球2,理解物理定律的人工智能,我們用ForecastNet所做的工作,我們用CoreDiv所做的工作,真正徹底改變了人們進(jìn)行天氣預(yù)測的方式。

Nemotri,我們現(xiàn)在在那里做著開創(chuàng)性的工作,第一個混合Transformer SSM模型,它速度極快,因此可以長時間思考,或者可以短時間快速思考并產(chǎn)生非常聰明、智能的答案。Nemotron 3是開創(chuàng)性的工作,您可以期待我們在不久的將來推出Neumotron 3之外的其他版本。Cosmos,一個前沿的、開放的、世界基礎(chǔ)模型,一個理解世界如何運作的模型。Groot,一個類人機(jī)器人系統(tǒng),關(guān)節(jié)運動、移動性、行走能力,這些模型,這些技術(shù)現(xiàn)在正在被整合,并且在所有這些案例中,都向全世界開放。前沿的人機(jī)和機(jī)器人模型向全世界開放。

然后今天,我們將談?wù)撘稽c關(guān)于Alpamio,我們一直在自動駕駛汽車領(lǐng)域所做的工作。我們不僅開源這些模型,我們還開源用于訓(xùn)練這些模型的數(shù)據(jù)。因為只有通過這種方式,你才能真正相信這些模型是如何產(chǎn)生的。我們將這些模型產(chǎn)生的一切都開源了。模型,我們幫助您基于它們創(chuàng)建衍生模型。

我們擁有一整套庫。我們稱之為 Nemo 庫,物理學(xué) Nemo 庫,以及 Clara Nemo 庫,每種都是生物 Nemo 庫。這些庫中的每一個都是人工智能的生命周期管理系統(tǒng),因此您可以處理數(shù)據(jù)、生成數(shù)據(jù)、訓(xùn)練模型、創(chuàng)建模型、評估模型、設(shè)置護(hù)欄保護(hù)模型,直到部署模型。這些庫中的每一個都極其復(fù)雜,而且所有這些都是開源的。

因此,現(xiàn)在在這個平臺之上,英偉達(dá)是一家前沿人工智能模型的構(gòu)建者,我們以一種非常特殊的方式構(gòu)建它。我們完全公開地構(gòu)建它,以便我們能夠使每家公司、每個行業(yè)、每個國家都能參與到這場人工智能革命中來。我為我們正在那里所做的工作感到非常自豪。事實上,如果您注意到圖表,圖表顯示我們對該行業(yè)的貢獻(xiàn)是首屈一指的,您會看到我們將繼續(xù)這樣做,甚至?xí)铀?。這些模型也是世界級的。所有系統(tǒng)都宕機(jī)了。

在圣克拉拉這從沒發(fā)生過。是因為拉斯維加斯嗎?

肯定有人想在外面贏大獎。所有系統(tǒng)都宕機(jī)了。

我想我的系統(tǒng)仍然宕機(jī),但沒關(guān)系。我會隨機(jī)應(yīng)變。所以這些模型不僅具有前沿能力,不僅是開放的,它們還登上了排行榜榜首。這是我們非常自豪的一個領(lǐng)域。它們在智能方面登上了排行榜榜首。

我們有一些重要的模型正在理解多模態(tài)文檔,也就是PDF文件。世界上最有價值的內(nèi)容都以PDF的形式存儲著。但需要人工智能才能發(fā)現(xiàn)其中的內(nèi)容、解釋其中的內(nèi)容并幫助您閱讀它。因此,我們的PDF檢索器、PDF解析器,我們世界一流的,我們的語音識別模型,絕對是世界一流的。我們的檢索模型,基本上是搜索、語義搜索、人工智能搜索,是現(xiàn)代人工智能時代的數(shù)據(jù)庫引擎,世界一流。所以我們一直在排行榜上名列前茅。這是我們非常自豪的一個領(lǐng)域。

人工智能代理(Agents)與個人助理演示

而所有這一切都是為了幫助您構(gòu)建人工智能代理。

這確實是一個開創(chuàng)性的發(fā)展領(lǐng)域。起初,當(dāng)ChatGPT出現(xiàn)時,人們說,天哪,它產(chǎn)生了非常有趣的結(jié)果,但它產(chǎn)生了大量的幻覺。

它產(chǎn)生幻覺的原因,當(dāng)然,它過去可以記住所有事情,但它無法記住現(xiàn)在未來會發(fā)生的所有事情。

因此,它需要以研究為基礎(chǔ)。在回答問題之前,它必須進(jìn)行基礎(chǔ)研究。關(guān)于是否需要進(jìn)行研究的推理能力;是否需要使用工具;

如何將一個問題分解成步驟;這些步驟中的每一步,都是人工智能模型知道如何完成的事情,然后它們共同組合成一系列步驟,以執(zhí)行它以前從未做過的事情。

那是它從未接受過訓(xùn)練去做的事情。這就是推理的神奇能力。我們可能會遇到一個從未見過的情況,并將其分解成我們知道如何處理的情況、知識或規(guī)則,因為我們過去經(jīng)歷過。因此,現(xiàn)在的人工智能模型具備了極其強(qiáng)大的推理能力。

智能體的推理能力為所有這些不同的應(yīng)用打開了大門。我們不再需要在第一天就訓(xùn)練人工智能模型了解一切,正如我們自己也不需要在第一天就了解一切一樣,我們應(yīng)該能夠在任何情況下,推理出如何解決那個問題。大型語言模型現(xiàn)在已經(jīng)實現(xiàn)了這一根本性的飛躍。使用強(qiáng)化學(xué)習(xí)、思維鏈,以及搜索、規(guī)劃和所有這些不同的強(qiáng)化學(xué)習(xí)技術(shù)的能力,使我們能夠具備這種基本能力,而且現(xiàn)在也完全開源了。

但真正了不起的是另一件事。發(fā)生的又一個突破。我第一次看到它是在 Ervin 的 Perplexity(一個人工智能搜索公司)那里,那是一家非常出色、極具創(chuàng)新性的公司。當(dāng)我第一次意識到他們同時使用了多個模型時,我覺得這完全是天才之舉。當(dāng)然我們會這樣做。當(dāng)然,一個人工智能在推理鏈的任何部分要解決它想解決的問題時,也會調(diào)用世界上所有偉大的人工智能。這就是原因所在。為什么人工智能真的是多模態(tài)的,這意味著它們理解語音、圖像、文本、視頻、3D圖形和蛋白質(zhì)。它是多模態(tài)的。它也是多模態(tài)的,這意味著它們應(yīng)該能夠使用最適合任務(wù)的任何模型。

因此,它本質(zhì)上是多云的,因為這些人工智能模型存在于所有這些不同的地方,它也是混合云,因為如果你是一家企業(yè)公司,或者你制造了一個機(jī)器人,或者無論那個設(shè)備是什么,它有時在邊緣,有時在無線電基站,也許有時在企業(yè)里,或者可能是在一個醫(yī)院,你需要實時地將數(shù)據(jù)保存在你身邊。

無論這些應(yīng)用是什么,我們現(xiàn)在都知道這就是未來人工智能應(yīng)用的樣子。

或者從另一個角度來看,因為未來的應(yīng)用是建立在人工智能之上的,這就是未來應(yīng)用的基本框架。這種基本框架,這種能夠完成我所談?wù)摰氖虑榈纳墒饺斯ぶ悄艿幕窘Y(jié)構(gòu),它是多模型的,已經(jīng)極大地提升了所有類型人工智能的性能。現(xiàn)在,由于所有開放的模型和我們提供的所有工具,你也可以定制你的人工智能,教你的人工智能沒有人教的技能。沒有其他人以那種方式使其人工智能變得智能或聰明。你可以為自己做這件事。這就是我們用 Nemotron、Nemo 以及我們用開源模型所做的所有事情的目的所在。你在它前面放一個智能路由器,這個路由器本質(zhì)上是一個管理器,它根據(jù)你給出的提示的意圖,決定哪個模型最適合該應(yīng)用、最適合解決該問題。好的?所以現(xiàn)在,當(dāng)你考慮這種架構(gòu)時,你擁有什么?

當(dāng)你考慮這種架構(gòu)時,突然之間,你擁有了一個人工智能,一方面你可以完全根據(jù)自己的需求進(jìn)行定制。

你可以教它為你公司做你自己的特定技能。

一些屬于領(lǐng)域機(jī)密的東西,一些你擁有深厚領(lǐng)域?qū)I(yè)知識的東西。

也許你擁有訓(xùn)練該人工智能模型所需的所有數(shù)據(jù)。另一方面,你的人工智能在定義上始終處于前沿水平。一方面,你總是在最前沿。另一方面,你總是定制化的,而且它應(yīng)該可以直接運行。所以我們想提供一個最簡單的示例供您使用。我們稱這個完整的框架為“藍(lán)圖”。我們的藍(lán)圖已經(jīng)集成到世界各地的企業(yè)SaaS平臺中,我們對目前的進(jìn)展感到非常滿意。但我們要做的是向您展示一個簡短的示例。這是任何人都可以做的事情。

讓我們來構(gòu)建一個個人助理。我希望它能幫我處理日歷、電子郵件、待辦事項列表,甚至照看我的家。我使用 brev 將我的 DGX Spark 變成一個個人云。這樣,無論我使用的是云GPU還是DGX Spark,我都可以使用相同的界面。我使用前沿模型API來輕松入門。我想讓它幫我處理電子郵件,所以我為我的代理程序創(chuàng)建了一個可以調(diào)用的電子郵件工具。

我希望我的電子郵件保持私密,所以我將添加一個在Spark上本地運行的開源模型?,F(xiàn)在,對于任何任務(wù),我都希望代理程序為正確的任務(wù)使用正確的模型,所以我將使用一個基于意圖的模型路由器。

這樣,需要電子郵件的提示就會保留在我的Spark上,而其他所有內(nèi)容都可以調(diào)用前沿模型。我希望我的助手能夠與我的世界互動,所以我將它連接到Hugging Face的Ritchie迷你機(jī)器人。我的代理程序通過工具調(diào)用來控制Ritchie的頭部、耳朵和攝像頭。我想給Ritchie一個聲音,我非常喜歡11 Labs,所以我將連接它們的API。你好,我是Ritchie,運行在DGX Spark上。嘿Ritchie,我今天的待辦事項清單上有什么?你今天的待辦事項清單。去買些雜貨、雞蛋、牛奶、黃油,然后把新劇本發(fā)給詹森。我們把這個更新發(fā)給詹森。告訴他們我們今天下班前會準(zhǔn)備好給他。我們會照辦的。里奇,還有個草圖。你能把它變成一個建筑效果圖嗎?

當(dāng)然可以。

這難道不令人難以置信嗎?

企業(yè)AI架構(gòu)與物理人工智能

現(xiàn)在,奇妙之處在于這現(xiàn)在是完全微不足道的。

這現(xiàn)在是完全微不足道的。然而,就在幾年前,這一切還是不可能實現(xiàn)的。絕對是無法想象的。這個基礎(chǔ)框架,這種使用語言模型構(gòu)建應(yīng)用的基礎(chǔ)方式,

使用語言模型,使用那些經(jīng)過預(yù)訓(xùn)練且專有的前沿語言模型,將其與定制的語言模型結(jié)合,融入到一個代理框架、一個推理框架中,該框架允許你訪問工具和文件,甚至可能連接到其他代理。這基本上就是...的架構(gòu):是現(xiàn)代應(yīng)用的或人工智能應(yīng)用的架構(gòu)。

而我們創(chuàng)建 these 應(yīng)用的能力是極其迅速的。請注意,如果你給它這個應(yīng)用,提供它從未見過的信息,或者提供一個與你所想結(jié)構(gòu)不完全一致的結(jié)構(gòu),它仍然可以對這些數(shù)據(jù)、這些信息進(jìn)行推理,并盡力去理解如何解決問題。人工智能。因此,這個基礎(chǔ)框架正在被整合,我剛才描述的一切,我們有幸與一些世界領(lǐng)先的企業(yè)平臺公司合作。

例如 Palantir。

他們整個的人工智能和數(shù)據(jù)處理平臺正在被集成,并由英偉達(dá)加速。Service Now,世界領(lǐng)先的客戶服務(wù)和員工服務(wù)平臺。Snowflake,世界頂級的云數(shù)據(jù)平臺,那里正在進(jìn)行著令人難以置信的工作。

CodeRabbit,我們在英偉達(dá)全方位使用 CodeRabbit。CrowdStrike 正在創(chuàng)建人工智能來檢測、發(fā)現(xiàn)人工智能威脅。

NetApp,他們的數(shù)據(jù)平臺現(xiàn)在在其之上集成了英偉達(dá)的語義人工智能和智能體系統(tǒng),供他們進(jìn)行客戶服務(wù)。

但重要的是這一點。

這不僅是現(xiàn)在開發(fā)應(yīng)用程序的方式,這將是您平臺的(新的)用戶界面。

所以,無論是Palantir、Service Now、Snowflake還是我們合作的許多其他公司,智能體系統(tǒng)就是界面。它不再是Excel,不再是那些讓你輸入信息的方格。也許它不再只是命令行。所有這些多模態(tài)信息現(xiàn)在都成為可能。你與你的平臺、平臺進(jìn)行交互的方式更加,如果你愿意這么說,更加簡單,就像你與人互動一樣。這就是企業(yè)人工智能正被智能體系統(tǒng)徹底改變的地方。

接下來是物理人工智能。這是我已經(jīng)談?wù)摿撕脦啄甑囊粋€領(lǐng)域。事實上,我們已經(jīng)在這一領(lǐng)域工作了八年。問題在于,你如何將計算機(jī)內(nèi)部的智能體,那個通過屏幕和揚聲器與你交互的東西,轉(zhuǎn)變?yōu)槟軌蚺c現(xiàn)實世界互動的實體,這意味著它能夠理解世界運行的基本常識。物體恒存性。

如果我移開視線再看回來,那個物體依然在那里。

因果關(guān)系。如果我推它,它就會倒下。它理解摩擦力和重力。它理解慣性。它理解在路上行駛的重型卡車需要更長的時間才能停下來。它理解一個球會一直滾動。這些概念即使對小孩來說也是常識,但對于人工智能來說,卻是完全未知的。

因此,我們必須創(chuàng)建一個系統(tǒng),允許人工智能學(xué)習(xí)物理世界的常識,學(xué)習(xí)它的規(guī)律,當(dāng)然,也能夠從數(shù)據(jù)中學(xué)習(xí),而這些數(shù)據(jù)相當(dāng)稀缺,并且要能夠評估該人工智能是否有效,這意味著它必須在一個環(huán)境中進(jìn)行模擬。

如果人工智能不具備模擬物理世界對其行為的響應(yīng)的能力,它怎么會知道它所執(zhí)行的行為與其應(yīng)該做的行為是一致的呢?模擬其行為的響應(yīng)確實非常重要。否則,就沒有辦法評估它。它每次都不同。

因此,這個基本系統(tǒng)需要三臺計算機(jī)。一臺計算機(jī),當(dāng)然是我們知道英偉達(dá)(Nvidia)用于訓(xùn)練人工智能模型的計算機(jī)。另一臺計算機(jī)我們知道是用于模型的推理。模型的推理本質(zhì)上是一臺機(jī)器人的計算機(jī),它在汽車中運行,或在機(jī)器人中運行,或在工廠中運行,在任何邊緣位置運行。但必須有另一臺專為模擬而設(shè)計的計算機(jī)。而模擬是英偉達(dá)所做幾乎所有事情的核心。這是我們最熟悉的地方。模擬是我們用物理人工智能所做幾乎一切的基礎(chǔ)。所以我們有三臺計算機(jī),以及運行在這些計算機(jī)上的多個堆棧、這些庫,使它們變得有用。

Omniverse 是我們基于物理學(xué)的數(shù)字孿生模擬世界。如我之前提到的,Cosmos 是我們的基礎(chǔ)模型,不是語言的基礎(chǔ)模型,而是世界的底層模型。它也與語言相協(xié)調(diào)。你可以說一些諸如“你知道球發(fā)生了什么”之類的話,它們會告訴你球正在沿著街道滾動。所以,一個世界基礎(chǔ)模型,當(dāng)然,還有機(jī)器人 Modics 模型。我們有兩個。

其中一個叫做 Groot。另一個我將要介紹的是 Alpamio?,F(xiàn)在,我們在物理人工智能方面必須做的最重要的事情之一,是首先創(chuàng)建數(shù)據(jù)來訓(xùn)練人工智能。

這些數(shù)據(jù)從哪里來呢?而不是像我們創(chuàng)建了大量文本一樣,我們認(rèn)為這些文本是人工智能可以從中學(xué)習(xí)的真實基礎(chǔ)數(shù)據(jù)。我們?nèi)绾谓倘斯ぶ悄芪锢韺W(xué)的基本事實?有很多很多的視頻。有很多很多的視頻,但還遠(yuǎn)遠(yuǎn)不足以捕捉我們所需要的多樣性和交互類型。

因此,偉大的思想家們齊聚一堂,將原本的計算轉(zhuǎn)變成了數(shù)據(jù)。現(xiàn)在,利用以物理定律為基礎(chǔ)并受其約束、以基本事實為基礎(chǔ)并受其約束的合成數(shù)據(jù)生成技術(shù),我們現(xiàn)在可以巧妙地選擇生成數(shù)據(jù),然后用這些數(shù)據(jù)來訓(xùn)練人工智能。因此,例如,進(jìn)入這個人工智能、這個宇宙人工智能世界模型(在左邊這里)的是一個交通模擬器的輸出。

現(xiàn)在,這個交通模擬器還遠(yuǎn)遠(yuǎn)不足以讓人工智能從中學(xué)習(xí)。我們可以將這個輸入到宇宙基礎(chǔ)模型中,并生成在物理上基于和物理上合理的(環(huán)境),人工智能現(xiàn)在可以從中學(xué)習(xí)。有非常多的這樣的例子。讓我向您展示宇宙(模型)能做什么。

物理人工智能的ChatGPT時刻已接近。但挑戰(zhàn)是明確的。物理世界是多樣化且不可預(yù)測的。收集真實世界的訓(xùn)練數(shù)據(jù)是緩慢且昂貴的,而且永遠(yuǎn)都不夠。答案是合成數(shù)據(jù)。它始于NVIDIA Cosmos,一個用于物理人工智能的開放前沿世界基礎(chǔ)模型,它使用互聯(lián)網(wǎng)規(guī)模的視頻、真實駕駛和機(jī)器人數(shù)據(jù)以及3D模擬進(jìn)行預(yù)訓(xùn)練。Cosmos學(xué)習(xí)了一種統(tǒng)一的世界表征,能夠?qū)R語言、圖像、3D和動作。它執(zhí)行生成、推理和軌跡預(yù)測等物理人工智能技能。

從單張圖Cosmos可以生成逼真的視頻。

從3D場景描述,可以生成物理上一致的運動。來自駕駛遙測和傳感器日志、環(huán)繞視頻。

來自規(guī)劃模擬器、多攝像頭環(huán)境,或者來自場景提示,它能讓邊緣案例生動起來。

開發(fā)者可以在Cosmos中運行交互式的閉環(huán)模擬。當(dāng)采取行動時,世界會做出響應(yīng)。Cosmos進(jìn)行推理。它分析邊緣場景,將其分解為熟悉的物理交互,并推理接下來可能發(fā)生什么。Cosmos將計算轉(zhuǎn)化為數(shù)據(jù),為自動駕駛汽車訓(xùn)練長尾場景,并訓(xùn)練機(jī)器人在每種場景中學(xué)習(xí)如何適應(yīng)。

這太不可思議了。Cosmos是全球領(lǐng)先的基礎(chǔ)模型。它的下載量已達(dá)數(shù)百萬次。被廣泛應(yīng)用。面向全球,為這個物理人工智能的新時代做好準(zhǔn)備。我們自己也在使用它。我們自己用它來制造我們的自動駕駛汽車。利用它進(jìn)行場景生成和評估,我們可以實實現(xiàn)并在計算機(jī)內(nèi)部有效地行駛數(shù)十億、數(shù)萬億英里。

自動駕駛 AI:Alpamayo 與梅賽德斯合作

我們?nèi)〉昧司薮蟮倪M(jìn)步。今天我們發(fā)布 Alpamio,世界上第一個具有思考、推理能力的自動駕駛汽車人工智能。Alpamio 經(jīng)過端到端訓(xùn)練,字面意義上是從攝像頭輸入到執(zhí)行器輸出。

攝像頭輸入,它自己駕駛了大量的里程,我們進(jìn)行人工駕駛,使用人類演示數(shù)據(jù)。

我們還有 Cosmos 生成的大量里程數(shù)據(jù)。除此之外,還非常非常仔細(xì)地標(biāo)記了數(shù)十萬個示例,以便我們能教汽車如何駕駛。Alpamio 做了一些非常特別的事情。它不僅接收傳感器輸入并激活方向盤、剎車和加速,它還會推理出即將采取的行動,它會告訴你將要采取什么行動,得出該行動的原因,當(dāng)然,還有軌跡。所有這些都直接耦合,并通過大量人類訓(xùn)練數(shù)據(jù)以及宇宙生成數(shù)據(jù)進(jìn)行非常具體地訓(xùn)練。其結(jié)果確實是令人難以置信的。

你的汽車不僅會像你期望的那樣駕駛,而且因為它直接從人類演示中學(xué)習(xí),所以駕駛得非常自然。但在每一種場景中,當(dāng)它遇到該場景時,它會進(jìn)行推理,告訴你它將要做什么,并推理出你將要做什么。

現(xiàn)在,這之所以如此重要,是因為駕駛的“長尾效應(yīng)”。

在那種情況下,我們不可能收集到所有國家和所有可能發(fā)生的所有人群的所有可能發(fā)生情況的每一個場景。然而,然而,它非常不可能,每一種場景如果分解成一堆其他更小的場景,對你來說都是很正常的理解。因此,這些長尾場景將被分解為汽車知道如何處理的相當(dāng)正常的情況。它只需要對此進(jìn)行推理。那么,讓我們來看一看。接下來你們將看到的一切都是一鏡到底的。這是不撒手的。

我們八年前開始研發(fā)自動駕駛汽車。

這樣做的原因是因為我們很早就判斷出深度學(xué)習(xí)和人工智能將要重塑整個計算技術(shù)棧。如果我們想要理解如何實現(xiàn)自主導(dǎo)航,以及如何引導(dǎo)行業(yè)邁向這個新未來,我們就必須擅長構(gòu)建整個技術(shù)棧。正如我前面提到的,人工智能是一個五層的蛋糕。最底層是基礎(chǔ)動力和硬件外殼。在機(jī)器人學(xué)的案例中,最底層就是汽車本身。再往上一層是芯片。圖形處理器、網(wǎng)絡(luò)芯片、中央處理器,所有這些東西。

再往上的一層是基礎(chǔ)設(shè)施。

如我之前提到物理人工智能那樣,在這種特定情況下,該基礎(chǔ)設(shè)施就是Omniverse和Cosmos。然后在它們之上是模型。

在我剛才展示的這些模型之上,這里的模型被稱為Alpamayo。而Alpamayo今天已開源。

這項令人難以置信的工作,耗費了數(shù)千人。為了作一對比,我們的自動駕駛汽車團(tuán)隊就有數(shù)千人。我們的合作伙伴Ola,我想Ola就在觀眾席中的某個地方,梅賽德斯(奔馳),在五年前同意與我們合作,來實現(xiàn)這一切。我們想象,總有一天路上行駛的十億輛汽車都將是自動駕駛的。你可以選擇它是一個你指揮、從別人那里租來的自動駕駛出租車,或者你可以擁有它,它自己駕駛?;蛘吣憧梢詻Q定自己駕駛。但每一輛車都將具備自動駕駛能力。每一輛車都將由人工智能驅(qū)動。

因此,在這種情況下,模型層是 Alpamio,其上方的應(yīng)用是梅賽德斯-奔馳。因此,整個技術(shù)棧是我們英偉達(dá)的第一個整體技術(shù)棧項目。

我們一直在為此付出努力,我非常高興 VDIA 的第一輛自動駕駛汽車將在第一季度上路,然后在第二季度進(jìn)入歐洲,美國是在第一季度,然后歐洲是第二季度,我想是第三和第四季度進(jìn)入亞洲。有力的是,我們將繼續(xù)使用下一代 Alpamayo 版本和之后的版本對其進(jìn)行更新。我對此深信疑。這將是最大的機(jī)器人產(chǎn)業(yè)之一,我很高興我們參與其中。它教會了我們?nèi)绾螏椭澜缙渌貐^(qū)構(gòu)建機(jī)器人系統(tǒng)方面的海量知識。那種深刻的理解,即知道如何自己構(gòu)建它,自己構(gòu)建整個基礎(chǔ)設(shè)施,以及知道機(jī)器人系統(tǒng)需要什么樣的芯片。在這種特定情況下,是雙重的Orin,下一代的雙重Thor。

這些處理器是為機(jī)器人系統(tǒng)設(shè)計的。

并且是為最高級別的安全能力而設(shè)計的。

這輛車剛剛獲得了評級。它剛剛投入生產(chǎn)。

梅賽德斯-奔馳CLA剛剛被歐洲新車安全評鑒協(xié)會(NCAP)評為世界上最安全的汽車。據(jù)我所知,它是唯一一個擁有每一行代碼、芯片、系統(tǒng)、系統(tǒng)、每一行代碼都通過安全認(rèn)證的系統(tǒng)。整個模型系統(tǒng)基于多樣化和冗余的傳感器,軟駕駛汽車堆棧也是如此。阿爾帕米奧(Alpamio)堆棧是端到端訓(xùn)練的,并具備驚人的能力。然而,除非你永遠(yuǎn)駕駛它,否則沒人知道它是否能保證絕對安全。

因此,我們設(shè)置護(hù)欄的方式是依靠另一個軟件堆棧,一個完整的自動駕駛(AV)堆棧作為底層支撐。整個自動駕駛堆棧都構(gòu)建為完全可追溯,我們花了大約五年時間構(gòu)建它,實際上是花了六、七年時間來構(gòu)建第二個堆棧。這兩個軟件堆棧是相互鏡像的,然后我們有一個策略和安全評估器來決定。

這是我非常有信心并能論證其能非常安全駕駛的事情嗎?

如果是,我將讓阿爾帕米奧(Alpamio)來執(zhí)行。如果是我就沒有太大信心的情形,并且安全策略評估器決定我們要回到一個非常簡單、更安全的護(hù)欄系統(tǒng),那么它就會返回到經(jīng)典的自動駕駛堆棧。我們是世界上唯一同時運行這兩個自動駕駛堆棧的汽車,而且所有安全系統(tǒng)都應(yīng)該具備多樣性和冗余性。我們的愿景是,總有一天,每一輛汽車、每一輛卡車都將實現(xiàn)自動化,我們一直在為實現(xiàn)這個未來而努力。

當(dāng)然,在梅賽德斯-奔馳的案例中,整個堆棧是垂直集成的。我們共同構(gòu)建了整個堆棧。我們正準(zhǔn)備部署這輛車。我們正準(zhǔn)備運營這個技術(shù)棧。我們將長期維護(hù)這個技術(shù)棧。我們將生存下去。

機(jī)器人產(chǎn)業(yè)與工業(yè)數(shù)字孿生

然而,如同我們公司所做的其他一切事情一樣,我們構(gòu)建了整個技術(shù)棧,但整個技術(shù)棧對生態(tài)系統(tǒng)是開放的。

并且與我們合作構(gòu)建L4級自動駕駛和機(jī)器人出租車(Robotaxies)的生態(tài)系統(tǒng)正在擴(kuò)大,并且無處不在。我完全期望這會是,這對我們來說已經(jīng)是一個巨大的業(yè)務(wù)了。這對我們來說是一個巨大的業(yè)務(wù),因為他們用它來訓(xùn)練我們的,訓(xùn)練數(shù)據(jù)、處理數(shù)據(jù)以及訓(xùn)練他們的模型。在某些情況下,他們用它來進(jìn)行合成數(shù)據(jù)生成,在某些汽車公司中,他們幾乎只是構(gòu)建車內(nèi)所安裝的計算機(jī)和芯片。

數(shù)據(jù)生成在某些情況下,在某些汽車公司中,他們幾乎只是構(gòu)建車內(nèi)所安裝的計算機(jī)和芯片。有些公司與我們進(jìn)行全棧合作。有些公司與我們合作,(或合作)其中的一部分。所以你決定使用多少并不重要。我唯一的要求是在任何可能的地方都使用一點視頻。而且,但整個事情是開放的?,F(xiàn)在,這將是第一個大規(guī)模、主流的、人工智能的、物理性人工智能市場。我想我們現(xiàn)在都可以同意,這已經(jīng)完全到來了。而這種從非自動駕駛汽車過渡到自動駕駛汽車的拐點,很可能就發(fā)生在這個時間點附近。在接下來的10年里,我相當(dāng)確定,世界上將有非常非常大比例的汽車實現(xiàn)自動駕駛或高度自動駕駛。

但這就是我剛才描述的,使用三臺計算機(jī)、使用合成數(shù)據(jù)生成和仿真的基本技術(shù),它適用于所有形式的機(jī)器人系統(tǒng)。它可以是一個僅僅是機(jī)械臂、一個操作器的機(jī)器人。也許它是一個移動機(jī)器人。也許它是一個完全擬人化的機(jī)器人。因此,機(jī)器人系統(tǒng)的下一次發(fā)展、下一個時代將是機(jī)器人。而這些機(jī)器人將會有各種不同的尺寸。我邀請了一些朋友。他們來了嗎?

到這邊來。以前,現(xiàn)在,其中一件事,其中一件事是,你們有“杰森一家”(Jetsons),他們里面有小小的杰森電腦。它們在“元宇宙”(Omniverse)中進(jìn)行訓(xùn)練。那這個怎么樣?讓我們向大家展示一下你們學(xué)習(xí)如何成為機(jī)器人的那個模擬器。你們想看看那個嗎?我們來看看那個。請運行它。

我不知道。它是否都完全在機(jī)器人內(nèi)部。還有那個機(jī)器人?

那就是你們學(xué)習(xí)成為機(jī)器人的方式?你們所有的一切都是在“云端”(Omniverse)里完成的嗎?還有那個機(jī)器人?還有那個機(jī)器人,是嗎?艾薩克、Sim和艾薩克實驗室。還有任何想制造機(jī)器人的人,沒有人會像你一樣可愛。但現(xiàn)在我們有了所有,看看我們所有正在制造機(jī)器人的朋友們。我們正在制造大的。不,就像我說的,沒有人像你們一樣可愛。但我們有神經(jīng)機(jī)器人(neurobot),我們有,我們那邊有助教機(jī)器人(adjubot)。我們這邊有樂金(LG)。他們剛剛宣布了一款新機(jī)器人??ㄌ乇死眨–aterpillar),他們擁有有史以來最大的機(jī)器人。然而,那個機(jī)器人是給您家里送餐的。它連接著優(yōu)步吃送餐服務(wù)(Uber Eats),它就是沖浪機(jī)器人(Surf Robot)。我喜歡那些家伙。敏捷性,波士頓動力,令人難以置信。

你有手術(shù)機(jī)器人,你有來自法國的機(jī)械臂機(jī)器人。你有通用機(jī)器人公司的機(jī)器人,數(shù)量驚人的不同類型的機(jī)器人。

所以這是下一章。

我們將會在未來更多地談?wù)摍C(jī)器人技術(shù),但它不僅僅是關(guān)于機(jī)器人——我知道一切都與你們有關(guān)——它是關(guān)于實現(xiàn)目標(biāo),以及世界上最重要、將被物理人工智能和人工智能物理學(xué)徹底變革的行業(yè)之一,就是英偉達(dá)(Nvidia)啟動我們所有人的那個行業(yè)。如果沒有我接下來要談到的這些公司,這一切將是不可能的,我非常高興所有這些公司,從楷登電子(Cadence)開始,都將加速一切。楷登電子(Cadence)的 CUDA X 已經(jīng)集成到他們所有的仿真和求解器中。他們將使用英偉達(dá)的物理人工智能來進(jìn)行不同的物理工廠和工廠模擬。

你將看到人工智能物理學(xué)被集成到這些系統(tǒng)中。因此,無論是 EDA 還是 STA,以及未來在機(jī)器人系統(tǒng)中,我們將擁有基本上使你們成為可能的相同技術(shù)?,F(xiàn)在徹底革新這些設(shè)計堆棧,新思(Synopsys)。沒有新思,新思和楷登電子是完全。在芯片設(shè)計的世界中是完全不可或缺的。新思科技(Synopsis)在邏輯設(shè)計和知識產(chǎn)權(quán)(IP)方面處于領(lǐng)先地位。在楷登電子(Cadence)方面,他們在物理設(shè)計、布局布線、仿真和驗證方面處于領(lǐng)先地位。

楷登電子在仿真和驗證方面非常出色。他們兩者都在向系統(tǒng)設(shè)計和系統(tǒng)仿真領(lǐng)域邁進(jìn)。因此,在未來,我們將在新思科技內(nèi)部設(shè)計您的芯片,我們將在這些工具內(nèi)部設(shè)計您的系統(tǒng),并對所有內(nèi)容進(jìn)行仿真和模擬。這就是您的未來。您將誕生于這些平臺之中。非常了不起,因此,我們非常高興能與這些行業(yè)合作。

正如我們將英偉達(dá)(NVIDIA)集成到 Palantir 和 Service Now 中一樣,我們將英偉達(dá)集成到計算最密集的仿真行業(yè)——新思科技和楷登電子中。今天我們宣布,西門子(Siemens)也在做同樣的事情。我們將把 KutaX、物理人工智能、代理人工智能、Nemo、Nemotron 深度集成到西門子的世界中。這樣做的原因是……首先,我們將設(shè)計芯片,未來所有這些都將由英偉達(dá)加速。您對此會非常滿意。我們將擁有自主式芯片設(shè)計師和系統(tǒng)設(shè)計師與我們一起工作,幫助我們,幫助我們進(jìn)行設(shè)計,正如我們今天擁有自主式軟件工程師來幫助我們的軟件工程師編寫代碼一樣。

因此,我們將擁有自主式芯片設(shè)計師和系統(tǒng)設(shè)計師。我們將在其中創(chuàng)造你。但然后我們必須制造你。我們必須建造制造你的工廠、生產(chǎn)設(shè)施。我們必須設(shè)計制造生產(chǎn)線來組裝你們所有人。而這些制造工廠本質(zhì)上將是巨大的機(jī)器人。

難以置信,我知道,我知道。

所以你將在計算機(jī)中被設(shè)計。你將在計算機(jī)中被制造出來。你將在計算機(jī)中接受測試和評估。在您必須花費任何時間應(yīng)對重力之前很久,很久以前。我知道。你知道如何應(yīng)對重力嗎?你會跳嗎?

你會跳嗎?你會跳嗎?行了,別炫耀了。

那么現(xiàn)在這個行業(yè),成就英偉達(dá)成為可能的這個行業(yè),我非常高興的是,我們現(xiàn)在創(chuàng)造的技術(shù)的復(fù)雜性和能力已經(jīng)達(dá)到了一個新的水平,我們現(xiàn)在可以幫助他們徹底變革他們的行業(yè)。所以,從他們開始的地方,我們現(xiàn)在有機(jī)會回去幫助他們徹底變革他們的行業(yè)。讓我們來看看我們將與西門子一起做的事情。來吧。

物理人工智能的突破正使人工智能從屏幕走向我們的物理世界。而且恰逢其時,在全球各地建設(shè)各種芯片、計算機(jī)、救命藥物和人工智能工廠之際。隨著全球勞動力短缺日益加劇,我們比以往任何時候都更需要由物理人工智能和機(jī)器人技術(shù)驅(qū)動的自動化。人工智能與全球最大工業(yè)的交匯之處,正是英偉達(dá)和西門子合作的基礎(chǔ)。近兩個世紀(jì)以來,西門子一直在建設(shè)全球的工業(yè)?,F(xiàn)在,它正在為人工智能時代對其進(jìn)行重塑。西門子已實現(xiàn)集成。

將英偉達(dá)-KudaX 庫、人工智能模型和 Omniverse 集成到其電子設(shè)計自動化(EDA)、計算機(jī)輔助工程(CAE)和計算機(jī)輔助工程(C-A-E)以及數(shù)字孿生工具和平臺組合中。我們共同將物理人工智能帶入完整的工業(yè)生命周期。

從設(shè)計和仿真,到生產(chǎn)和運營,再到生產(chǎn)和運營。

我們正處于一場新的工業(yè)革命的開端,即由英偉達(dá)和西門子為下一代工業(yè)構(gòu)建的物理人工智能時代。難以置信,對吧,各位?你們怎么看?我會抓緊了,就抓緊了。所以,如果你看看全球的模型,毫無疑問。毫無疑問。開放人工智能是當(dāng)今領(lǐng)先的令牌生成器。生成的開放人工智能令牌比任何其他事物都要多。第二大群體,第二大可能是開源模型。我的猜測是,隨著時間的推移,由于有如此多的公司、如此多的研究人員、如此多的不同類型的領(lǐng)域和模式,開源模型將占據(jù)絕對的主導(dǎo)地位。

下一代計算架構(gòu): Vera Rubin

我們來談?wù)勔晃环浅L貏e的人物。你們想這么做嗎?

我們來談?wù)刅era Rubin。

她是一位美國天文學(xué)家。她是第一位觀測到。她注意到星系的尾部移動速度與星系的中心差不多快。我知道。這說不通。這說不通。

牛頓物理學(xué)會說,就像太陽系一樣,離太陽更遠(yuǎn)的行星繞太陽公轉(zhuǎn)的速度比離太陽更近的行星慢。

因此,除非存在我們稱之為暗體、暗物質(zhì)的看不見的物質(zhì)占據(jù)空間,否則這種情況就沒有意義,盡管我們看不到它。

所以,我們以Vera Rubin的名字命名了我們的下一臺計算機(jī)。這不是個好主意嗎?

我知道。

Vera Rubin的設(shè)計旨在應(yīng)對我們面臨的這一根本性挑戰(zhàn)。人工智能所需的計算量正在急劇增加。對英偉達(dá)圖形處理器(GPU)的需求正在急劇增加。需求激增是因為模型每年都在以10倍,一個數(shù)量級的速度增長。更不用說,正如我提到的,O1的推出是人工智能的一個轉(zhuǎn)折點。推理不再是一次性的答案,而是一個思考過程。

為了教會人工智能如何思考,在后訓(xùn)練中引入了強(qiáng)化學(xué)習(xí)和非??捎^的計算量。

這不再是監(jiān)督微調(diào),或者稱為模仿學(xué)習(xí)或監(jiān)督訓(xùn)練。你現(xiàn)在有了強(qiáng)化學(xué)習(xí),本質(zhì)上是計算機(jī)嘗試不同的迭代,它在學(xué)習(xí)如何執(zhí)行任務(wù)。結(jié)果是,預(yù)訓(xùn)練、后訓(xùn)練和測試時間擴(kuò)展所需的計算量爆炸式增長?,F(xiàn)在我們進(jìn)行的每一次推理,不再是一次性的,你可以看到人工智能思考的令牌數(shù)量,我們很欣賞這一點,它思考得越久,往往會產(chǎn)生更好的答案。因此,測試時間擴(kuò)展導(dǎo)致每年生成的令牌數(shù)量增加5倍。更不用說。

與此同時,人工智能競賽正在進(jìn)行中。每個人都在努力達(dá)到下一個水平。每個人都在努力達(dá)到下一個前沿領(lǐng)域。每當(dāng)他們到達(dá)下一個前沿領(lǐng)域,上一代人工智能的代幣成本就開始下降。每年大約下降10倍。每年下降10倍實際上告訴你一些不同的信息。這說明競爭非常激烈。每個人都在努力達(dá)到下一個水平,并且有人正在達(dá)到下一個水平。

因此,所有這一切都是一個計算問題。你計算得越快,就能越早到達(dá)下一個前沿領(lǐng)域的下一層。

所有這些事情都在同時發(fā)生。所以,我們決定我們必須每年都推進(jìn)計算的最先進(jìn)水平,不能落后一年?,F(xiàn)在,我們在一年前半就開始交付GB-200了?,F(xiàn)在,我們正處于全面制造階段。Vera Rubin的。如果Vera Rubin能在今年內(nèi)完成,那么它現(xiàn)在必須已經(jīng)投產(chǎn)了。因此,今天我可以告訴大家,Vera Rubin已全面投產(chǎn)。你們想看看Vera Rubin嗎?請進(jìn)。請播放。

恰好趕上人工智能的下一個前沿領(lǐng)域。這是我們?nèi)绾螛?gòu)建它的故事。

這種架構(gòu)是一個由六個芯片組成的系統(tǒng),經(jīng)過精心設(shè)計以協(xié)同工作,誕生于極端的代碼設(shè)計。它始于維拉(Vera),這是一種定制設(shè)計的中央處理器(CPU),性能是上一代的兩倍,以及Rubin圖形處理器(GPU)。Vera Rubin從一開始就經(jīng)過協(xié)同設(shè)計,以更快、更低延遲地實現(xiàn)雙向和一致的數(shù)據(jù)共享。然后,17000個組件聚集在Vera Rubin計算板上。高速機(jī)器人以微米級的精度放置組件,然后由兩顆 Rubin GPU 完成組裝,構(gòu)成 Vera CPU。它能夠提供 100 拍?。≒etaflops)的 AI 算力,是其前代的五倍。人工智能需要數(shù)據(jù)。快。ConnectX9 為每顆 GPU 提供每秒 1.6 太比特(terabits per second)的橫向擴(kuò)展(scale-out)帶寬。Bluefield 4DPU 卸載了存儲和安全任務(wù),使計算能夠完全專注于人工智能。Vera Rubin 計算托盤進(jìn)行了徹底重新設(shè)計,取消了電纜、軟管或風(fēng)扇,配備了 Bluefield 4 DPU、8 個 ConnectX9、2 個 Vera CPU 和 4 個 Rubin GPU。Vera Rubin 人工智能超級計算機(jī)的計算構(gòu)建模塊。

接下來是第六代 MV 鏈路交換機(jī)。傳輸?shù)臄?shù)據(jù)量超過全球互聯(lián)網(wǎng),連接 18 個計算節(jié)點,可擴(kuò)展多達(dá) 72 顆 Rubbin GPU,作為一個整體運行。然后是 Spectrum X 以太網(wǎng)光模塊(Photonics)。這是世界上首款擁有 512 條通道和 200 千兆位(gigabit)兼容共封裝光模塊的以太網(wǎng)交換機(jī),可橫向擴(kuò)展數(shù)千個機(jī)架,構(gòu)建成一個人工智能工廠。自設(shè)計啟動以來歷經(jīng) 15,000 工程師年,首臺 Vera Rubin MVL 72 機(jī)架上線。六款突破性芯片,18個計算托架,9個MV-link交換模塊,220萬億晶體管,重近兩噸。邁向人工智能下一前沿的巨大飛躍。Rubin在這里。

極端協(xié)同設(shè)計與性能參數(shù)解析

你們覺得怎么樣?

這是一個Rubin計算單元,包含1152個圖形處理器(GPU)。在16個機(jī)架中。正如你們所知,每個機(jī)架包含一個72核的Vera Rubin 或72個Rubin單元。每個Rubin單元是兩個實際連接在一起的圖形處理器芯片。

我將向你們展示

但有些事情,我稍后會告訴你們。我不能馬上告訴你們所有事情。

我們設(shè)計了六種不同的芯片。首先,我們公司內(nèi)部有一條規(guī)定,而且是一條很好的規(guī)定。新一代產(chǎn)品中,芯片的更改數(shù)量不應(yīng)超過一到兩個。但問題在于此。正如您所看到的,我們描述了每個芯片中晶體管的總數(shù),而我們知道摩爾定律在很大程度上已經(jīng)放緩了。因此,我們逐年能夠獲得的晶體管數(shù)量不可能跟上。跟上大 10 倍的模型。跟不上每年生成多五倍的詞元(tokens)。

跟不上詞元成本下降會如此激進(jìn)的事實。

除非我們部署激進(jìn)、極端的代碼設(shè)計,基本上同時在所有芯片、在整個技術(shù)棧中進(jìn)行創(chuàng)新,否則整個行業(yè)不可能以這種速度繼續(xù)發(fā)展,這也是我們決定在這一代產(chǎn)品中別無選擇,必須重新設(shè)計每一塊芯片的原因?,F(xiàn)在,我們剛才描述的每一塊芯片本身就可以成為一場新聞發(fā)布會。在過去,可能有一整家公司專門致力于做這件事。它們每一個都是徹底的革命性的,并且是同類產(chǎn)品中的佼佼者。Vera 中央處理器,我為它感到非常自豪。在一個功耗受限的世界里,在一個受限的世界里。Gray 的中央處理器在功耗受限的世界中實現(xiàn)了兩倍的性能。它的每瓦性能是世界上最先進(jìn)的中央處理器的兩倍。它驚人的數(shù)據(jù)速率令人難以置信。它的設(shè)計初衷是用于處理超級計算機(jī)。

Vera 曾是一款出色的全球定位系統(tǒng)(GPS),Grace 曾是一款出色的圖形處理器(GPU)?,F(xiàn)在,Vera 大幅提升了單線程性能,提升了內(nèi)存容量,提升了所有一切。

這是一個巨大的芯片。

這就是 Vera 中央處理器。這是一個中央處理器。這與Rubin GPU相連??纯茨莻€東西。

它是一個巨大的芯片?,F(xiàn)在真正特別的是,我會瀏覽這些,我想需要三只手,四只手才能做到這一點。這是Vera CPU。它有88個CPU核心。并且CPU核心被設(shè)計成多線程的。但是Vera的多線程特性被設(shè)計成使得176個線程中的每一個都能獲得其全部性能。所以這基本上就像有176個核心,但只有88個物理核心。所以這些核心是使用一種稱為空間多線程的技術(shù)設(shè)計的。但是I/O。性能令人難以置信。這是Rubin GPU。它的浮點性能是Blackwell的5倍。但重要的是看最終結(jié)果。最終結(jié)果是,它的晶體管數(shù)量僅是Blackwell的1.6倍。這在一定程度上說明了當(dāng)今半導(dǎo)體物理學(xué)的水平。

如果我們不對整個系統(tǒng)中的基本上每一塊芯片進(jìn)行代碼設(shè)計,進(jìn)行極端的代碼設(shè)計,那么我們?nèi)绾尾拍苊磕杲桓缎阅芴嵘疃嘀挥?.6倍的水平呢?因為那是你擁有的晶體管總數(shù)。即使你每個晶體管的性能提升一點點,比如25%,你也不可能從你獲得的晶體管數(shù)量中實現(xiàn)100%的良率。因此,1.6倍的提升給每年的性能提升設(shè)定了一個上限,除非你采取一些極端的措施。我們稱之為極端代碼設(shè)計。

我們所做的一件事,這是一項偉大的發(fā)明,叫做NVFP4張量核心(tensor core)。我們芯片內(nèi)部的Transformer引擎不僅僅是簡單地將我們放入數(shù)據(jù)路徑中的4英尺、浮點數(shù)。它是一個完整的處理器,一個處理單元,它知道如何動態(tài)地、自適應(yīng)地調(diào)整其精度和結(jié)構(gòu),以處理轉(zhuǎn)換器(transformer)的不同層次,這樣你就可以在任何可以損失精度的地方實現(xiàn)更高的吞吐量,并在任何需要的地方恢復(fù)到盡可能高的精度。這種動態(tài)執(zhí)行該操作的能力。你無法在軟件中做到這一點,因為顯然它的運行速度太快了。因此,你必須能夠在處理器內(nèi)部自適應(yīng)地完成它。這就是NV-FP4。當(dāng)有人提到FP4或FP8時,對我們來說幾乎沒有任何意義。這樣做的原因在于張量核心結(jié)構(gòu)以及使之起作用的所有算法。MVP4,我們已經(jīng)就此發(fā)表了論文。它所能保持的吞吐量和精度的水平是完全不可思議的。這是開創(chuàng)性的工作。我不會對業(yè)界希望我們將這種格式和結(jié)構(gòu)在未來變成行業(yè)標(biāo)準(zhǔn)感到驚訝。這完全是革命性的。這就是為什么盡管我們的晶體管數(shù)量只增加了1.6倍,我們?nèi)匀荒軌驅(qū)崿F(xiàn)如此巨大的性能飛躍。

硬件工程與冷卻技術(shù)的革新

那么這就是,現(xiàn)在,一旦你擁有了一個出色的處理節(jié)點,這就是處理器節(jié)點,在里面,所以這,舉個例子,讓我這樣做,這是非常非常沉重的,你必須是一個身體狀況非常好的首席執(zhí)行官才能做這份工作,所以這個東西是,我猜這可能,我猜這可能,我不知道,幾百磅,我覺得這很有趣。來吧。

本可以的。每個人都在往下走。我不這么認(rèn)為。好吧。所以,所以看看這個。這是最后一個。我們徹底改造了整個MGX機(jī)箱。這個節(jié)點,43根線纜,零線纜。六根管子,這里只有兩根,組裝這個需要兩個小時。如果你運氣好,需要兩個小時,需要兩個小時。你很可能會組裝錯。你將不得不重新測試、測試、測試,然后重新組裝。所以裝配過程極其復(fù)雜。考慮到這是我們第一批以這種方式解構(gòu)的超級計算機(jī)之一,這是可以理解的。這個,從兩個小時,縮短到五分鐘。

80%液冷,100%液冷。

真是,真是個突破。這是新的計算機(jī)箱。連接所有這些設(shè)備到機(jī)架頂部交換機(jī)(即東西向流量)的是名為 Spectrum X-NIC 的設(shè)備。這是全球最好的網(wǎng)卡。毫無疑問,英偉達(dá)對很久以前加入我們的 Mellanox 的收購,他們的用于高性能計算的網(wǎng)絡(luò)技術(shù)是全球最無可匹敵。算法、芯片設(shè)計、所有的互連,以及在其上運行的所有軟件堆棧,都具有直接內(nèi)存訪問(DMA)功能,絕對,絕對是首屈一指的,全球最好的?,F(xiàn)在它具備了可編程遠(yuǎn)程直接內(nèi)存訪問(RDMA)和數(shù)據(jù)路徑加速器的能力,這樣像 AI 實驗室這樣的合作伙伴就可以創(chuàng)建自己的算法來控制數(shù)據(jù)在系統(tǒng)內(nèi)的移動方式。但這是完全世界級的 ConnectX。ConnectX9 和 Vero CPU 是共同設(shè)計的,我們從未透露過,直到 CX9 出現(xiàn)才發(fā)布,因為我們是為一種新型處理器共同設(shè)計它的。

ConnectX9,或者 CX8 和 Spectrum X,徹底改變了以太網(wǎng)在人工智能領(lǐng)域的應(yīng)用方式。

人工智能的以太網(wǎng)流量要大得多,需要更低的延遲。瞬間的流量激增與以太網(wǎng)所見過的任何情況都不同。

因此,我們創(chuàng)建了 Spectrum X,它就是人工智能以太網(wǎng)。兩年前,我們發(fā)布了 Spectrum X。

英偉達(dá)如今是世界上規(guī)模最大的網(wǎng)絡(luò)公司。因此,它非常成功,并在許多不同的部署中得到了應(yīng)用。它正在席卷人工智能領(lǐng)域。

性能令人難以置信,尤其是在您擁有一個 200 兆瓦的數(shù)據(jù)中心,或者一個千兆瓦的數(shù)據(jù)中心時,這些都是價值數(shù)十億美元的。

我們假設(shè)一個千兆瓦的數(shù)據(jù)中心價值 500 億美元。如果網(wǎng)絡(luò)性能允許您在使用 SpectrumX 的情況下額外提升 10%,那么實現(xiàn) 25% 的更高吞吐量并不少見。如果我們僅僅提升 10%,那也價值 50 億美元。網(wǎng)絡(luò)方面的投入幾乎是免費的,這就是為什么,所有人都使用 Spectrum X。這真是一件不可思議的事情?,F(xiàn)在我們將發(fā)明一種新的類型,一種新的數(shù)據(jù)處理類型。因此,SpectromX 適用于東西向流量。我們現(xiàn)在有了一個名為 Bluefield 4 的新處理器。

Bluefield 4 允許我們接管一個大型的、非常大的數(shù)據(jù)中心,將其不同部分隔離,以便不同的用戶可以使用其不同的部分。

確保如果他們決定虛擬化,所有內(nèi)容都可以被虛擬化。這樣您就可以卸載大量用于南北向流量的虛擬化軟件、安全軟件和網(wǎng)絡(luò)軟件。因此,每個計算節(jié)點都標(biāo)配 Bluefield 4。Bluefield 4 還有第二個應(yīng)用,我馬上會講到。這是一個革命性的處理器,我對此感到非常興奮。這是 NVLink 6-6 開關(guān)。

就在這里。

這個開關(guān),這個交換芯片,在MVLink交換機(jī)內(nèi)部有四個。這些交換芯片中的每一個都擁有歷史上最快的30秒(性能)。全世界的速率才勉強(qiáng)達(dá)到200吉字節(jié)。這是一個400吉比特每秒的交換機(jī)。之所以這非常重要,是因為它能讓我們所有的圖形處理器(GPU)都能在完全相同的時間與所有其他圖形處理器進(jìn)行通信。這個機(jī)架背板上的交換機(jī)使我們能夠以兩倍的速度傳輸相當(dāng)于全球互聯(lián)網(wǎng)數(shù)據(jù)兩倍的總量,即全球所有互聯(lián)網(wǎng)數(shù)據(jù)總量的兩倍。你獲取整個地球互聯(lián)網(wǎng)的橫截面帶寬。大約是每秒100太字節(jié)。這是每秒240太字節(jié)。所以這在一定程度上讓人有所認(rèn)識。這樣做的目的是讓每一個圖形處理器都能與每一個其他的圖形處理器在完全相同的時間內(nèi)協(xié)同工作。

可以嗎?然后在此之上,在此之上,所以這是一個機(jī)架。

這是一個機(jī)架。

正如你們所見,這些機(jī)架中的每一個,這個機(jī)架中的晶體管數(shù)量是1.7倍。

你能幫我做這個嗎?

所以這通常是大約兩噸。

但今天它是兩噸半,因為他們運輸?shù)臅r候忘記把里面的水排掉了。

所以我們從加利福尼亞運送了很多水。你能聽到它在吱吱叫嗎?當(dāng)你轉(zhuǎn)動兩噸半的物體時,它會有點吱吱叫。

你可以做到的。我們不會讓你做兩次。好的。那么,那么,在這些后面是MV-鏈路(MV-link)主干線?;旧鲜莾捎⒗锏你~纜。銅是我們所知道的最好的導(dǎo)體。而且這些都是屏蔽的銅纜,結(jié)構(gòu)化的銅纜。這是有史以來在計算系統(tǒng)中用過的最多的。我們的冗余單元以每秒400吉比特的速度驅(qū)動銅纜,從機(jī)架頂部一直到機(jī)架底部。這太不可思議了。所以這總共有兩英里的銅纜,5,000根銅纜。

這使得中壓(MV)鏈路骨干成為可能。這是真正開啟下一代交換機(jī)(NGX)系統(tǒng)的革命。

現(xiàn)在,我們決定創(chuàng)建一個行業(yè)標(biāo)準(zhǔn)系統(tǒng),以便整個生態(tài)系統(tǒng)、我們所有的供應(yīng)鏈都能在這些組件上實現(xiàn)標(biāo)準(zhǔn)化。

構(gòu)成這些MGX系統(tǒng)的組件總共有大約80,000種。如果每年都更換它,那將是徹底的浪費。從富士康、廣達(dá)、緯創(chuàng),名單還在繼續(xù),到惠普、戴爾和聯(lián)想,所有主要的計算機(jī)公司。每個人都知道如何構(gòu)建這些系統(tǒng)。所以,盡管性能要高得多,但我們能夠?qū)ubin 集成到其中,而且非常重要的是,功耗也高了一倍。Vera Rubin的功耗是格蕾絲·布萊克威爾(Grace Blackwell)的兩倍。然而,這也是一個奇跡,它所需要的風(fēng)量,即空氣流動,大致相同。

而且非常重要的一點是,進(jìn)入其中的水的溫度也是一樣的,45攝氏度。使用45攝氏度的水,數(shù)據(jù)中心就不需要水冷機(jī)了。

我們基本上是用熱水來冷卻這臺超級計算機(jī),這效率高得驚人。所以這就是新的機(jī)架。晶體管數(shù)量是1.7倍,但峰值推理性能提高了五倍,峰值訓(xùn)練性能提高了三倍半。

可以嗎?它們在頂部通過Spectrum X連接。

這是世界上第一個使用臺積電(TSM)新工藝制造的芯片,我們共同創(chuàng)新的工藝稱為COOP。這是一種硅光子學(xué)、集成的硅光子學(xué)工藝技術(shù)。

這使我們能夠直接將硅光子技術(shù)應(yīng)用于芯片。這是512個端口,速率為200千兆比特每秒。這就是新的以太網(wǎng)人工智能交換機(jī),Spectrum X以太網(wǎng)交換機(jī)。再看這個巨大的芯片。但真正令人驚奇的是,它直接連接了硅光子技術(shù)。激光器進(jìn)來。激光器從這里進(jìn)來。激光器從這里進(jìn)來。光學(xué)元件在這里,它們連接到數(shù)據(jù)中心的其余部分。我馬上會向您展示這個,但它在機(jī)架的頂部。這是新的。

Spectrum X,硅光子交換機(jī)。

語義存儲與 KV 緩存上下文內(nèi)存

好的?我們還有一些新的東西想告訴您。

正如我之前提到,幾年前我們推出了 Spectrum X,以便我們能夠重塑網(wǎng)絡(luò)構(gòu)建的方式。

以太網(wǎng)非常易于管理,每個人都有以太網(wǎng)協(xié)議棧,世界上每個數(shù)據(jù)中心都知道如何處理以太網(wǎng)。我們當(dāng)時唯一使用的技術(shù)是英飛凌(Infiniband),它用于超級計算機(jī)。

英飛凌的延遲非常低,但當(dāng)然,英飛凌的軟件協(xié)議棧,其整個可管理性對于使用以太網(wǎng)的人來說非常陌生。因此,我們決定首次進(jìn)入以太網(wǎng)交換機(jī)市場。Spectrum X 一經(jīng)推出便迅速獲得成功,正如我所說,它使我們成為世界上最大的網(wǎng)絡(luò)公司。下一代 SpectrumX 將延續(xù)這一傳統(tǒng)。但正如我早些時候所說,人工智能已經(jīng)重塑了整個計算堆棧,計算堆棧的每一層。可以合理地推斷,當(dāng)人工智能開始在世界各地的企業(yè)中部署時,它也將重塑存儲的構(gòu)建方式。人工智能不使用 SQL。人工智能使用語義信息。當(dāng)使用人工智能時,它會創(chuàng)建這種臨時知識、臨時內(nèi)存,稱為 KV 緩存,即鍵值組合,但它是一個 KV 緩存。

基本上,就是那個緩存。人工智能,也就是人工智能的工作記憶。而人工智能的工作記憶存儲在HBM內(nèi)存中。對于每一個單獨的詞元(token),GPU都會讀取模型中的整個模型。它讀取整個工作記憶,然后產(chǎn)生一個詞元。然后它將這個詞元存回KV緩存中。然后下一次它執(zhí)行這個操作時,它會讀取整個,它會讀取整個內(nèi)存,讀取它,然后將其串流通過我們的GPU,再生成另一個詞元。它會反復(fù)地這樣做,一個接一個地產(chǎn)生詞元,顯然,如果你與該人工智能進(jìn)行長時間的對話,隨著時間的推移,這個記憶,這個上下文記憶,將會急劇增長。更不用說模型本身在增長,我們使用的輪次數(shù)量也在增加。人工智能正在增加。我們希望這個人工智能陪伴我們一生,并記住我們與它有過的每一次對話,我讓它進(jìn)行的每一次研究。當(dāng)然,將要共享這臺超級計算機(jī)的人數(shù)還會持續(xù)增加。因此,這個最初能夠容納在HBM(高帶寬內(nèi)存)中的上下文內(nèi)存,已經(jīng)不再足夠大了。

去年,我們創(chuàng)造了Grace Blackwell中非??斓膬?nèi)存,我們稱之為快速上下文內(nèi)存。

這就是我們將Grace直接連接到Hopper的原因,這就是我們將Grace直接連接到Blackwell的原因,以便我們能夠擴(kuò)展上下文內(nèi)存。但即使那樣也不夠。所以下一個解決方案,當(dāng)然是連接到網(wǎng)絡(luò),即南北網(wǎng)絡(luò),連接到公司的存儲。但是,如果您同時運行大量人工智能,該網(wǎng)絡(luò)的運行速度將不再足夠快。所以答案非常明確,那就是采取不同的做法。因此,我們創(chuàng)建了Bluefield 4,以便我們可以在機(jī)架中直接擁有一個非??焖俚腒V緩存上下文內(nèi)存存儲。

所以我在一秒鐘后就會向您展示,但存在一個全新的存儲系統(tǒng)類別。

業(yè)界對此感到非常興奮,因為這對于當(dāng)今進(jìn)行大量 Token 生成的幾乎所有人來說都是一個痛點,人工智能實驗室、云服務(wù)提供商都深受由 KV 緩存(KV Cache)移動所產(chǎn)生的網(wǎng)絡(luò)流量的影響。

因此,我們設(shè)想創(chuàng)建一個新的平臺、一個新的處理器,來運行整個 Dynamo KV 緩存上下文內(nèi)存管理系統(tǒng),并將其非??拷鼨C(jī)架的其他部分,這完全是革命性的。

所以,這都是計算節(jié)點。它們每一個都是 NVLink 72。

所以這是 Vera Rubin,MVLink 72,144 個 Rubin GPU。這就是存儲在這里的上下文內(nèi)存。

在它們每一個的后面都是四個藍(lán)色區(qū)域。每個藍(lán)色區(qū)域后面是 150 GB,150 TB 的內(nèi)存,即上下文內(nèi)存。對于每個 GPU,一旦你進(jìn)行分配,每個 GPU 將獲得額外的 16 TB。現(xiàn)在在這個節(jié)點內(nèi)部,每個GPU基本上都有一個太字節(jié)的容量?,F(xiàn)在,有了這個回程,你直接在同一東西向流量上以完全相同的數(shù)據(jù)速率,每秒200吉字節(jié)進(jìn)行存儲。在整個計算節(jié)點的結(jié)構(gòu)中,你將獲得額外的16太字節(jié)的內(nèi)存,好的?這是管理平面。這些是Spectrum X交換機(jī),它們將所有設(shè)備連接在一起。而在另一邊,末端的這些交換機(jī)將它們連接到數(shù)據(jù)中心的其余部分。好的?所以這就是Vera Rubin。

現(xiàn)在,關(guān)于它,有幾件事真的非常了不起。因此,我提到的第一件事是,整個系統(tǒng)的能源效率提高了兩倍,從某種意義上說,其溫度性能也提高了兩倍,因為盡管功耗是兩倍高,使用的能量是兩倍高,計算量比那高出很多倍,但進(jìn)入的冷卻液仍然是45攝氏度。這使我們能夠節(jié)省全球約6%的數(shù)據(jù)中心電力。所以這是一件非常重大的事情。

第二個非常重大的進(jìn)展是,整個系統(tǒng)現(xiàn)在是機(jī)密計算安全的,這意味著所有數(shù)據(jù)在傳輸中、靜止時以及計算過程中都經(jīng)過了加密。并且每一條總線現(xiàn)在都經(jīng)過了加密。每一個PCI Express、每一個NV Link、每一個,CPU和GPU之間的NV Link、GPU之間的連接?,F(xiàn)在一切都經(jīng)過了加密。因此,它是機(jī)密計算安全的。這使得公司感到安全,因為即使他們的模型是由其他人部署的,也絕不會被任何其他人看到。好嗎?因此,這個特定的系統(tǒng)不僅能源效率極高,而且還有另一件令人難以置信的事情。由于人工智能工作負(fù)載的性質(zhì),它會隨著一個稱為“全約簡”(all reduce)的計算層而瞬間出現(xiàn)峰值。電流的量、使用的能量,但同時是真正地超出了常態(tài)的。通常情況下,它們會激增25%。我們現(xiàn)在已經(jīng)在整個系統(tǒng)上實現(xiàn)了電源平滑處理,這樣您就不必過度配置25倍,或者如果您過度配置了25倍,您也不必浪費或閑置25%的能源。所以現(xiàn)在你可以填滿整個功耗預(yù)算,而無需過度,無需繼續(xù),無需超出該范圍進(jìn)行配置。

訓(xùn)練效率、成本對比與結(jié)語

然后最后一件事,當(dāng)然是性能。所以我們來看看性能。這一點。這些圖表是只有構(gòu)建人工智能超級計算機(jī)的人才會喜歡的。這需要我們對每一塊芯片、對所有系統(tǒng)的完全重新設(shè)計,以及重寫整個技術(shù)棧,才得以實現(xiàn)?;旧?,這一列是訓(xùn)練人工智能模型。你訓(xùn)練人工智能模型越快,你就能越快地將下一個前沿技術(shù)推向世界。這是你的上市時間。這就是技術(shù)領(lǐng)導(dǎo)力。這是您的定價。能力。

因此,在綠色的情況下,這本質(zhì)上是一個擁有10萬億參數(shù)的模型。

我們從DeepSeek(深度探索)將其規(guī)模擴(kuò)大,DeepSeek,這就是我們稱之為DeepSeek++的原因,訓(xùn)練了一個擁有10萬億參數(shù)的模型,使用了十萬萬億個詞元。好的。這是我們對構(gòu)建下一個前沿模型所需投入的模擬預(yù)測。下一個前沿模型,埃隆已經(jīng)提到過,GROC(格羅克)的下一個版本,我認(rèn)為是GROC 5,是每錘7萬億參數(shù)。所以這是10。綠色代表Blackwell。而在Rubin的情況下,請注意,吞吐量要高得多,因此,在給定的一組系統(tǒng)(此處為訓(xùn)練所需系統(tǒng)數(shù)量)中,只需要四分之一的系統(tǒng)就能在一個月內(nèi)訓(xùn)練完模型。

好的嗎?因此,時間對每個人來說都是一樣的。

現(xiàn)在,您能多快訓(xùn)練該模型以及您能訓(xùn)練多大的模型,將決定您何時能率先達(dá)到前沿水平。第二部分是你的工廠吞吐量。Blackwell 又變綠了。工廠吞吐量之所以重要,是因為在千兆瓦的情況下,你的工廠價值500億美元。

一個價值500億美元的數(shù)據(jù)中心只能消耗一千兆瓦的電力。因此,如果你的每瓦性能、每瓦吞吐量非常好,與相當(dāng)差的相比,這直接轉(zhuǎn)化為你的收入。

你數(shù)據(jù)中心的收入與第二列直接相關(guān)。在 Blackwell 的情況下,它比 Hopper 高出約10倍。在 Rubin 的情況下,它將再次提高約10倍。好的。在代幣成本方面,生成代幣的成本效益如何,Rubin 約為十分之一,正如……是的。

這就是我們將如何把所有人帶到下一個前沿,將人工智能推向新水平的方式。

當(dāng)然,還要以高能效和高成本效益來建設(shè)這些數(shù)據(jù)中心。這就是全部了。這就是今天的英偉達(dá)。

你們知道,我們提到我們制造芯片,但正如你們所知,英偉達(dá)現(xiàn)在制造的是整個系統(tǒng)。

人工智能是一個完整的技術(shù)棧。我們正在對從芯片到基礎(chǔ)設(shè)施、再到模型和應(yīng)用的方方面面進(jìn)行人工智能的重塑。我們的工作是構(gòu)建完整的技術(shù)棧,以便在座的各位可以為全世界創(chuàng)造出令人難以置信的應(yīng)用。感謝大家的到來。祝大家有一個愉快的國際消費電子展(CES)。現(xiàn)在,在我讓大家離開之前,我們有很多幻燈片沒有用上。所以我們這里放了一些花絮片段。我想這對你們來說會很有趣。祝大家CES(國際消費電子展)愉快。收工。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
我是天津人,全家一起來了趟上海,確實有點想不明白這四件事

我是天津人,全家一起來了趟上海,確實有點想不明白這四件事

王姐懶人家常菜
2026-04-20 03:27:17
浙江一男子收到陌生賬號轉(zhuǎn)賬8萬余元,三天后奢侈品牌CELINE商家找來:員工誤將其收款碼給客戶

浙江一男子收到陌生賬號轉(zhuǎn)賬8萬余元,三天后奢侈品牌CELINE商家找來:員工誤將其收款碼給客戶

臺州交通廣播
2026-04-20 14:13:51
不插電、沒綠牌!被拋棄的HEV,2026即將席卷全球?

不插電、沒綠牌!被拋棄的HEV,2026即將席卷全球?

新浪財經(jīng)
2026-04-21 04:53:23
美伊談判破裂,加拿大總理表態(tài)拒付資金,歐洲多國跟進(jìn)取消訂單

美伊談判破裂,加拿大總理表態(tài)拒付資金,歐洲多國跟進(jìn)取消訂單

一盅情懷
2026-04-19 19:34:55
黃楊鈿甜——出來混,是要還的

黃楊鈿甜——出來混,是要還的

云石
2026-04-19 21:45:28
驚險!工作途中飛身一抱,民警在高架上救下輕生男子

驚險!工作途中飛身一抱,民警在高架上救下輕生男子

上觀新聞
2026-04-20 16:59:07
用戶買20TB+硬盤還在質(zhì)保期壞了 東芝拒免費換新:我們愿原價退款

用戶買20TB+硬盤還在質(zhì)保期壞了 東芝拒免費換新:我們愿原價退款

快科技
2026-04-20 11:23:09
守好錢袋子!2026年5月開始,存款30萬以上的家庭要注意了

守好錢袋子!2026年5月開始,存款30萬以上的家庭要注意了

墜入二次元的海洋
2026-04-11 13:19:45
8歲男孩與家人爬山發(fā)現(xiàn)大片問荊草和含云母的石塊,推測這座山下可能有黃金!孩子爸爸:已上報相關(guān)部門

8歲男孩與家人爬山發(fā)現(xiàn)大片問荊草和含云母的石塊,推測這座山下可能有黃金!孩子爸爸:已上報相關(guān)部門

極目新聞
2026-04-21 00:48:26
下一個庫尼亞!曼聯(lián)加速 5000 萬搶 “新姆巴佩”,三大豪門瘋搶

下一個庫尼亞!曼聯(lián)加速 5000 萬搶 “新姆巴佩”,三大豪門瘋搶

瀾歸序
2026-04-21 06:36:55
定了,爵士隊、灰熊隊等球隊在2026年NBA選秀順位附加賽中勝出

定了,爵士隊、灰熊隊等球隊在2026年NBA選秀順位附加賽中勝出

好火子
2026-04-21 05:24:18
肖戰(zhàn)為《Gucci》業(yè)績下滑背鍋?CEO質(zhì)疑肖戰(zhàn)不起作用,簽約很失敗

肖戰(zhàn)為《Gucci》業(yè)績下滑背鍋?CEO質(zhì)疑肖戰(zhàn)不起作用,簽約很失敗

大中國
2026-04-19 09:53:57
起風(fēng)了!大陸接到臺灣消息,解放軍剛按住日本,又有6國調(diào)兵遣將

起風(fēng)了!大陸接到臺灣消息,解放軍剛按住日本,又有6國調(diào)兵遣將

老塕是個手藝人
2026-04-21 01:21:39
萬豪“換可樂”,換掉的不只是百事

萬豪“換可樂”,換掉的不只是百事

環(huán)球旅訊
2026-04-21 07:08:28
拜仁摘隊史德甲第34冠,主帥孔帕尼:“一切還沒結(jié)束”

拜仁摘隊史德甲第34冠,主帥孔帕尼:“一切還沒結(jié)束”

環(huán)球網(wǎng)資訊
2026-04-21 06:48:12
多個城市門店暫停營業(yè)!又一老牌海鮮自助扛不住了?

多個城市門店暫停營業(yè)!又一老牌海鮮自助扛不住了?

藍(lán)鯨新聞
2026-04-20 17:59:30
姆貝莫危險了!曼聯(lián)瞄準(zhǔn)切爾西目標(biāo),6100 萬頂級飛翼比他強(qiáng)太多

姆貝莫危險了!曼聯(lián)瞄準(zhǔn)切爾西目標(biāo),6100 萬頂級飛翼比他強(qiáng)太多

瀾歸序
2026-04-21 06:17:53
一傳一射+跳舞群嘲!19歲恩德里克打臉全法甲,大巴黎成背景板!

一傳一射+跳舞群嘲!19歲恩德里克打臉全法甲,大巴黎成背景板!

仰臥撐FTUer
2026-04-20 21:26:12
234萬平方公里大國,海岸線僅37公里:準(zhǔn)內(nèi)陸國到底有多憋屈

234萬平方公里大國,海岸線僅37公里:準(zhǔn)內(nèi)陸國到底有多憋屈

兔斯基聊科學(xué)
2026-04-18 10:45:36
退休從北京搬到棗莊,一年后才看清:這哪是換城市,明明是換人生

退休從北京搬到棗莊,一年后才看清:這哪是換城市,明明是換人生

芭比衣櫥
2026-04-20 17:14:57
2026-04-21 07:39:00
Web3天空之城 incentive-icons
Web3天空之城
美好,有趣的,值得銘記的
116文章數(shù) 93關(guān)注度
往期回顧 全部

科技要聞

重磅官宣:庫克卸任,特努斯接任蘋果CEO

頭條要聞

特朗普兩天三次反轉(zhuǎn) 伊朗學(xué)習(xí)特朗普玩起"極限施壓"

頭條要聞

特朗普兩天三次反轉(zhuǎn) 伊朗學(xué)習(xí)特朗普玩起"極限施壓"

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經(jīng)要聞

利潤暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進(jìn)廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

手機(jī)
親子
數(shù)碼
教育
公開課

手機(jī)要聞

蘋果被曝下調(diào) iPhone 18 規(guī)格以壓縮成本

親子要聞

居家防夾刻不容緩,多名兒童在家玩鬧時手指被夾斷

數(shù)碼要聞

三足鼎立!美光24Gb GDDR7正式亮相 與三星、SK海力士角逐高端顯存市場

教育要聞

江西地域文化給予創(chuàng)作底氣,親子閱讀非常重要

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版