CES2026黃仁勛: AI應用重寫一切, Vera Rubin全面投產(chǎn), 物理AI進入“ChatGPT 時刻”倒計時 | 前沿在線

2026-01-07 23:15:41　來源: 前沿在線

北京舉報

分享至

在 CES 2026 的舞臺上，黃仁勛并沒有急于用某一款產(chǎn)品“點燃情緒”。

這場長時間的主題演講，更像一次系統(tǒng)性的時代復盤與方向校準：從 AI 平臺的根本性轉變，到 Agent 架構、物理 AI、自動駕駛、機器人，再到算力、網(wǎng)絡、存儲與能源效率，英偉達試圖回答的不是“下一代芯片有多強”，而是——未來十年，計算與智能將如何被重新組織。

（完整實錄見文末）

編輯：前沿在線編輯部

拉斯維加斯，新年快樂。

NVIDIA 創(chuàng)始人兼 CEO 黃仁勛一上臺就把 CES 的現(xiàn)場氛圍點燃：這個可容納 3000 人的禮堂坐滿了人，外場還有 2000 人圍觀，甚至樓上也擠滿了觀眾。

黃仁勛笑稱，自己“帶了 15 公斤材料要講”，而全世界將有數(shù)以百萬計的人通過直播一起進入 2026 的開年第一場科技主題演講。

但這場演講的核心并不是“熱鬧”，而是一個更明確的信號：計算產(chǎn)業(yè)又一次來到平臺重置點，而且這一次是“雙平臺轉換”同時發(fā)生。

每 10～15 年一次平臺重置：這一次，AI 讓“軟件本身”變了

黃仁勛把計算產(chǎn)業(yè)的歷史復盤了一遍：從主機到 PC、PC 到互聯(lián)網(wǎng)、互聯(lián)網(wǎng)到云、云到移動……每一次平臺轉換，都會帶來一次應用世界的重寫。

而今天發(fā)生的變化更徹底：不僅平臺在變，應用的構建方式也在變。

過去我們寫軟件、編譯軟件、讓軟件運行在 CPU 上；今天我們在 GPU 上運行模型，應用不再是“預先寫好的邏輯”，而是能理解上下文、并在每一次交互中從頭生成內(nèi)容——生成每一個像素、每一個 token。

黃仁勛用“計算五層堆?！眮砀爬ㄟ@種變化：從硬件到系統(tǒng)到軟件再到應用，整個堆棧正在被 AI 重新塑形。這意味著過去十多年累計的、以“經(jīng)典計算方式”為基礎的巨大技術資產(chǎn)——他用“十萬億美元級別”來形容——正在被整體現(xiàn)代化。

錢從哪里來？黃仁勛給出的答案很直接：來自各行各業(yè)的研發(fā)預算遷移。經(jīng)典方法的預算正在轉向 AI 方法，這就是這波 AI 現(xiàn)代化的燃料。

從 ChatGPT 到“推理模型”，再到 Agent：2025 的關鍵轉折已經(jīng)發(fā)生

黃仁勛把 2025 形容為“不可思議的一年”，因為一切都像同時發(fā)生。

他回顧了幾個關鍵節(jié)點：
2015 年左右，語言模型開始真正產(chǎn)生影響；

2017 年 Transformer 出現(xiàn)；

2022 年“ChatGPT 時刻”讓世界被喚醒；

而一年后，一個重要的新階段到來——推理模型開始成為主角。

他重點提到一種思路：測試時擴展（test-time scaling）。直白說，就是AI 不僅在訓練前學習、訓練后再用強化學習學技能；在推理階段，它也需要“實時思考”——思考越多、計算越大、答案通常越好。

緊接著，2024～2025 年，代理系統(tǒng)（Agent）開始遍地開花：它能查找信息、做研究、使用工具、規(guī)劃未來、模擬結果，開始解決“以前不可能由一個模型獨立完成”的重要問題。

黃仁勛還點名了一個“他很喜歡的代理工具”：Cursor。他說它徹底改變了 NVIDIA 內(nèi)部的軟件編程方式。

AI不只有語言：物理 AI、世界模型與“開放模型的大爆發(fā)”

黃仁勛強調(diào)，大語言模型并不是宇宙中唯一重要的信息形態(tài)。只要世界里存在結構，就可以訓練一種“語言模型式”的系統(tǒng)去理解它的表示并形成智能。

其中最關鍵的一類，是理解自然規(guī)律的物理 AI：它不僅要理解物理定律，還要能與物理世界互動。

而 2025 年另一個最重要的事件，是開放模型的進步與爆發(fā)。黃仁勛認為：一旦開源、開放創(chuàng)新全面啟動，智能會在任何地方激增——每個公司、每個行業(yè)、每個國家，都能同時被激活。

他特別提到一個讓世界震驚的開放推理系統(tǒng)進展，并用“它激活了整個運動”來形容開源推理浪潮的引爆效應。

在他看來，開放模型已經(jīng)逼近前沿：也許仍落后幾個月，但每隔幾個月就會出現(xiàn)新一代進展，下載量呈爆炸式增長——因為創(chuàng)業(yè)公司、研究者、學生、甚至國家都想?yún)⑴c這場革命。

NVIDIA 為什么自己建 AI 超算：DGX Cloud、開源模型與Nemo 全家桶

黃仁勛提到，幾年前 NVIDIA 開始構建并運營自己的 AI 超級計算機體系（DGX Cloud）。外界常問：你們要做云嗎？他的回答是否定的——它是為 NVIDIA 自己而建，用來做前沿模型研發(fā)。

他舉了很多例子：數(shù)字生物學、蛋白質結構理解與生成、地球與天氣預測相關模型、以及一些“能長時間思考或快速思考”的新架構探索。

更關鍵的是，他強調(diào)NVIDIA 不只是開源模型，還開源訓練這些模型的一套體系：包括用于數(shù)據(jù)處理、數(shù)據(jù)生成、訓練、評估、護欄到部署的生命周期管理庫——他稱之為 Nemo 系列庫，并延展到物理、醫(yī)療、生物等不同領域版本。

他把 NVIDIA 定位成一種“前沿 AI 模型構建者”，并強調(diào)他們以“盡可能開放”的方式構建，讓每家公司、每個行業(yè)、每個國家都能參與 AI 革命。

Agent 的真正形態(tài)：多模型、多云、混合部署，以及“意圖路由器”

黃仁勛把“現(xiàn)代 AI 應用的基本架構”講得非常直白：未來的 AI 應用天然就是多模態(tài)（語音、圖像、文字、視頻、3D、甚至蛋白質），也天然是多模型的——因為不同任務需要不同模型。

因此，它也必然是多云的、混合云的：有的模型在云端，有的要跑在企業(yè)內(nèi)網(wǎng)，有的要在邊緣設備上，甚至要在醫(yī)院、基站或機器人本體旁邊跑，以獲得實時數(shù)據(jù)與低延遲。

在這個框架里，他提出一個關鍵組件：基于意圖的模型路由器。路由器像一個“經(jīng)理”，決定哪個任務該調(diào)用哪個模型：該留在本地執(zhí)行的就留在本地，需要最強前沿模型的再去調(diào)用云端。

他順勢給了一個輕量但完整的示例：做一個個人助理，處理日歷、郵件、待辦事項，甚至連接家里的設備。為了保護隱私，郵件相關任務可以調(diào)用本地運行的開放模型；其它任務再調(diào)用前沿模型 API。

現(xiàn)場還演示了一個“會說話的小機器人助理”，能把待辦事項同步給 Jensen，能把草圖生成建筑渲染并做視頻導覽，還能遠程看家、提醒寵物不要上沙發(fā)。

黃仁勛用一句話概括這種震撼感：幾年之前這幾乎不可想象，而現(xiàn)在“已經(jīng)變得微不足道”。

他隨后點名了多家企業(yè)平臺合作，核心意思是：這種 Agent 架構不僅改變開發(fā)方式，也將成為企業(yè)平臺的全新交互界面——從“填表格、點按鈕”轉向“像與人對話那樣使用系統(tǒng)”。

下一站：物理 AI。三臺計算機、Omniverse、Isaac，以及 Cosmos 的合成數(shù)據(jù)路線

如果說 Agent 是“軟件世界的重構”，那黃仁勛認為，物理 AI將把 AI 從屏幕帶進真實世界。

他強調(diào)，物理 AI 的難點在于“常識”——物體恒常性、因果關系、摩擦力與重力、慣性……對孩子是常識，對 AI 卻是未知。要讓 AI 學會這些規(guī)律，必須構建一整套系統(tǒng)。

他用“三臺計算機”描述物理 AI 的基礎架構：
一臺用于訓練，一臺用于推理部署，還有一臺專門用于模擬——因為沒有模擬，就無法評估動作與世界反應的一致性，數(shù)據(jù)也永遠不夠。

在 NVIDIA 的體系里，模擬是核心：Omniverse 是數(shù)字孿生與基于物理的仿真世界；Isaac Sim / Isaac Lab 是機器人學習與訓練的關鍵環(huán)境；而數(shù)據(jù)上最大的突破，是把計算變成數(shù)據(jù)：通過基于物理規(guī)律的合成數(shù)據(jù)生成，規(guī)?；圃煊柧殬颖?，覆蓋長尾與邊緣情況。

黃仁勛在演講中拋出了一個更強的判斷：物理 AI 的 ChatGPT 時刻即將到來。

因為現(xiàn)實世界的數(shù)據(jù)收集太慢、太貴、永遠不夠，答案只能是合成數(shù)據(jù)，而這一切在 Cosmos 上開始成型。

自動駕駛的“推理 AI”：AlphaMyo 與端到端訓練、可解釋駕駛

演講的另一條重要線索，是自動駕駛。

黃仁勛宣布了AlphaMyo，強調(diào)它是端到端訓練的自動駕駛 AI：從攝像頭輸入到控制輸出，訓練數(shù)據(jù)包含人類示范駕駛與 Cosmos 生成的大規(guī)模合成里程，再疊加大量精細標注樣本。

他特別強調(diào)一個“可解釋性”的點：AlphaMyo 不只是“做動作”，它會解釋它將采取什么行動、為什么這么做，并把行動與軌跡耦合起來。

這在長尾駕駛場景里尤其關鍵——你不可能收集世界上每一個國家、每一種極端情況的真實數(shù)據(jù)，但如果能把復雜長尾拆解成若干常見的物理交互片段，推理系統(tǒng)就可能在未見過的情境下做出合理決策。

他還談到NVIDIA 為什么做自動駕駛：因為 AI 會重塑整個計算堆棧，NVIDIA 必須理解并構建從芯片到基礎設施到模型到應用的完整系統(tǒng)能力，才能引導產(chǎn)業(yè)走向未來。

在他的敘述里，車就是“機器人系統(tǒng)”的一種：它需要為安全設計的處理器、冗余的傳感器體系、可追蹤的全棧軟件，以及一個在低置信場景會回退到更安全護欄系統(tǒng)的“雙堆棧鏡像”策略。

機器人登場：在 Omniverse 里學會成為機器人

接下來，他把鏡頭轉向更廣義的機器人產(chǎn)業(yè)：機械臂、移動機器人、人形機器人……尺寸不同、形態(tài)不同，但核心問題相似——都需要物理 AI、仿真與數(shù)據(jù)。

現(xiàn)場還出現(xiàn)了多個機器人“朋友”，他開玩笑說“沒有誰像你們這么可愛”，并強調(diào) Isaac、Omniverse 這類訓練體系，會成為未來機器人產(chǎn)業(yè)的通用底座。

把物理 AI 帶進工業(yè)：Cadence / Synopsys / Siemens，工業(yè)生命周期的 AI 化

黃仁勛把物理 AI 的落點指向工業(yè)體系：EDA、系統(tǒng)設計、系統(tǒng)仿真、工廠制造與生產(chǎn)線。

他點到 Cadence 和 Synopsys 在芯片設計世界中的核心地位，并提出一種未來圖景：

未來我們不僅會有“代理軟件工程師”，還會有“代理芯片設計師”和“代理系統(tǒng)設計師”。芯片會在電腦里設計，系統(tǒng)會在電腦里仿真，工廠產(chǎn)線會在電腦里搭建并測試——在真正落到重力世界之前，先在數(shù)字世界完成大部分驗證。

隨后他引出 Siemens 的合作內(nèi)容：將 NVIDIA CUDA-X 庫、AI 模型與 Omniverse 納入其工業(yè)軟件產(chǎn)品組合，把物理 AI 帶入整個工業(yè)生命周期——從設計與仿真，到生產(chǎn)，再到運營。他把這稱為“新工業(yè)革命的起點”。

Vera Rubin：為 AI 新前沿而生的下一代計算平臺（以及為什么必須“極端協(xié)同設計”）

演講后半段，黃仁勛把重頭戲交給了新一代平臺：Vera Rubin。

他先講了“為什么叫 Vera Rubin”：這位天文學家通過星系旋轉曲線的異常發(fā)現(xiàn)暗物質存在。

黃仁勛借此引出“看不見但影響巨大的東西”，并把它對應到 AI時代的計算挑戰(zhàn)：模型規(guī)模與推理計算暴漲，token 生成量爆發(fā)，成本競爭每年劇烈下探——一切最終都變成計算問題。

在他看來，摩爾定律放緩意味著：單靠工藝進步，不可能跟上模型規(guī)模的增長與 token 需求的增長。要跟上，行業(yè)必須做“極端協(xié)同設計”——同時在整個堆棧的所有關鍵芯片上創(chuàng)新。

因此，這一代他們幾乎“別無選擇”，只能重新設計每一個芯片與系統(tǒng)組件。黃仁勛強調(diào)：僅僅系統(tǒng)里每一個芯片拿出來都可以單獨開發(fā)布會。

他在臺上展示了多個實物部件，講到了 CPU 與 GPU 的聯(lián)合設計、極高的 I/O 能力、以及在張量計算上通過新型數(shù)值/引擎實現(xiàn)的吞吐與精度平衡

除此之外，他還用大量篇幅談到數(shù)據(jù)中心系統(tǒng)工程：

從“線纜地獄”到“零線纜”、從兩小時組裝到五分鐘、從風冷到全液冷、熱水冷卻（45℃）仍能保持高能效；

以及 Spectrum-X 以太網(wǎng)在 AI 時代的關鍵作用、BlueField DPU 在虛擬化與安全卸載上的角色、NVLink 交換與超高帶寬互聯(lián)在“讓每個 GPU 同時與所有 GPU 交流”上的意義。

他給出了一個很具沖擊力的系統(tǒng)性判斷：在千兆瓦級 AI 工廠里，網(wǎng)絡每提升一點吞吐都可能對應數(shù)十億美元的價值；因此網(wǎng)絡能力不是“配角”，而是 AI 工廠的關鍵生產(chǎn)力。

他最后用一組“給造 AI 超算的人看的圖表”來總結 Vera Rubin 的意義：訓練吞吐、工廠吞吐、token 成本、能效與成本效益，都被推到了下一階段。

他把這歸結為NVIDIA 的新定位：從“做芯片的公司”，變成“構建完整 AI 堆棧的公司”，覆蓋從芯片到基礎設施、從模型到應用的全鏈路重構。

黃仁勛的“失控花絮”與 CES 的真實感

演講結束前，黃仁勛還放了一段“外景/花絮”式的片段：麥克風、攝像、滑稽的臺詞、卡頓的幻燈片、現(xiàn)場的笑點……他說有一堆內(nèi)容不得不剪掉，但正是這些不完美，讓 CES 的現(xiàn)場變得更“人類”。

在一片喧鬧與掌聲里，他以一句樸素的收束結束了當天的敘事：NVIDIA 的工作，是把整個堆棧搭出來，讓所有人都能在此之上創(chuàng)造應用，推動 AI 進入下一個前沿。

完整實錄如下：

大家好，拉斯維加斯，新年快樂。

歡迎來到 CES。我們今天在這里，其實要“塞進來”的內(nèi)容非常多，大概有15 公斤那么重。但能在現(xiàn)場看到你們所有人，我真的非常開心。

此刻，這個主會場里坐著3000 人。外面的庭院，還有2000 人在同步觀看。據(jù)我所知，四樓原本用于視頻轉播的區(qū)域里，也還有1000 人在看這場演講。

基本上，整棟樓的每一層，都在觀看這場主題演講。當然，還有全世界數(shù)以百萬計的人，正通過直播，與我們一起開啟新的一年。

每10 到 15 年，計算機產(chǎn)業(yè)就會迎來一次平臺級重置。

我們經(jīng)歷過這樣的周期：從大型機到個人電腦；從個人電腦到互聯(lián)網(wǎng)；從互聯(lián)網(wǎng)到云計算；再從云計算到移動計算。

每一次變化，都會誕生一個全新的平臺。而所謂“平臺遷移”，真正的含義在于：應用的目標發(fā)生了改變。你不再是為舊的計算機寫程序，而是為一套全新的計算范式，重新構建應用。

但這一次，情況有些不同。這一次，并不是一次平臺遷移，而是兩次平臺遷移，同時發(fā)生。第一條遷移路徑，是我們正在從“傳統(tǒng)應用”，走向AI 原生應用。

一開始，人們以為“AI 本身就是應用”。而事實上，AI 確實是應用的一種。但更重要的是：我們正在把應用構建在 AI 之上。AI 正在成為新的應用運行平臺。

而第二條遷移路徑，則更加根本。它不是“你做什么應用”，而是“你如何開發(fā)軟件、如何運行軟件”。整個計算產(chǎn)業(yè)的五層技術棧，正在被徹底重塑。

在這個新世界里：你不再是“編程”軟件，而是訓練軟件。你不再主要運行在 CPU 上，而是運行在GPU上。

過去，應用是預先寫好、預先編譯的，然后在設備上執(zhí)行；而現(xiàn)在，應用能夠理解上下文，并且在每一次運行時，從零生成每一個像素、每一個 token。

也就是說——每一次運行，都是一次全新的生成。正因為加速計算的出現(xiàn)，正因為人工智能的出現(xiàn)，整個計算體系正在被從底層到頂層，全部重建。這五層“計算蛋糕”的每一層，如今都在被重新發(fā)明。

這意味著什么？這意味著，在過去十年中，大約10 萬億美元規(guī)模的傳統(tǒng)計算基礎設施，正在被整體現(xiàn)代化，遷移到這種全新的計算方式之中。

這也解釋了為什么：每一年，有數(shù)千億美元的風險投資，持續(xù)流入這個行業(yè)；為什么，一個總規(guī)模達到100 萬億美元的產(chǎn)業(yè)，其中相當比例的研發(fā)預算，正在從傳統(tǒng)方法，轉向人工智能方法。

人們經(jīng)常問我：“這些錢到底是從哪里來的？”答案就在這里。它們來自于：對既有計算體系的現(xiàn)代化改造；來自于研發(fā)預算從傳統(tǒng)路徑，轉向 AI 路徑；來自于整個世界，正在押注一種全新的計算范式。

這就是為什么，我們會如此忙碌。而過去這一年，也完全不例外。

過去這一年，真的非常不可思議。很多事情幾乎是在同一時間同時發(fā)生的?；仡^看，它們并不是巧合，而是一次集中式的技術躍遷。

首先發(fā)生的，是規(guī)模定律（scaling laws）的持續(xù)推進。如果回到 2015 年，我第一次看到一個真正可能改變世界的語言模型。它叫BERT。那是第一次讓我意識到，自然語言模型不只是一個研究方向，而是一種即將改變計算方式的技術。

隨后，在2017 年，Transformer 架構出現(xiàn)了。但直到五年之后，也就是 2022 年，我們才真正迎來了那個被稱為 “ChatGPT 時刻”的轉折點。

那一刻，世界第一次被真正喚醒。人們開始意識到，人工智能不只是一個工具，而是一種全新的能力平臺。

而在那之后，又發(fā)生了一件極其重要的事情。

大約一年后，ChatGPT 推出了第一個O1 推理模型。那是第一個真正意義上的“推理模型”。

它并不是簡單地生成答案，而是在生成答案之前，進行內(nèi)部推理。這一次突破，幾乎是革命性的。

它引入了一個新的概念，叫做測試時擴展（test-time scaling）。

從直覺上講，這其實非常符合常識。我們不僅在預訓練階段讓模型學習知識，
也在后訓練階段通過強化學習，讓模型學會技能，而現(xiàn)在，我們進一步讓模型在推理階段進行“思考”。

換句話說：模型開始在實時運行中，動態(tài)地分配計算資源，用于推理本身。

而這三種階段——預訓練、后訓練、測試時推理——每一個階段，都需要極其龐大的計算資源。

計算定律并沒有停止。大語言模型仍在持續(xù)變得更強。與此同時，另一個重要突破出現(xiàn)了。這個突破，發(fā)生在2024 年，并在2025 年開始迅速擴散、全面滲透。

那就是：智能體系統(tǒng)（Agentic Systems）的出現(xiàn)。智能體模型，具備一整套全新的能力。

它們能夠推理，能夠查找信息，能夠做研究，能夠使用工具，能夠規(guī)劃未來，能夠模擬不同結果。

突然之間，AI 開始能夠解決一大類過去幾乎無法自動化的重要問題。在英偉達內(nèi)部，我個人最喜歡的一個智能體模型，叫做Cursor。

它幾乎徹底改變了我們在英偉達內(nèi)部進行軟件開發(fā)的方式。

而這，僅僅是開始。從現(xiàn)在開始，智能體系統(tǒng)將真正迎來爆發(fā)式增長。

當然，我們也很清楚一件事：大語言模型并不是信息世界的全部。信息并不只存在于文本之中。

只要這個世界中存在信息，存在結構，存在規(guī)律，我們就可以訓練一種“語言模型”，去理解這種信息的表示方式，并把它轉化為 AI。

換句話說，語言模型并不局限于語言。

只要世界中存在“可學習的結構”，就存在 AI 的空間。在所有這些方向中，最重要、也最具挑戰(zhàn)性的一個方向，就是——物理 AI（Physical AI）。

物理 AI，是理解自然規(guī)律的 AI。它不是只理解符號、文本或圖像，而是理解這個世界如何真實運作。

當然，物理 AI 的核心，并不僅僅在于“理解”。更重要的是——與世界交互。當 AI 不再只存在于屏幕中，而是開始與現(xiàn)實世界發(fā)生互動時，一切都會改變。

這里，我們需要區(qū)分兩個相關但不同的概念。

第一種，是物理 AI。也就是那些能夠感知、決策、并與物理世界互動的 AI 系統(tǒng)，比如機器人、自動駕駛汽車等。

第二種，是AI Physics（物理規(guī)律 AI）。這是理解物理定律本身的 AI，能夠學習和推斷自然界的基本規(guī)則。

這兩者是相互配合的。

一個與世界互動的 AI，需要理解物理規(guī)律；而一個理解物理規(guī)律的 AI，最終也必須被用來指導真實世界中的行動。

而在過去一年中，最重要、也最令人振奮的另一件事情，是開放模型的全面進展。

當模型是開放的，當創(chuàng)新是開放的，當每一家企業(yè)、每一個行業(yè)、每一個國家，都能夠在同一時間參與進來，人工智能就不可能只屬于少數(shù)人。

正是在這種背景下，AI 才會真正實現(xiàn)無處不在的普及。

去年，開放模型真正迎來了爆發(fā)。

其中一個最具代表性的事件，是DeepSeek R1的發(fā)布。這是第一個真正意義上的開放推理模型。

它讓整個世界感到震驚。

不僅因為它的性能，更因為它證明了一件事：推理能力，并不一定只存在于封閉模型中。

DeepSeek R1 的出現(xiàn)，幾乎點燃了整個開放模型生態(tài)。一個真正的開放 AI 運動，就此被激活。

從那之后，我們看到世界各地涌現(xiàn)出各種各樣的開放模型系統(tǒng)。不同架構、不同規(guī)模、不同目標，但共同點只有一個：開放正在加速智能的擴散。

我們現(xiàn)在已經(jīng)可以非常確定地說：開放模型，已經(jīng)觸及 AI 的技術前沿。

是的，它們?nèi)匀宦浜笥谧钋把氐姆忾]模型，大約六個月左右。但每過六個月，就會有新的開放模型出現(xiàn)，而且它們變得越來越聰明。

正因為如此，你可以看到一個非常明顯的現(xiàn)象：下載量正在爆炸式增長。

初創(chuàng)公司希望參與 AI 革命；大型企業(yè)希望構建自己的能力；研究人員希望探索新的邊界；學生希望學習；幾乎每一個國家，都希望參與其中。

因為一個問題擺在所有人面前：數(shù)字形態(tài)的智能，怎么可能把任何人留在身后？正是在這樣的背景下，開放模型在過去一年中，真正重塑了人工智能產(chǎn)業(yè)。而這，也正是我們在英偉達很早之前就隱約意識到的一件事。

幾年前，你們可能聽說過，我們開始自己構建并運營 AI 超級計算機。我們把它們稱為DGX Cloud。當時，很多人問我們：“你們是不是要進入云計算業(yè)務？”答案是否定的。

我們構建這些 DGX 超級計算機，并不是為了成為云服務商，而是為了我們自己使用。

事實證明，這是一個非常正確的決定。如今，我們已經(jīng)在全球范圍內(nèi)，運營著價值數(shù)十億美元的 AI 超級計算機集群。它們的核心用途之一，就是用于開發(fā)開放模型。

我對這項工作的進展感到非常自豪。因為它正在吸引來自世界各地、各個行業(yè)的關注。

原因很簡單：我們正在多個不同領域，同時推進前沿 AI 模型的研究。

在這樣的基礎之上，我們構建的這些模型，不僅是前沿級的，而且在客觀評測中同樣處于世界領先位置。我們在多個排行榜上長期名列前茅，這也是我們非常自豪的一點。

這些模型覆蓋了多個關鍵方向：它們能夠理解多模態(tài)文檔——也就是我們每天最常見、也最有價值的內(nèi)容載體，PDF。世界上大量重要的信息都被封裝在 PDF 中，但只有借助人工智能，我們才能真正理解其中的結構、語義和含義，幫助人類高效閱讀與使用這些內(nèi)容。

我們的 PDF 檢索模型、PDF 解析模型，都處于世界一流水平。

與此同時，我們的語音識別模型同樣是世界級的；我們的檢索模型，本質上就是現(xiàn)代 AI 時代的語義搜索與 AI 搜索引擎，其能力也同樣位居全球前列。我們幾乎在所有關鍵基準上，都處在領先位置，而這一切，最終都是為了一個目標——讓你們能夠真正構建 AI 智能體。

這正是一個極其關鍵、也是極具突破性的階段。

回想 ChatGPT 剛出現(xiàn)的時候，很多人都會說：“它生成的結果很有意思，但經(jīng)常會出現(xiàn)幻覺。”而幻覺的根源其實并不復雜。模型可以記住過去，卻不可能記住現(xiàn)在和未來發(fā)生的一切。

因此，如果它沒有被扎根在現(xiàn)實信息之中，沒有在回答問題之前進行檢索、查證和推理，就必然會產(chǎn)生不可靠的輸出。

真正重要的能力，在于模型能否判斷：我現(xiàn)在是否需要做研究？是否需要調(diào)用工具？是否需要把一個復雜問題拆解成多個步驟？而這些步驟本身，又是否是模型已經(jīng)學會、可以勝任的任務。

當模型具備了這種能力之后，它就可以把這些步驟組合成一個完整的行動鏈條，去完成一件它從未被直接訓練過的事情。這正是“推理”的本質，也是智能體真正令人驚嘆的地方。

人類也是如此。我們經(jīng)常會遇到從未經(jīng)歷過的情境，但我們可以把它拆解成一系列我們熟悉的規(guī)則、經(jīng)驗和知識，并據(jù)此做出判斷和行動。

如今，AI 模型終于開始具備類似的能力。這種推理能力，為無數(shù)新的應用場景打開了大門。我們不再需要在第一天就教會 AI 一切；就像人類一樣，它可以在面對具體問題時，通過推理找到解決路徑。

大語言模型在這一點上實現(xiàn)了真正的飛躍——強化學習、思維鏈、搜索、規(guī)劃，這一整套方法體系，讓這種能力第一次變得系統(tǒng)化、可工程化，而且現(xiàn)在，這些能力也正在被逐步開源。

而真正讓我感到震撼的，是另一個關鍵突破。我第一次清楚意識到這一點，是在看到Aravind創(chuàng)辦的Perplexity時。

Perplexity 是一家做 AI 搜索的公司，非常具有創(chuàng)新性。當我意識到他們在同一個推理鏈條中，同時調(diào)用多個模型時，我覺得這簡直是天才般的設計。

仔細想想，這其實再合理不過了：如果 AI 要解決一個復雜問題，為什么不在推理的不同階段，調(diào)用世界上最適合那個任務的 AI 呢？

這正是為什么，現(xiàn)代 AI 天生就是多模態(tài)的——它理解語音、圖像、文本、視頻、三維結構，甚至蛋白質；

同時，它也是多模型的——它會根據(jù)任務選擇最合適的模型；它天然是多云的，因為這些模型分布在不同的地方；同時，它也必然是混合云的。

如果你是一家企業(yè)，或者你正在構建一臺機器人，那么有些計算發(fā)生在云端，有些發(fā)生在邊緣，有些發(fā)生在工廠，有些發(fā)生在醫(yī)院——數(shù)據(jù)必須就在你身邊，實時可用。

因此，這正是未來 AI 應用的基本形態(tài)。換一種說法：既然未來的應用是構建在 AI 之上的，那么這套智能體架構，就是未來應用的基礎結構。正是這種多模型、多模態(tài)、可推理、可調(diào)用工具的架構，極大地加速了各類 AI 創(chuàng)業(yè)公司的成長。

再加上開放模型與開放工具的出現(xiàn)，你現(xiàn)在不僅可以使用最前沿的能力，還可以定制屬于你自己的 AI，教會它只有你才掌握的技能——那些來自你所在行業(yè)、你所在公司的深度知識。這正是我們在 Nemotron、NeMo，以及整個開放模型體系中所要實現(xiàn)的目標。

在這種架構下，你通常會在前面放置一個智能路由器。這個路由器就像一個管理者，它會根據(jù)你給出的提示意圖，判斷當前任務最適合由哪一個模型來完成。

需要處理郵件的請求，就留在本地運行；需要通用推理的部分，就調(diào)用前沿模型。這樣一來，你既擁有高度定制化的 AI，又始終站在技術前沿——一端是你獨有的領域能力，另一端是不斷進化的前沿智能，而這一切，只需要“讓它跑起來”即可。

為了讓大家真正理解這種智能體架構在現(xiàn)實中的樣子，我們做了一件事：把它完整地搭建出來，而且不是作為一個概念演示，而是作為一個真實可運行的系統(tǒng)。

我們把這種可復用的系統(tǒng)設計，稱之為Blueprints。Blueprint 并不是某一個模型，而是一整套經(jīng)過驗證的 AI 系統(tǒng)組合方式，它包括模型選擇、推理流程、工具調(diào)用、數(shù)據(jù)路徑，以及最終如何把結果交付給用戶。

其中一個 Blueprint，就是個人 AI 助理。這個助理并不是一個聊天機器人，而是一個能夠真正幫你完成任務的系統(tǒng)。它可以幫你讀取郵件、總結信息、安排日程、檢索資料、生成內(nèi)容，并在必要時主動調(diào)用外部工具。

當你向它提出一個請求時，它不會立刻給你一個答案，而是先判斷：這是不是一個需要研究的問題？是不是一個需要多步推理的問題？是不是一個需要訪問你個人數(shù)據(jù)的問題？然后，它會把這個請求拆解成多個子任務，分別交給最合適的模型來完成，最后再把結果整合起來，形成一個你真正能用的輸出。

在這個過程中，有些模型運行在云端，有些運行在本地，有些運行在你自己的服務器上。

對你來說，這一切都是透明的；你只看到結果，但背后是一整套復雜而精密的系統(tǒng)在協(xié)同運作。這正是我們所說的混合 AI，也是未來所有嚴肅 AI 應用的基本形態(tài)。

為了支持這種架構，我們構建了一整代全新的計算系統(tǒng)。你們可能已經(jīng)聽說過DGX Spark。它并不是一臺傳統(tǒng)意義上的服務器，而是一個為 AI 原生應用而生的計算節(jié)點。它足夠小，可以放在辦公室、實驗室，甚至工廠里；同時，它又足夠強，可以支撐本地推理、數(shù)據(jù)處理和智能體運行。當你把 DGX Spark 與云端的 DGX 系統(tǒng)連接起來時，你就擁有了一套真正意義上的端云協(xié)同 AI 基礎設施。

這件事之所以重要，是因為物理 AI的時代已經(jīng)到來。機器人、自動化系統(tǒng)、工業(yè)設備，它們不可能把所有計算都放到云端。它們必須在本地感知環(huán)境、實時做出決策，同時又能夠在需要時，調(diào)用云端的更強算力進行規(guī)劃、學習和更新。這種“本地即智能、云端即大腦”的架構，是物理 AI 唯一可行的路徑。

在舞臺上，我們展示了多個這樣的 Blueprint 示例，包括機器人系統(tǒng)。你會看到，機器人并不是被一行一行代碼“寫”出來的，而是通過感知、推理、規(guī)劃和執(zhí)行，完成復雜動作。

它們可以理解語言指令，把語言映射為物理行動；可以在環(huán)境變化時重新規(guī)劃路徑；可以在失敗之后進行自我修正。這并不是一個單一模型的能力，而是一整套 AI 系統(tǒng)協(xié)同工作的結果。

而這，正是為什么我們?nèi)绱藦娬{(diào)系統(tǒng)級創(chuàng)新。單一模型的性能提升固然重要，但真正改變世界的，是這些模型如何被組合、如何被部署、如何在現(xiàn)實環(huán)境中長期穩(wěn)定運行。Blueprint 的意義就在這里——它把復雜性封裝起來，讓開發(fā)者、企業(yè)和研究人員，可以在此基礎之上快速構建自己的 AI 應用，而不必從零開始。

當我們真正開始構建這些 AI 系統(tǒng)時，有一件事變得異常清晰：AI 已經(jīng)不再是某一層的軟件問題，而是整個計算體系的問題。如果計算基礎設施不能被徹底重構，那么所有關于智能體、物理 AI、自動駕駛和機器人的設想，最終都會卡在現(xiàn)實世界的瓶頸上。

這也是為什么，我們必須從最底層開始重新思考計算。

AI 的計算負載，與傳統(tǒng)計算完全不同。它不是穩(wěn)定、線性的，而是高度動態(tài)的；不是以單次執(zhí)行為主，而是以持續(xù)推理為核心。模型在“思考”的時候，會在極短時間內(nèi)拉滿算力、內(nèi)存和網(wǎng)絡帶寬，然后又迅速回落。這種計算模式，對芯片、互連、系統(tǒng)、電力和散熱，提出了前所未有的要求。

因此，我們不再把 GPU、CPU、網(wǎng)絡、存儲視為彼此獨立的部件，而是把它們當作一個整體系統(tǒng)來設計。這正是我們反復強調(diào)的——極限協(xié)同設計。

在這個體系中，芯片不再只是追求單點性能，而是為整個系統(tǒng)服務；網(wǎng)絡不再只是連接，而是成為計算的一部分；系統(tǒng)不再只是承載，而是主動參與調(diào)度與優(yōu)化。只有在這樣的前提下，AI 才能真正擴展到前所未有的規(guī)模。

這正是Blackwell 之后，我們?yōu)槭裁幢仨氃傧蚯斑~出一大步。

過去幾年里，Blackwell 為 AI 訓練和推理奠定了一個全新的基線。但很快我們就意識到，如果只是沿著同樣的路徑繼續(xù)前進，是遠遠不夠的。模型規(guī)模在加速增長，推理復雜度在急劇上升，token 的生成方式正在從“回答”轉向“思考”，所有這些變化，都在逼迫我們重新發(fā)明整個計算平臺。

于是，我們開始設計一個全新的系統(tǒng)。不是一塊芯片。不是一臺服務器。而是一個完整的 AI 超級計算平臺。

這就是Vera Rubin。

Vera Rubin 并不是某一代產(chǎn)品的代號，而是一個象征。它象征著我們已經(jīng)進入一個階段：計算的瓶頸，不再在單一部件上，而在系統(tǒng)整體的協(xié)同效率上。在這個平臺中，每一個決策——從晶體管如何使用，到數(shù)據(jù)如何流動——都是圍繞 AI 的真實負載來做出的。

在設計 Vera Rubin 的過程中，我們面臨的最大挑戰(zhàn)，并不是“如何把性能再提升一點”，而是：如何在物理極限逐漸逼近的情況下，仍然實現(xiàn)數(shù)量級的躍遷。摩爾定律正在放緩，單靠晶體管數(shù)量的增長，已經(jīng)無法支撐 AI 的發(fā)展速度。

如果模型規(guī)模每年增長 10 倍，如果推理 token 每年增長 5 倍，如果成本還要持續(xù)以數(shù)量級下降，那么整個計算體系就必須發(fā)生質變。

答案只有一個：在整個系統(tǒng)層面進行同時創(chuàng)新。

這也是為什么，在這一代平臺中，我們選擇重新設計所有關鍵組件。CPU、GPU、網(wǎng)絡芯片、交換機、系統(tǒng)結構、電力與散熱——沒有任何一層可以保持不變。因為只要其中任何一層跟不上，整個系統(tǒng)都會被拖慢。

Vera Rubin 正是在這樣的背景下誕生的。它不是一次漸進式升級，而是一次系統(tǒng)級重構。它的目標非常明確：為 AI 的下一個十年，提供一個足夠強大、足夠高效、足夠可擴展的計算基礎。

當我們真正開始定義 Vera Rubin 這個平臺時，我們首先要解決的，不是“性能還能不能再快一點”，而是一個更根本的問題：數(shù)據(jù)在系統(tǒng)中，究竟應該如何流動。

在 AI 計算中，真正昂貴的，并不是計算本身，而是數(shù)據(jù)的移動。每一次跨芯片、跨節(jié)點、跨機架的數(shù)據(jù)傳輸，都會帶來延遲、功耗和效率損失。而隨著模型規(guī)模的不斷擴大，這個問題會被無限放大。

因此，在 Vera Rubin 中，我們從一開始就選擇了一條非常激進的路線：把多個關鍵計算單元，作為一個整體來協(xié)同設計。

這也是為什么，Vera Rubin 并不是一顆“更大的 GPU”，而是一個由六顆核心芯片組成的協(xié)同系統(tǒng)。這六顆芯片并不是簡單地堆疊在一起，而是通過極高帶寬、極低延遲的互連，被設計成一個幾乎“不可分割”的整體。

在這個系統(tǒng)中，GPU、CPU、內(nèi)存控制邏輯、網(wǎng)絡接口，不再是松散拼接的模塊，而是圍繞 AI 負載進行深度融合。它們共享統(tǒng)一的視圖，能夠以極高效率訪問彼此的數(shù)據(jù)，就像是在同一塊硅片上工作一樣。

為了實現(xiàn)這一點，我們在互連技術上投入了極大的精力。NVLink 在這一代平臺中，已經(jīng)不再只是 GPU 之間的高速通道，而是整個系統(tǒng)的“神經(jīng)網(wǎng)絡”。數(shù)據(jù)不需要繞遠路，不需要經(jīng)過多層轉發(fā)，而是可以在需要的時刻，直接流向需要它的地方。

這件事情聽起來很抽象，但它的結果非常直觀：模型在推理時，可以更長時間地保持“思考狀態(tài)”；更多的上下文可以常駐在高速內(nèi)存中；系統(tǒng)不再頻繁地因為等待數(shù)據(jù)而空轉。

與此同時，網(wǎng)絡本身也發(fā)生了根本變化。

在傳統(tǒng)數(shù)據(jù)中心中，網(wǎng)絡只是負責把機器連在一起。但在 AI 數(shù)據(jù)中心中，網(wǎng)絡本身就是計算的一部分。

在 Vera Rubin 平臺中，我們把Spectrum-X網(wǎng)絡體系深度嵌入到整體設計之中。交換機、網(wǎng)卡、拓撲結構、調(diào)度邏輯，全都圍繞 AI 的通信模式來優(yōu)化。模型在訓練和推理過程中，會不斷進行大規(guī)模的梯度同步、參數(shù)廣播和上下文交換，而這些操作，已經(jīng)成為系統(tǒng)的主要負載之一。

因此，我們不再允許網(wǎng)絡成為瓶頸。在這個平臺上，網(wǎng)絡的吞吐、延遲和可預測性，必須與計算本身同等重要。

同樣重要的，還有內(nèi)存系統(tǒng)。在 AI 推理時代，內(nèi)存的角色已經(jīng)發(fā)生了變化。
它不再只是用來“存放權重”，而是用來承載推理過程本身。KV cache、上下文窗口、中間狀態(tài)，這些內(nèi)容必須盡可能長時間地留在高速內(nèi)存中，才能支持更復雜、更長鏈路的推理。

因此，Vera Rubin 的內(nèi)存體系，是為“持續(xù)推理”而設計的。我們追求的不是峰值容量，而是可持續(xù)、高帶寬、低延遲的訪問能力。只有這樣，模型才能真正“停下來思考”，而不是被迫在計算與數(shù)據(jù)移動之間來回切換。

當你把這些因素放在一起看，就會發(fā)現(xiàn)一件事：Vera Rubin 并不是在追求某一個指標的極限，而是在追求整個系統(tǒng)效率的極限。

這也是為什么，我們必須同時重構計算、互連、網(wǎng)絡、內(nèi)存、電力和散熱。因為在這個規(guī)模上，任何一處效率損失，都會被成千上萬倍地放大。

最終，我們得到的，不只是一個更快的平臺，而是一個為 AI 原生設計的計算生態(tài)系統(tǒng)。它能夠隨著模型規(guī)模的增長而擴展，能夠隨著推理復雜度的提升而進化，也能夠在未來十年中，持續(xù)支撐 AI 的發(fā)展。

當你把視角從單一系統(tǒng)繼續(xù)拉遠，就會發(fā)現(xiàn)，真正的挑戰(zhàn)并不止于一臺機器，而是在數(shù)據(jù)中心尺度上，如何讓這些系統(tǒng)協(xié)同工作。因為一旦 AI 模型開始進入大規(guī)模訓練與持續(xù)推理階段，問題就不再是“一臺系統(tǒng)有多快”，而是“成千上萬臺系統(tǒng)，能否像一臺機器一樣工作”。

這正是我們在 Vera Rubin 平臺上，必須同時考慮機架級、集群級、數(shù)據(jù)中心級設計的原因。我們不再把服務器簡單地一臺一臺堆放，而是把整個機架視為一個計算單元。計算、網(wǎng)絡、電力和散熱，必須在機架層面完成統(tǒng)一設計，才能保證系統(tǒng)在滿負載運行時，仍然具備可預測的性能。

在這種架構下，我們構建了所謂的超節(jié)點（Supernode）。一個超節(jié)點并不是某一臺特別強的機器，而是一組通過高速互連、統(tǒng)一調(diào)度、共享內(nèi)存視圖的系統(tǒng)集合。在 AI 負載看來，這些系統(tǒng)就像是一塊連續(xù)擴展的計算資源，而不是彼此獨立的節(jié)點。這一點，對于大模型訓練和長上下文推理來說，至關重要。

當模型規(guī)模繼續(xù)擴大，通信量會呈指數(shù)級增長。如果系統(tǒng)在這個階段出現(xiàn)任何不均衡，哪怕只是極小的延遲抖動，都會被迅速放大，最終拖慢整個訓練過程。因此，在超節(jié)點層面，我們對拓撲結構、帶寬分配和調(diào)度策略進行了深度優(yōu)化，確保數(shù)據(jù)在系統(tǒng)中始終走最短、最可預測的路徑。

當然，所有這些計算能力，最終都會轉化為一個非?，F(xiàn)實的問題：能耗。

AI 數(shù)據(jù)中心的功耗規(guī)模，已經(jīng)遠遠超過了傳統(tǒng)數(shù)據(jù)中心。訓練一個前沿模型，所消耗的電力，足以支撐一座中型城市的部分用電需求。如果我們不能在能效上實現(xiàn)突破，那么 AI 的發(fā)展本身就會受到物理和經(jīng)濟條件的限制。

因此，在這一代平臺中，我們把能效作為系統(tǒng)設計的核心指標之一。每一次數(shù)據(jù)移動、每一次計算調(diào)度、每一次網(wǎng)絡通信，都會被納入整體能耗模型之中進行優(yōu)化。我們的目標，并不是簡單地降低功耗，而是在單位能耗下，完成盡可能多的有效推理與訓練工作。

這也直接推動了散熱技術的演進?？諝饫鋮s已經(jīng)無法滿足如此高密度的計算需求，于是我們大規(guī)模引入了液冷系統(tǒng)。通過液冷，我們不僅能夠更有效地帶走熱量，還能夠讓系統(tǒng)在更穩(wěn)定的溫度區(qū)間內(nèi)運行，從而提高可靠性和壽命。這些看似“工程細節(jié)”的東西，實際上決定了 AI 是否能夠長期、可持續(xù)地運行在現(xiàn)實世界中。

當你把計算、網(wǎng)絡、能耗和散熱放在一起看，就會發(fā)現(xiàn)：現(xiàn)代 AI 數(shù)據(jù)中心，本身就是一臺巨大的計算機。

它不是由零散的服務器拼湊而成，而是一個從底層物理到上層軟件高度協(xié)同的系統(tǒng)。正是在這樣的系統(tǒng)之上，AI 才能以我們今天看到的速度不斷進化。

也正因為如此，我們才會反復強調(diào)：AI 的未來，不僅僅屬于模型研究人員，也屬于系統(tǒng)工程師、電力工程師、網(wǎng)絡工程師，以及所有參與構建這一基礎設施的人。只有當整個系統(tǒng)協(xié)同進化，AI 才能真正走向規(guī)?；瘧?。

當這些計算平臺真正具備規(guī)模之后，一個新的問題就擺在我們面前：這些能力，究竟要以什么形式被使用？

并不是所有 AI 都應該運行在同一個地方。有些 AI 需要運行在超大規(guī)模的數(shù)據(jù)中心中，用來訓練前沿模型、進行復雜規(guī)劃和長期推理；有些 AI 需要運行在企業(yè)自己的數(shù)據(jù)中心里，靠近私有數(shù)據(jù)和業(yè)務系統(tǒng)；還有一些 AI，必須運行在本地設備、工廠、醫(yī)院、汽車和機器人中，進行實時決策。

因此，AI 的未來，一定是多層次的。

這也是為什么，我們在設計整套平臺時，從一開始就假設：AI 會同時存在于云端、企業(yè)內(nèi)部和邊緣側。這并不是權宜之計，而是一種必然結果。數(shù)據(jù)的生成地點，決定了計算的部署位置；延遲、安全、合規(guī)性，這些現(xiàn)實因素，決定了 AI 不可能被集中在某一個地方。

在云端，我們與全球幾乎所有主要的云服務商合作。這些云平臺，正在成為前沿模型訓練與大規(guī)模推理的核心載體。而在這些云中運行的，并不僅僅是“通用 AI”，而是越來越多針對行業(yè)定制的模型與系統(tǒng)。

在企業(yè)側，我們看到一種非常明確的趨勢：企業(yè)并不想把最核心的數(shù)據(jù)完全交給外部。它們希望在自己的環(huán)境中，構建、運行并控制 AI。這催生了所謂的企業(yè) AI 工廠——一個專門用來訓練、微調(diào)、部署和運營 AI 的基礎設施。

在這種架構下，企業(yè)不再只是“使用 AI”，而是開始擁有 AI。它們可以把自身幾十年積累的數(shù)據(jù)、流程和知識，轉化為獨有的智能能力，而這正是 AI 真正產(chǎn)生長期價值的方式。

而在越來越多的國家，我們還看到了另一種需求：主權 AI（Sovereign AI）。

每一個國家，都擁有自己的語言、文化、法律體系和社會結構。它們也擁有自己的數(shù)據(jù)資源和戰(zhàn)略目標。

因此，越來越多的國家意識到：如果 AI 成為未來的基礎能力，那么它就不應該完全依賴外部。一個國家必須能夠在本土訓練模型、運行模型、控制數(shù)據(jù)，并確保這些系統(tǒng)符合本國的價值觀和法律體系。

這并不是一個技術問題，而是一個國家級基礎設施問題。

而主權 AI 的實現(xiàn)，離不開強大的本地計算能力、開放的模型生態(tài)，以及完整的工具鏈。這正是我們在多個國家與政府、科研機構和本地企業(yè)合作的原因。我們的目標，并不是替代任何人，而是賦能各個地區(qū)，構建屬于他們自己的 AI 能力。

當你把云、企業(yè)、本地和主權 AI 放在一起看，就會發(fā)現(xiàn)：AI 并不是一個單一形態(tài)的產(chǎn)品，而是一整套分布式智能系統(tǒng)。

而支撐這套系統(tǒng)運行的，正是我們前面所講的那整套計算平臺、網(wǎng)絡體系和軟件工具。無論 AI 運行在哪里，它們背后遵循的都是同樣的原則：高效的數(shù)據(jù)流動、可預測的性能、可擴展的架構，以及長期可持續(xù)的運行能力。

這也是為什么，我們并不是在“賣芯片”，而是在構建一個完整的 AI 基礎設施生態(tài)。

當 AI 真正離開屏幕、進入現(xiàn)實世界時，一切都會變得更加具體，也更加嚴苛。因為在物理世界中，錯誤是有成本的，延遲是不可接受的，系統(tǒng)必須在復雜、不確定、持續(xù)變化的環(huán)境中穩(wěn)定運行。這正是為什么，汽車與機器人，會成為物理 AI 最重要、也最具代表性的落地場景。

先從汽車開始。自動駕駛，本質上并不是一個“視覺識別問題”，而是一個完整的物理 AI 系統(tǒng)。它需要實時感知環(huán)境、理解三維空間結構、預測其他參與者的行為，并在極短時間內(nèi)做出安全決策。這些能力，并不是通過規(guī)則堆疊實現(xiàn)的，而是通過大規(guī)模數(shù)據(jù)訓練、仿真和持續(xù)學習逐步獲得的。

因此，我們從一開始就把自動駕駛視為一個端到端的 AI 系統(tǒng)工程。從車端的感知與推理，到數(shù)據(jù)中心中的訓練與仿真，再到模型的持續(xù)迭代，這是一條完整的閉環(huán)。

汽車在現(xiàn)實世界中行駛，每一天都會產(chǎn)生海量數(shù)據(jù)；這些數(shù)據(jù)被送回數(shù)據(jù)中心，用于訓練更好的模型；而更好的模型，再被部署回車輛之中。這正是 AI 在物理世界中不斷進化的方式。

機器人也是如此，甚至更加復雜。

一個機器人面對的，并不是結構化的道路環(huán)境，而是高度多樣化、充滿不確定性的真實空間。地面可能是光滑的，也可能是松軟的；物體可能是剛性的，也可能是柔性的；人類的行為更是難以預測。在這樣的環(huán)境中，機器人如果只依賴預先編程的動作，是不可能規(guī)?；?。

因此，我們必須讓機器人具備真正的感知、推理和學習能力。

這也是為什么，我們在機器人領域構建的，不是某一個單點模型，而是一整套系統(tǒng)：從感知模型到運動模型，從世界建模到策略規(guī)劃，再到在仿真環(huán)境中進行大規(guī)模訓練。機器人并不是被“寫”出來的，而是被“訓練”出來的。它們通過在虛擬世界中反復嘗試、失敗和修正，逐步學會如何在現(xiàn)實世界中行動。

在這個過程中，仿真扮演著至關重要的角色。

現(xiàn)實世界的數(shù)據(jù)是昂貴的、緩慢的，而且充滿風險；而仿真世界則可以被無限復制、加速和控制。通過高保真的物理仿真，我們可以在虛擬環(huán)境中生成海量訓練數(shù)據(jù)，讓機器人和自動駕駛系統(tǒng)在“安全的失敗”中不斷學習。這正是為什么，我們把仿真視為物理 AI 的核心基礎設施之一。

而當這些系統(tǒng)真正開始工作時，你會發(fā)現(xiàn)一個非常重要的事實：物理 AI 從來不是單點部署的。它們總是運行在一個端云協(xié)同的體系中。機器人在本地進行實時感知與決策，而更復雜的規(guī)劃、模型更新和策略學習，則發(fā)生在云端或數(shù)據(jù)中心中。這種協(xié)同，是物理 AI 唯一可行的運行方式。

正因為如此，我們才會看到，越來越多的行業(yè)開始真正擁抱物理 AI。制造業(yè)、物流、醫(yī)療、能源、農(nóng)業(yè)，這些領域都存在著大量需要“理解世界并采取行動”的任務。AI 在這些場景中的價值，并不體現(xiàn)在生成一段文本，而體現(xiàn)在提高效率、降低風險、擴展人類能力。

而這一切的前提，是我們必須擁有足夠強大、足夠可靠的計算平臺，來支撐這些系統(tǒng)長期運行。物理 AI 不是一次性的部署，而是一項持續(xù)數(shù)十年的工程。系統(tǒng)必須可以更新、可以擴展、可以在真實世界中不斷學習和進化。

當我們把所有這些變化放在一起看，就會意識到：人工智能并不是一個短期趨勢，而是一場長期、結構性的產(chǎn)業(yè)重構。它不僅改變了軟件如何被編寫，也改變了硬件如何被設計，更改變了企業(yè)如何運作、國家如何建設基礎設施，以及人類如何與技術協(xié)作。

我們正在進入一個新的階段。在這個階段里，AI 不再只是提升效率的工具，而是一種新的生產(chǎn)要素。它像電力一樣，成為所有行業(yè)的基礎能力；又像互聯(lián)網(wǎng)一樣，重塑了信息、服務和價值的流動方式。而與以往任何一次技術革命不同的是，這一次，AI 正在同時重構數(shù)字世界與物理世界。

這意味著，未來十年中，幾乎每一個行業(yè)，都會被重新發(fā)明。制造、物流、交通、醫(yī)療、能源、金融、科研——這些領域中的工作方式，將不再以“人如何操作機器”為核心，而是轉向“人如何與智能系統(tǒng)協(xié)同”。AI 將承擔越來越多的認知與執(zhí)行任務，而人類則專注于創(chuàng)造、判斷與價值選擇。

從產(chǎn)業(yè)的角度看，這也是一個規(guī)模前所未有的機會。我們看到，全球范圍內(nèi)正在形成一個新的產(chǎn)業(yè)基礎——AI 工廠。這些工廠并不生產(chǎn)實體商品，而是生產(chǎn)智能本身：模型、推理能力、決策系統(tǒng)和自動化流程。它們需要巨大的計算能力、穩(wěn)定的能源供應、先進的網(wǎng)絡體系，以及高度專業(yè)化的軟件工具。

正是在這樣的背景下，我們判斷：未來十年，將是AI 基礎設施建設的黃金十年。這不僅僅是關于芯片或服務器的需求增長，更是關于整個系統(tǒng)——從數(shù)據(jù)中心到邊緣設備，從云端到本地，從模型到應用——的全面升級。

而在這一過程中，有一點至關重要：這場變革必須是開放的。

如果 AI 只掌握在少數(shù)人手中，它就無法真正釋放潛力；如果 AI 無法被各行各業(yè)、各個國家所使用，它就不可能成為真正的基礎能力。

因此，我們始終堅持一個原則：推動開放的平臺、開放的模型、開放的生態(tài)。我們希望看到的是一個多樣化的 AI 世界——不同的模型、不同的架構、不同的應用，共同推動智能向前發(fā)展。

對我們來說，這并不是一條容易的路。構建這樣的系統(tǒng)，需要巨大的投入、長期的耐心，以及跨越多個學科的協(xié)作。

但這也是一條值得走的路。

因為我們相信，人工智能最終的價值，不在于替代人類，而在于擴展人類的能力；不在于制造更多的工具，而在于幫助人類解決那些過去無法解決的問題。

這正是我們在英偉達每天所做的事情。也是我們對未來十年，最堅定的信念。

謝謝大家。新年快樂。
歡迎來到 AI 的新時代。

前沿動態(tài)前沿大會

前沿人物

點「在看」，給前前加雞腿

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.