国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

CES2026黃仁勛: AI應用重寫一切, Vera Rubin全面投產(chǎn), 物理AI進入“ChatGPT 時刻”倒計時 | 前沿在線

0
分享至


在 CES 2026 的舞臺上,黃仁勛并沒有急于用某一款產(chǎn)品“點燃情緒”。

這場長時間的主題演講,更像一次系統(tǒng)性的時代復盤與方向校準:從 AI 平臺的根本性轉變,到 Agent 架構、物理 AI、自動駕駛、機器人,再到算力、網(wǎng)絡、存儲與能源效率,英偉達試圖回答的不是“下一代芯片有多強”,而是——未來十年,計算與智能將如何被重新組織。


(完整實錄見文末)

編輯:前沿在線 編輯部

拉斯維加斯,新年快樂。

NVIDIA 創(chuàng)始人兼 CEO 黃仁勛一上臺就把 CES 的現(xiàn)場氛圍點燃:這個可容納 3000 人的禮堂坐滿了人,外場還有 2000 人圍觀,甚至樓上也擠滿了觀眾。


黃仁勛笑稱,自己“帶了 15 公斤材料要講”,而全世界將有數(shù)以百萬計的人通過直播一起進入 2026 的開年第一場科技主題演講。

但這場演講的核心并不是“熱鬧”,而是一個更明確的信號計算產(chǎn)業(yè)又一次來到平臺重置點,而且這一次是“雙平臺轉換”同時發(fā)生。


每 10~15 年一次平臺重置:這一次,AI 讓“軟件本身”變了

黃仁勛把計算產(chǎn)業(yè)的歷史復盤了一遍:從主機到 PC、PC 到互聯(lián)網(wǎng)、互聯(lián)網(wǎng)到云、云到移動……每一次平臺轉換,都會帶來一次應用世界的重寫。

而今天發(fā)生的變化更徹底:不僅平臺在變,應用的構建方式也在變。


過去我們寫軟件、編譯軟件、讓軟件運行在 CPU 上;今天我們在 GPU 上運行模型,應用不再是“預先寫好的邏輯”,而是能理解上下文、并在每一次交互中從頭生成內(nèi)容——生成每一個像素、每一個 token。

黃仁勛用“計算五層堆?!眮砀爬ㄟ@種變化:從硬件到系統(tǒng)到軟件再到應用,整個堆棧正在被 AI 重新塑形。這意味著過去十多年累計的、以“經(jīng)典計算方式”為基礎的巨大技術資產(chǎn)——他用“十萬億美元級別”來形容——正在被整體現(xiàn)代化。

錢從哪里來?黃仁勛給出的答案很直接:來自各行各業(yè)的研發(fā)預算遷移。經(jīng)典方法的預算正在轉向 AI 方法,這就是這波 AI 現(xiàn)代化的燃料。


從 ChatGPT 到“推理模型”,再到 Agent:2025 的關鍵轉折已經(jīng)發(fā)生

黃仁勛把 2025 形容為“不可思議的一年”,因為一切都像同時發(fā)生。

他回顧了幾個關鍵節(jié)點:
2015 年左右,語言模型開始真正產(chǎn)生影響;

2017 年 Transformer 出現(xiàn);

2022 年“ChatGPT 時刻”讓世界被喚醒;

而一年后,一個重要的新階段到來——推理模型開始成為主角。


他重點提到一種思路:測試時擴展(test-time scaling)。直白說,就是AI 不僅在訓練前學習、訓練后再用強化學習學技能;在推理階段,它也需要“實時思考”——思考越多、計算越大、答案通常越好。

緊接著,2024~2025 年,代理系統(tǒng)(Agent)開始遍地開花:它能查找信息、做研究、使用工具、規(guī)劃未來、模擬結果,開始解決“以前不可能由一個模型獨立完成”的重要問題。

黃仁勛還點名了一個“他很喜歡的代理工具”:Cursor。他說它徹底改變了 NVIDIA 內(nèi)部的軟件編程方式。


AI不只有語言:物理 AI、世界模型與“開放模型的大爆發(fā)”

黃仁勛強調(diào),大語言模型并不是宇宙中唯一重要的信息形態(tài)。只要世界里存在結構,就可以訓練一種“語言模型式”的系統(tǒng)去理解它的表示并形成智能。

其中最關鍵的一類,是理解自然規(guī)律的物理 AI:它不僅要理解物理定律,還要能與物理世界互動。


而 2025 年另一個最重要的事件,是開放模型的進步與爆發(fā)。黃仁勛認為:一旦開源、開放創(chuàng)新全面啟動,智能會在任何地方激增——每個公司、每個行業(yè)、每個國家,都能同時被激活。

他特別提到一個讓世界震驚的開放推理系統(tǒng)進展,并用“它激活了整個運動”來形容開源推理浪潮的引爆效應。

在他看來,開放模型已經(jīng)逼近前沿:也許仍落后幾個月,但每隔幾個月就會出現(xiàn)新一代進展,下載量呈爆炸式增長——因為創(chuàng)業(yè)公司、研究者、學生、甚至國家都想?yún)⑴c這場革命。


NVIDIA 為什么自己建 AI 超算:DGX Cloud、開源模型與Nemo 全家桶

黃仁勛提到,幾年前 NVIDIA 開始構建并運營自己的 AI 超級計算機體系(DGX Cloud)。外界常問:你們要做云嗎?他的回答是否定的——它是為 NVIDIA 自己而建,用來做前沿模型研發(fā)。


他舉了很多例子:數(shù)字生物學、蛋白質結構理解與生成、地球與天氣預測相關模型、以及一些“能長時間思考或快速思考”的新架構探索。

更關鍵的是,他強調(diào)NVIDIA 不只是開源模型,還開源訓練這些模型的一套體系包括用于數(shù)據(jù)處理、數(shù)據(jù)生成、訓練、評估、護欄到部署的生命周期管理庫——他稱之為 Nemo 系列庫,并延展到物理、醫(yī)療、生物等不同領域版本。


他把 NVIDIA 定位成一種“前沿 AI 模型構建者”,并強調(diào)他們以“盡可能開放”的方式構建,讓每家公司、每個行業(yè)、每個國家都能參與 AI 革命。


Agent 的真正形態(tài):多模型、多云、混合部署,以及“意圖路由器”

黃仁勛把“現(xiàn)代 AI 應用的基本架構”講得非常直白:未來的 AI 應用天然就是多模態(tài)(語音、圖像、文字、視頻、3D、甚至蛋白質),也天然是多模型的——因為不同任務需要不同模型。


因此,它也必然是多云的、混合云的:有的模型在云端,有的要跑在企業(yè)內(nèi)網(wǎng),有的要在邊緣設備上,甚至要在醫(yī)院、基站或機器人本體旁邊跑,以獲得實時數(shù)據(jù)與低延遲。

在這個框架里,他提出一個關鍵組件:基于意圖的模型路由器。路由器像一個“經(jīng)理”,決定哪個任務該調(diào)用哪個模型:該留在本地執(zhí)行的就留在本地,需要最強前沿模型的再去調(diào)用云端。


他順勢給了一個輕量但完整的示例:做一個個人助理,處理日歷、郵件、待辦事項,甚至連接家里的設備。為了保護隱私,郵件相關任務可以調(diào)用本地運行的開放模型;其它任務再調(diào)用前沿模型 API。


現(xiàn)場還演示了一個“會說話的小機器人助理”,能把待辦事項同步給 Jensen,能把草圖生成建筑渲染并做視頻導覽,還能遠程看家、提醒寵物不要上沙發(fā)。

黃仁勛用一句話概括這種震撼感:幾年之前這幾乎不可想象,而現(xiàn)在“已經(jīng)變得微不足道”。


他隨后點名了多家企業(yè)平臺合作,核心意思是:這種 Agent 架構不僅改變開發(fā)方式,也將成為企業(yè)平臺的全新交互界面——從“填表格、點按鈕”轉向“像與人對話那樣使用系統(tǒng)”。


下一站:物理 AI。三臺計算機、Omniverse、Isaac,以及 Cosmos 的合成數(shù)據(jù)路線

如果說 Agent 是“軟件世界的重構”,那黃仁勛認為,物理 AI將把 AI 從屏幕帶進真實世界。

他強調(diào),物理 AI 的難點在于“常識”——物體恒常性、因果關系、摩擦力與重力、慣性……對孩子是常識,對 AI 卻是未知。要讓 AI 學會這些規(guī)律,必須構建一整套系統(tǒng)。


他用“三臺計算機”描述物理 AI 的基礎架構:
一臺用于訓練,一臺用于推理部署,還有一臺專門用于模擬——因為沒有模擬,就無法評估動作與世界反應的一致性,數(shù)據(jù)也永遠不夠。

在 NVIDIA 的體系里,模擬是核心:Omniverse 是數(shù)字孿生與基于物理的仿真世界;Isaac Sim / Isaac Lab 是機器人學習與訓練的關鍵環(huán)境;而數(shù)據(jù)上最大的突破,是把計算變成數(shù)據(jù):通過基于物理規(guī)律的合成數(shù)據(jù)生成,規(guī)?;圃煊柧殬颖?,覆蓋長尾與邊緣情況。


黃仁勛在演講中拋出了一個更強的判斷:物理 AI 的 ChatGPT 時刻即將到來。

因為現(xiàn)實世界的數(shù)據(jù)收集太慢、太貴、永遠不夠,答案只能是合成數(shù)據(jù),而這一切在 Cosmos 上開始成型。


自動駕駛的“推理 AI”:AlphaMyo 與端到端訓練、可解釋駕駛

演講的另一條重要線索,是自動駕駛。


黃仁勛宣布了AlphaMyo,強調(diào)它是端到端訓練的自動駕駛 AI:從攝像頭輸入到控制輸出,訓練數(shù)據(jù)包含人類示范駕駛與 Cosmos 生成的大規(guī)模合成里程,再疊加大量精細標注樣本。


他特別強調(diào)一個“可解釋性”的點:AlphaMyo 不只是“做動作”,它會解釋它將采取什么行動、為什么這么做,并把行動與軌跡耦合起來。

這在長尾駕駛場景里尤其關鍵——你不可能收集世界上每一個國家、每一種極端情況的真實數(shù)據(jù),但如果能把復雜長尾拆解成若干常見的物理交互片段,推理系統(tǒng)就可能在未見過的情境下做出合理決策。


他還談到NVIDIA 為什么做自動駕駛:因為 AI 會重塑整個計算堆棧,NVIDIA 必須理解并構建從芯片到基礎設施到模型到應用的完整系統(tǒng)能力,才能引導產(chǎn)業(yè)走向未來。


在他的敘述里,車就是“機器人系統(tǒng)”的一種:它需要為安全設計的處理器、冗余的傳感器體系、可追蹤的全棧軟件,以及一個在低置信場景會回退到更安全護欄系統(tǒng)的“雙堆棧鏡像”策略。


機器人登場:在 Omniverse 里學會成為機器人

接下來,他把鏡頭轉向更廣義的機器人產(chǎn)業(yè):機械臂、移動機器人、人形機器人……尺寸不同、形態(tài)不同,但核心問題相似——都需要物理 AI、仿真與數(shù)據(jù)。


現(xiàn)場還出現(xiàn)了多個機器人“朋友”,他開玩笑說“沒有誰像你們這么可愛”,并強調(diào) Isaac、Omniverse 這類訓練體系,會成為未來機器人產(chǎn)業(yè)的通用底座。


把物理 AI 帶進工業(yè):Cadence / Synopsys / Siemens,工業(yè)生命周期的 AI 化

黃仁勛把物理 AI 的落點指向工業(yè)體系:EDA、系統(tǒng)設計、系統(tǒng)仿真、工廠制造與生產(chǎn)線。


他點到 Cadence 和 Synopsys 在芯片設計世界中的核心地位,并提出一種未來圖景:


未來我們不僅會有“代理軟件工程師”,還會有“代理芯片設計師”和“代理系統(tǒng)設計師”。芯片會在電腦里設計,系統(tǒng)會在電腦里仿真,工廠產(chǎn)線會在電腦里搭建并測試——在真正落到重力世界之前,先在數(shù)字世界完成大部分驗證。


隨后他引出 Siemens 的合作內(nèi)容:將 NVIDIA CUDA-X 庫、AI 模型與 Omniverse 納入其工業(yè)軟件產(chǎn)品組合,把物理 AI 帶入整個工業(yè)生命周期——從設計與仿真,到生產(chǎn),再到運營。他把這稱為“新工業(yè)革命的起點”。


Vera Rubin:為 AI 新前沿而生的下一代計算平臺(以及為什么必須“極端協(xié)同設計”)

演講后半段,黃仁勛把重頭戲交給了新一代平臺:Vera Rubin


他先講了“為什么叫 Vera Rubin”:這位天文學家通過星系旋轉曲線的異常發(fā)現(xiàn)暗物質存在。


黃仁勛借此引出“看不見但影響巨大的東西”,并把它對應到 AI時代的計算挑戰(zhàn):模型規(guī)模與推理計算暴漲,token 生成量爆發(fā),成本競爭每年劇烈下探——一切最終都變成計算問題。


在他看來,摩爾定律放緩意味著:單靠工藝進步,不可能跟上模型規(guī)模的增長與 token 需求的增長。要跟上,行業(yè)必須做“極端協(xié)同設計”——同時在整個堆棧的所有關鍵芯片上創(chuàng)新。

因此,這一代他們幾乎“別無選擇”,只能重新設計每一個芯片與系統(tǒng)組件。黃仁勛強調(diào):僅僅系統(tǒng)里每一個芯片拿出來都可以單獨開發(fā)布會


他在臺上展示了多個實物部件,講到了 CPU 與 GPU 的聯(lián)合設計、極高的 I/O 能力、以及在張量計算上通過新型數(shù)值/引擎實現(xiàn)的吞吐與精度平衡

除此之外,他還用大量篇幅談到數(shù)據(jù)中心系統(tǒng)工程:

從“線纜地獄”到“零線纜”、從兩小時組裝到五分鐘、從風冷到全液冷、熱水冷卻(45℃)仍能保持高能效;


以及 Spectrum-X 以太網(wǎng)在 AI 時代的關鍵作用、BlueField DPU 在虛擬化與安全卸載上的角色、NVLink 交換與超高帶寬互聯(lián)在“讓每個 GPU 同時與所有 GPU 交流”上的意義。


他給出了一個很具沖擊力的系統(tǒng)性判斷:在千兆瓦級 AI 工廠里,網(wǎng)絡每提升一點吞吐都可能對應數(shù)十億美元的價值;因此網(wǎng)絡能力不是“配角”,而是 AI 工廠的關鍵生產(chǎn)力。


他最后用一組“給造 AI 超算的人看的圖表”來總結 Vera Rubin 的意義:訓練吞吐、工廠吞吐、token 成本、能效與成本效益,都被推到了下一階段。


他把這歸結為NVIDIA 的新定位從“做芯片的公司”,變成“構建完整 AI 堆棧的公司”,覆蓋從芯片到基礎設施、從模型到應用的全鏈路重構。


黃仁勛的“失控花絮”與 CES 的真實感

演講結束前,黃仁勛還放了一段“外景/花絮”式的片段:麥克風、攝像、滑稽的臺詞、卡頓的幻燈片、現(xiàn)場的笑點……他說有一堆內(nèi)容不得不剪掉,但正是這些不完美,讓 CES 的現(xiàn)場變得更“人類”。


在一片喧鬧與掌聲里,他以一句樸素的收束結束了當天的敘事:NVIDIA 的工作,是把整個堆棧搭出來,讓所有人都能在此之上創(chuàng)造應用,推動 AI 進入下一個前沿。

完整實錄如下:

大家好,拉斯維加斯,新年快樂。

歡迎來到 CES。我們今天在這里,其實要“塞進來”的內(nèi)容非常多,大概有15 公斤那么重。但能在現(xiàn)場看到你們所有人,我真的非常開心。

此刻,這個主會場里坐著3000 人。外面的庭院,還有2000 人在同步觀看。據(jù)我所知,四樓原本用于視頻轉播的區(qū)域里,也還有1000 人在看這場演講。

基本上,整棟樓的每一層,都在觀看這場主題演講。當然,還有全世界數(shù)以百萬計的人,正通過直播,與我們一起開啟新的一年。

10 到 15 年,計算機產(chǎn)業(yè)就會迎來一次平臺級重置。

我們經(jīng)歷過這樣的周期:大型機個人電腦;個人電腦互聯(lián)網(wǎng)互聯(lián)網(wǎng)云計算;再從云計算移動計算。

每一次變化,都會誕生一個全新的平臺。而所謂“平臺遷移”,真正的含義在于:應用的目標發(fā)生了改變。你不再是為舊的計算機寫程序,而是為一套全新的計算范式,重新構建應用。

但這一次,情況有些不同。這一次,并不是一次平臺遷移,而是兩次平臺遷移,同時發(fā)生。第一條遷移路徑,是我們正在從“傳統(tǒng)應用”,走向AI 原生應用

一開始,人們以為“AI 本身就是應用”。而事實上,AI 確實是應用的一種。但更重要的是:我們正在把應用構建在 AI 之上。AI 正在成為新的應用運行平臺。

而第二條遷移路徑,則更加根本。它不是“你做什么應用”,而是“你如何開發(fā)軟件、如何運行軟件”。整個計算產(chǎn)業(yè)的五層技術棧,正在被徹底重塑。

在這個新世界里:你不再是“編程”軟件,而是訓練軟件。你不再主要運行在 CPU 上,而是運行在GPU上。

過去,應用是預先寫好、預先編譯的,然后在設備上執(zhí)行;而現(xiàn)在,應用能夠理解上下文,并且在每一次運行時,從零生成每一個像素、每一個 token

也就是說——每一次運行,都是一次全新的生成。正因為加速計算的出現(xiàn),正因為人工智能的出現(xiàn),整個計算體系正在被從底層到頂層,全部重建。這五層“計算蛋糕”的每一層,如今都在被重新發(fā)明。

這意味著什么?這意味著,在過去十年中,大約10 萬億美元規(guī)模的傳統(tǒng)計算基礎設施,正在被整體現(xiàn)代化,遷移到這種全新的計算方式之中。

這也解釋了為什么:每一年,有數(shù)千億美元的風險投資,持續(xù)流入這個行業(yè);為什么,一個總規(guī)模達到100 萬億美元的產(chǎn)業(yè),其中相當比例的研發(fā)預算,正在從傳統(tǒng)方法,轉向人工智能方法。

人們經(jīng)常問我:“這些錢到底是從哪里來的?”答案就在這里。它們來自于:對既有計算體系的現(xiàn)代化改造;來自于研發(fā)預算從傳統(tǒng)路徑,轉向 AI 路徑;來自于整個世界,正在押注一種全新的計算范式。

這就是為什么,我們會如此忙碌。而過去這一年,也完全不例外。

過去這一年,真的非常不可思議。很多事情幾乎是在同一時間同時發(fā)生的?;仡^看,它們并不是巧合,而是一次集中式的技術躍遷。

首先發(fā)生的,是規(guī)模定律(scaling laws)的持續(xù)推進。如果回到 2015 年,我第一次看到一個真正可能改變世界的語言模型。它叫BERT。那是第一次讓我意識到,自然語言模型不只是一個研究方向,而是一種即將改變計算方式的技術。

隨后,在2017 年,Transformer 架構出現(xiàn)了。但直到五年之后,也就是 2022 年,我們才真正迎來了那個被稱為 “ChatGPT 時刻”的轉折點。

那一刻,世界第一次被真正喚醒。人們開始意識到,人工智能不只是一個工具,而是一種全新的能力平臺。

而在那之后,又發(fā)生了一件極其重要的事情。

大約一年后,ChatGPT 推出了第一個O1 推理模型。那是第一個真正意義上的“推理模型”。

它并不是簡單地生成答案,而是在生成答案之前,進行內(nèi)部推理。這一次突破,幾乎是革命性的。

它引入了一個新的概念,叫做測試時擴展(test-time scaling)。

從直覺上講,這其實非常符合常識。我們不僅在預訓練階段讓模型學習知識,
也在后訓練階段通過強化學習,讓模型學會技能,而現(xiàn)在,我們進一步讓模型在推理階段進行“思考”。

換句話說:模型開始在實時運行中,動態(tài)地分配計算資源,用于推理本身。

而這三種階段——預訓練、后訓練、測試時推理——每一個階段,都需要極其龐大的計算資源。

計算定律并沒有停止。大語言模型仍在持續(xù)變得更強。與此同時,另一個重要突破出現(xiàn)了。這個突破,發(fā)生在2024 年,并在2025 年開始迅速擴散、全面滲透。

那就是:智能體系統(tǒng)(Agentic Systems)的出現(xiàn)。智能體模型,具備一整套全新的能力。

它們能夠推理,能夠查找信息,能夠做研究,能夠使用工具,能夠規(guī)劃未來,能夠模擬不同結果。

突然之間,AI 開始能夠解決一大類過去幾乎無法自動化的重要問題。在英偉達內(nèi)部,我個人最喜歡的一個智能體模型,叫做Cursor。

它幾乎徹底改變了我們在英偉達內(nèi)部進行軟件開發(fā)的方式。

而這,僅僅是開始。從現(xiàn)在開始,智能體系統(tǒng)將真正迎來爆發(fā)式增長

當然,我們也很清楚一件事:大語言模型并不是信息世界的全部。信息并不只存在于文本之中。

只要這個世界中存在信息,存在結構,存在規(guī)律,我們就可以訓練一種“語言模型”,去理解這種信息的表示方式,并把它轉化為 AI。

換句話說,語言模型并不局限于語言。

只要世界中存在“可學習的結構”,就存在 AI 的空間。在所有這些方向中,最重要、也最具挑戰(zhàn)性的一個方向,就是——物理 AI(Physical AI)。

物理 AI,是理解自然規(guī)律的 AI。它不是只理解符號、文本或圖像,而是理解這個世界如何真實運作。

當然,物理 AI 的核心,并不僅僅在于“理解”。更重要的是——與世界交互。當 AI 不再只存在于屏幕中,而是開始與現(xiàn)實世界發(fā)生互動時,一切都會改變。

這里,我們需要區(qū)分兩個相關但不同的概念。

第一種,物理 AI。也就是那些能夠感知、決策、并與物理世界互動的 AI 系統(tǒng),比如機器人、自動駕駛汽車等。

第二種,AI Physics(物理規(guī)律 AI)。這是理解物理定律本身的 AI,能夠學習和推斷自然界的基本規(guī)則。

這兩者是相互配合的。

一個與世界互動的 AI,需要理解物理規(guī)律;而一個理解物理規(guī)律的 AI,最終也必須被用來指導真實世界中的行動。

而在過去一年中,最重要、也最令人振奮的另一件事情,是開放模型的全面進展。

當模型是開放的,當創(chuàng)新是開放的,當每一家企業(yè)、每一個行業(yè)、每一個國家,都能夠在同一時間參與進來,人工智能就不可能只屬于少數(shù)人。

正是在這種背景下,AI 才會真正實現(xiàn)無處不在的普及。

去年,開放模型真正迎來了爆發(fā)。

其中一個最具代表性的事件,是DeepSeek R1的發(fā)布。這是第一個真正意義上的開放推理模型。

它讓整個世界感到震驚。

不僅因為它的性能,更因為它證明了一件事:推理能力,并不一定只存在于封閉模型中。

DeepSeek R1 的出現(xiàn),幾乎點燃了整個開放模型生態(tài)。一個真正的開放 AI 運動,就此被激活。

從那之后,我們看到世界各地涌現(xiàn)出各種各樣的開放模型系統(tǒng)。不同架構、不同規(guī)模、不同目標,但共同點只有一個:開放正在加速智能的擴散

我們現(xiàn)在已經(jīng)可以非常確定地說:開放模型,已經(jīng)觸及 AI 的技術前沿。

是的,它們?nèi)匀宦浜笥谧钋把氐姆忾]模型,大約六個月左右。但每過六個月,就會有新的開放模型出現(xiàn),而且它們變得越來越聰明。

正因為如此,你可以看到一個非常明顯的現(xiàn)象:下載量正在爆炸式增長

初創(chuàng)公司希望參與 AI 革命;大型企業(yè)希望構建自己的能力;研究人員希望探索新的邊界;學生希望學習;幾乎每一個國家,都希望參與其中。

因為一個問題擺在所有人面前:數(shù)字形態(tài)的智能,怎么可能把任何人留在身后?正是在這樣的背景下,開放模型在過去一年中,真正重塑了人工智能產(chǎn)業(yè)。而這,也正是我們在英偉達很早之前就隱約意識到的一件事。

幾年前,你們可能聽說過,我們開始自己構建并運營 AI 超級計算機。我們把它們稱為DGX Cloud。當時,很多人問我們:“你們是不是要進入云計算業(yè)務?”答案是否定的。

我們構建這些 DGX 超級計算機,并不是為了成為云服務商,而是為了我們自己使用。

事實證明,這是一個非常正確的決定。如今,我們已經(jīng)在全球范圍內(nèi),運營著價值數(shù)十億美元的 AI 超級計算機集群它們的核心用途之一,就是用于開發(fā)開放模型。

我對這項工作的進展感到非常自豪。因為它正在吸引來自世界各地、各個行業(yè)的關注。

原因很簡單:我們正在多個不同領域,同時推進前沿 AI 模型的研究。

在這樣的基礎之上,我們構建的這些模型,不僅是前沿級的,而且在客觀評測中同樣處于世界領先位置。我們在多個排行榜上長期名列前茅,這也是我們非常自豪的一點。

這些模型覆蓋了多個關鍵方向:它們能夠理解多模態(tài)文檔——也就是我們每天最常見、也最有價值的內(nèi)容載體,PDF。世界上大量重要的信息都被封裝在 PDF 中,但只有借助人工智能,我們才能真正理解其中的結構、語義和含義,幫助人類高效閱讀與使用這些內(nèi)容。

我們的 PDF 檢索模型、PDF 解析模型,都處于世界一流水平。

與此同時,我們的語音識別模型同樣是世界級的;我們的檢索模型,本質上就是現(xiàn)代 AI 時代的語義搜索與 AI 搜索引擎,其能力也同樣位居全球前列。我們幾乎在所有關鍵基準上,都處在領先位置,而這一切,最終都是為了一個目標——讓你們能夠真正構建 AI 智能體。

這正是一個極其關鍵、也是極具突破性的階段。

回想 ChatGPT 剛出現(xiàn)的時候,很多人都會說:“它生成的結果很有意思,但經(jīng)常會出現(xiàn)幻覺。”而幻覺的根源其實并不復雜。模型可以記住過去,卻不可能記住現(xiàn)在和未來發(fā)生的一切。

因此,如果它沒有被扎根在現(xiàn)實信息之中,沒有在回答問題之前進行檢索、查證和推理,就必然會產(chǎn)生不可靠的輸出。

真正重要的能力,在于模型能否判斷:我現(xiàn)在是否需要做研究?是否需要調(diào)用工具?是否需要把一個復雜問題拆解成多個步驟?而這些步驟本身,又是否是模型已經(jīng)學會、可以勝任的任務。

當模型具備了這種能力之后,它就可以把這些步驟組合成一個完整的行動鏈條,去完成一件它從未被直接訓練過的事情。這正是“推理”的本質,也是智能體真正令人驚嘆的地方。

人類也是如此。我們經(jīng)常會遇到從未經(jīng)歷過的情境,但我們可以把它拆解成一系列我們熟悉的規(guī)則、經(jīng)驗和知識,并據(jù)此做出判斷和行動。

如今,AI 模型終于開始具備類似的能力。這種推理能力,為無數(shù)新的應用場景打開了大門。我們不再需要在第一天就教會 AI 一切;就像人類一樣,它可以在面對具體問題時,通過推理找到解決路徑。

大語言模型在這一點上實現(xiàn)了真正的飛躍——強化學習、思維鏈、搜索、規(guī)劃,這一整套方法體系,讓這種能力第一次變得系統(tǒng)化、可工程化,而且現(xiàn)在,這些能力也正在被逐步開源。

而真正讓我感到震撼的,是另一個關鍵突破。我第一次清楚意識到這一點,是在看到Aravind創(chuàng)辦的Perplexity時。

Perplexity 是一家做 AI 搜索的公司,非常具有創(chuàng)新性。當我意識到他們在同一個推理鏈條中,同時調(diào)用多個模型時,我覺得這簡直是天才般的設計。

仔細想想,這其實再合理不過了:如果 AI 要解決一個復雜問題,為什么不在推理的不同階段,調(diào)用世界上最適合那個任務的 AI 呢?

這正是為什么,現(xiàn)代 AI 天生就是多模態(tài)的——它理解語音、圖像、文本、視頻、三維結構,甚至蛋白質;

同時,它也是多模型的——它會根據(jù)任務選擇最合適的模型;它天然是多云的,因為這些模型分布在不同的地方;同時,它也必然是混合云的

如果你是一家企業(yè),或者你正在構建一臺機器人,那么有些計算發(fā)生在云端,有些發(fā)生在邊緣,有些發(fā)生在工廠,有些發(fā)生在醫(yī)院——數(shù)據(jù)必須就在你身邊,實時可用。

因此,這正是未來 AI 應用的基本形態(tài)。換一種說法:既然未來的應用是構建在 AI 之上的,那么這套智能體架構,就是未來應用的基礎結構。正是這種多模型、多模態(tài)、可推理、可調(diào)用工具的架構,極大地加速了各類 AI 創(chuàng)業(yè)公司的成長。

再加上開放模型與開放工具的出現(xiàn),你現(xiàn)在不僅可以使用最前沿的能力,還可以定制屬于你自己的 AI,教會它只有你才掌握的技能——那些來自你所在行業(yè)、你所在公司的深度知識。這正是我們在 Nemotron、NeMo,以及整個開放模型體系中所要實現(xiàn)的目標。

在這種架構下,你通常會在前面放置一個智能路由器。這個路由器就像一個管理者,它會根據(jù)你給出的提示意圖,判斷當前任務最適合由哪一個模型來完成。

需要處理郵件的請求,就留在本地運行;需要通用推理的部分,就調(diào)用前沿模型。這樣一來,你既擁有高度定制化的 AI,又始終站在技術前沿——一端是你獨有的領域能力,另一端是不斷進化的前沿智能,而這一切,只需要“讓它跑起來”即可。

為了讓大家真正理解這種智能體架構在現(xiàn)實中的樣子,我們做了一件事:把它完整地搭建出來,而且不是作為一個概念演示,而是作為一個真實可運行的系統(tǒng)。

我們把這種可復用的系統(tǒng)設計,稱之為Blueprints。Blueprint 并不是某一個模型,而是一整套經(jīng)過驗證的 AI 系統(tǒng)組合方式,它包括模型選擇、推理流程、工具調(diào)用、數(shù)據(jù)路徑,以及最終如何把結果交付給用戶。

其中一個 Blueprint,就是個人 AI 助理。這個助理并不是一個聊天機器人,而是一個能夠真正幫你完成任務的系統(tǒng)。它可以幫你讀取郵件、總結信息、安排日程、檢索資料、生成內(nèi)容,并在必要時主動調(diào)用外部工具。

當你向它提出一個請求時,它不會立刻給你一個答案,而是先判斷:這是不是一個需要研究的問題?是不是一個需要多步推理的問題?是不是一個需要訪問你個人數(shù)據(jù)的問題?然后,它會把這個請求拆解成多個子任務,分別交給最合適的模型來完成,最后再把結果整合起來,形成一個你真正能用的輸出。

在這個過程中,有些模型運行在云端,有些運行在本地,有些運行在你自己的服務器上。

對你來說,這一切都是透明的;你只看到結果,但背后是一整套復雜而精密的系統(tǒng)在協(xié)同運作。這正是我們所說的混合 AI,也是未來所有嚴肅 AI 應用的基本形態(tài)。

為了支持這種架構,我們構建了一整代全新的計算系統(tǒng)。你們可能已經(jīng)聽說過DGX Spark。它并不是一臺傳統(tǒng)意義上的服務器,而是一個為 AI 原生應用而生的計算節(jié)點。它足夠小,可以放在辦公室、實驗室,甚至工廠里;同時,它又足夠強,可以支撐本地推理、數(shù)據(jù)處理和智能體運行。當你把 DGX Spark 與云端的 DGX 系統(tǒng)連接起來時,你就擁有了一套真正意義上的端云協(xié)同 AI 基礎設施。

這件事之所以重要,是因為物理 AI的時代已經(jīng)到來。機器人、自動化系統(tǒng)、工業(yè)設備,它們不可能把所有計算都放到云端。它們必須在本地感知環(huán)境、實時做出決策,同時又能夠在需要時,調(diào)用云端的更強算力進行規(guī)劃、學習和更新。這種“本地即智能、云端即大腦”的架構,是物理 AI 唯一可行的路徑。

在舞臺上,我們展示了多個這樣的 Blueprint 示例,包括機器人系統(tǒng)。你會看到,機器人并不是被一行一行代碼“寫”出來的,而是通過感知、推理、規(guī)劃和執(zhí)行,完成復雜動作。

它們可以理解語言指令,把語言映射為物理行動;可以在環(huán)境變化時重新規(guī)劃路徑;可以在失敗之后進行自我修正。這并不是一個單一模型的能力,而是一整套 AI 系統(tǒng)協(xié)同工作的結果。

而這,正是為什么我們?nèi)绱藦娬{(diào)系統(tǒng)級創(chuàng)新。單一模型的性能提升固然重要,但真正改變世界的,是這些模型如何被組合、如何被部署、如何在現(xiàn)實環(huán)境中長期穩(wěn)定運行。Blueprint 的意義就在這里——它把復雜性封裝起來,讓開發(fā)者、企業(yè)和研究人員,可以在此基礎之上快速構建自己的 AI 應用,而不必從零開始。

當我們真正開始構建這些 AI 系統(tǒng)時,有一件事變得異常清晰:AI 已經(jīng)不再是某一層的軟件問題,而是整個計算體系的問題。如果計算基礎設施不能被徹底重構,那么所有關于智能體、物理 AI、自動駕駛和機器人的設想,最終都會卡在現(xiàn)實世界的瓶頸上。

這也是為什么,我們必須從最底層開始重新思考計算。

AI 的計算負載,與傳統(tǒng)計算完全不同。它不是穩(wěn)定、線性的,而是高度動態(tài)的;不是以單次執(zhí)行為主,而是以持續(xù)推理為核心。模型在“思考”的時候,會在極短時間內(nèi)拉滿算力、內(nèi)存和網(wǎng)絡帶寬,然后又迅速回落。這種計算模式,對芯片、互連、系統(tǒng)、電力和散熱,提出了前所未有的要求。

因此,我們不再把 GPU、CPU、網(wǎng)絡、存儲視為彼此獨立的部件,而是把它們當作一個整體系統(tǒng)來設計。這正是我們反復強調(diào)的——極限協(xié)同設計。

在這個體系中,芯片不再只是追求單點性能,而是為整個系統(tǒng)服務;網(wǎng)絡不再只是連接,而是成為計算的一部分;系統(tǒng)不再只是承載,而是主動參與調(diào)度與優(yōu)化。只有在這樣的前提下,AI 才能真正擴展到前所未有的規(guī)模。

這正是Blackwell 之后,我們?yōu)槭裁幢仨氃傧蚯斑~出一大步。

過去幾年里,Blackwell 為 AI 訓練和推理奠定了一個全新的基線。但很快我們就意識到,如果只是沿著同樣的路徑繼續(xù)前進,是遠遠不夠的。模型規(guī)模在加速增長,推理復雜度在急劇上升,token 的生成方式正在從“回答”轉向“思考”,所有這些變化,都在逼迫我們重新發(fā)明整個計算平臺。

于是,我們開始設計一個全新的系統(tǒng)。不是一塊芯片。不是一臺服務器。而是一個完整的 AI 超級計算平臺

這就是Vera Rubin。

Vera Rubin 并不是某一代產(chǎn)品的代號,而是一個象征。它象征著我們已經(jīng)進入一個階段:計算的瓶頸,不再在單一部件上,而在系統(tǒng)整體的協(xié)同效率上。在這個平臺中,每一個決策——從晶體管如何使用,到數(shù)據(jù)如何流動——都是圍繞 AI 的真實負載來做出的。

在設計 Vera Rubin 的過程中,我們面臨的最大挑戰(zhàn),并不是“如何把性能再提升一點”,而是:如何在物理極限逐漸逼近的情況下,仍然實現(xiàn)數(shù)量級的躍遷。摩爾定律正在放緩,單靠晶體管數(shù)量的增長,已經(jīng)無法支撐 AI 的發(fā)展速度。

如果模型規(guī)模每年增長 10 倍,如果推理 token 每年增長 5 倍,如果成本還要持續(xù)以數(shù)量級下降,那么整個計算體系就必須發(fā)生質變。

答案只有一個:在整個系統(tǒng)層面進行同時創(chuàng)新。

這也是為什么,在這一代平臺中,我們選擇重新設計所有關鍵組件。CPU、GPU、網(wǎng)絡芯片、交換機、系統(tǒng)結構、電力與散熱——沒有任何一層可以保持不變。因為只要其中任何一層跟不上,整個系統(tǒng)都會被拖慢。

Vera Rubin 正是在這樣的背景下誕生的。它不是一次漸進式升級,而是一次系統(tǒng)級重構。它的目標非常明確:為 AI 的下一個十年,提供一個足夠強大、足夠高效、足夠可擴展的計算基礎。

當我們真正開始定義 Vera Rubin 這個平臺時,我們首先要解決的,不是“性能還能不能再快一點”,而是一個更根本的問題:數(shù)據(jù)在系統(tǒng)中,究竟應該如何流動

在 AI 計算中,真正昂貴的,并不是計算本身,而是數(shù)據(jù)的移動。每一次跨芯片、跨節(jié)點、跨機架的數(shù)據(jù)傳輸,都會帶來延遲、功耗和效率損失。而隨著模型規(guī)模的不斷擴大,這個問題會被無限放大。

因此,在 Vera Rubin 中,我們從一開始就選擇了一條非常激進的路線:把多個關鍵計算單元,作為一個整體來協(xié)同設計。

這也是為什么,Vera Rubin 并不是一顆“更大的 GPU”,而是一個由六顆核心芯片組成的協(xié)同系統(tǒng)。這六顆芯片并不是簡單地堆疊在一起,而是通過極高帶寬、極低延遲的互連,被設計成一個幾乎“不可分割”的整體。

在這個系統(tǒng)中,GPU、CPU、內(nèi)存控制邏輯、網(wǎng)絡接口,不再是松散拼接的模塊,而是圍繞 AI 負載進行深度融合。它們共享統(tǒng)一的視圖,能夠以極高效率訪問彼此的數(shù)據(jù),就像是在同一塊硅片上工作一樣。

為了實現(xiàn)這一點,我們在互連技術上投入了極大的精力。NVLink 在這一代平臺中,已經(jīng)不再只是 GPU 之間的高速通道,而是整個系統(tǒng)的“神經(jīng)網(wǎng)絡”。數(shù)據(jù)不需要繞遠路,不需要經(jīng)過多層轉發(fā),而是可以在需要的時刻,直接流向需要它的地方。

這件事情聽起來很抽象,但它的結果非常直觀:模型在推理時,可以更長時間地保持“思考狀態(tài)”;更多的上下文可以常駐在高速內(nèi)存中;系統(tǒng)不再頻繁地因為等待數(shù)據(jù)而空轉。

與此同時,網(wǎng)絡本身也發(fā)生了根本變化。

在傳統(tǒng)數(shù)據(jù)中心中,網(wǎng)絡只是負責把機器連在一起。但在 AI 數(shù)據(jù)中心中,網(wǎng)絡本身就是計算的一部分。

在 Vera Rubin 平臺中,我們把Spectrum-X網(wǎng)絡體系深度嵌入到整體設計之中。交換機、網(wǎng)卡、拓撲結構、調(diào)度邏輯,全都圍繞 AI 的通信模式來優(yōu)化。模型在訓練和推理過程中,會不斷進行大規(guī)模的梯度同步、參數(shù)廣播和上下文交換,而這些操作,已經(jīng)成為系統(tǒng)的主要負載之一。

因此,我們不再允許網(wǎng)絡成為瓶頸。在這個平臺上,網(wǎng)絡的吞吐、延遲和可預測性,必須與計算本身同等重要。

同樣重要的,還有內(nèi)存系統(tǒng)。在 AI 推理時代,內(nèi)存的角色已經(jīng)發(fā)生了變化。
它不再只是用來“存放權重”,而是用來承載推理過程本身。KV cache、上下文窗口、中間狀態(tài),這些內(nèi)容必須盡可能長時間地留在高速內(nèi)存中,才能支持更復雜、更長鏈路的推理。

因此,Vera Rubin 的內(nèi)存體系,是為“持續(xù)推理”而設計的。我們追求的不是峰值容量,而是可持續(xù)、高帶寬、低延遲的訪問能力。只有這樣,模型才能真正“停下來思考”,而不是被迫在計算與數(shù)據(jù)移動之間來回切換。

當你把這些因素放在一起看,就會發(fā)現(xiàn)一件事:Vera Rubin 并不是在追求某一個指標的極限,而是在追求整個系統(tǒng)效率的極限。

這也是為什么,我們必須同時重構計算、互連、網(wǎng)絡、內(nèi)存、電力和散熱。因為在這個規(guī)模上,任何一處效率損失,都會被成千上萬倍地放大。

最終,我們得到的,不只是一個更快的平臺,而是一個為 AI 原生設計的計算生態(tài)系統(tǒng)。它能夠隨著模型規(guī)模的增長而擴展,能夠隨著推理復雜度的提升而進化,也能夠在未來十年中,持續(xù)支撐 AI 的發(fā)展。

當你把視角從單一系統(tǒng)繼續(xù)拉遠,就會發(fā)現(xiàn),真正的挑戰(zhàn)并不止于一臺機器,而是在數(shù)據(jù)中心尺度上,如何讓這些系統(tǒng)協(xié)同工作。因為一旦 AI 模型開始進入大規(guī)模訓練與持續(xù)推理階段,問題就不再是“一臺系統(tǒng)有多快”,而是“成千上萬臺系統(tǒng),能否像一臺機器一樣工作”。

這正是我們在 Vera Rubin 平臺上,必須同時考慮機架級、集群級、數(shù)據(jù)中心級設計的原因。我們不再把服務器簡單地一臺一臺堆放,而是把整個機架視為一個計算單元。計算、網(wǎng)絡、電力和散熱,必須在機架層面完成統(tǒng)一設計,才能保證系統(tǒng)在滿負載運行時,仍然具備可預測的性能。

在這種架構下,我們構建了所謂的超節(jié)點(Supernode)。一個超節(jié)點并不是某一臺特別強的機器,而是一組通過高速互連、統(tǒng)一調(diào)度、共享內(nèi)存視圖的系統(tǒng)集合。在 AI 負載看來,這些系統(tǒng)就像是一塊連續(xù)擴展的計算資源,而不是彼此獨立的節(jié)點。這一點,對于大模型訓練和長上下文推理來說,至關重要。

當模型規(guī)模繼續(xù)擴大,通信量會呈指數(shù)級增長。如果系統(tǒng)在這個階段出現(xiàn)任何不均衡,哪怕只是極小的延遲抖動,都會被迅速放大,最終拖慢整個訓練過程。因此,在超節(jié)點層面,我們對拓撲結構、帶寬分配和調(diào)度策略進行了深度優(yōu)化,確保數(shù)據(jù)在系統(tǒng)中始終走最短、最可預測的路徑。

當然,所有這些計算能力,最終都會轉化為一個非?,F(xiàn)實的問題:能耗

AI 數(shù)據(jù)中心的功耗規(guī)模,已經(jīng)遠遠超過了傳統(tǒng)數(shù)據(jù)中心。訓練一個前沿模型,所消耗的電力,足以支撐一座中型城市的部分用電需求。如果我們不能在能效上實現(xiàn)突破,那么 AI 的發(fā)展本身就會受到物理和經(jīng)濟條件的限制。

因此,在這一代平臺中,我們把能效作為系統(tǒng)設計的核心指標之一。每一次數(shù)據(jù)移動、每一次計算調(diào)度、每一次網(wǎng)絡通信,都會被納入整體能耗模型之中進行優(yōu)化。我們的目標,并不是簡單地降低功耗,而是在單位能耗下,完成盡可能多的有效推理與訓練工作。

這也直接推動了散熱技術的演進??諝饫鋮s已經(jīng)無法滿足如此高密度的計算需求,于是我們大規(guī)模引入了液冷系統(tǒng)。通過液冷,我們不僅能夠更有效地帶走熱量,還能夠讓系統(tǒng)在更穩(wěn)定的溫度區(qū)間內(nèi)運行,從而提高可靠性和壽命。這些看似“工程細節(jié)”的東西,實際上決定了 AI 是否能夠長期、可持續(xù)地運行在現(xiàn)實世界中。

當你把計算、網(wǎng)絡、能耗和散熱放在一起看,就會發(fā)現(xiàn):現(xiàn)代 AI 數(shù)據(jù)中心,本身就是一臺巨大的計算機。

它不是由零散的服務器拼湊而成,而是一個從底層物理到上層軟件高度協(xié)同的系統(tǒng)。正是在這樣的系統(tǒng)之上,AI 才能以我們今天看到的速度不斷進化。

也正因為如此,我們才會反復強調(diào):AI 的未來,不僅僅屬于模型研究人員,也屬于系統(tǒng)工程師、電力工程師、網(wǎng)絡工程師,以及所有參與構建這一基礎設施的人。只有當整個系統(tǒng)協(xié)同進化,AI 才能真正走向規(guī)?;瘧?。

當這些計算平臺真正具備規(guī)模之后,一個新的問題就擺在我們面前:這些能力,究竟要以什么形式被使用?

并不是所有 AI 都應該運行在同一個地方。有些 AI 需要運行在超大規(guī)模的數(shù)據(jù)中心中,用來訓練前沿模型、進行復雜規(guī)劃和長期推理;有些 AI 需要運行在企業(yè)自己的數(shù)據(jù)中心里,靠近私有數(shù)據(jù)和業(yè)務系統(tǒng);還有一些 AI,必須運行在本地設備、工廠、醫(yī)院、汽車和機器人中,進行實時決策。

因此,AI 的未來,一定是多層次的。

這也是為什么,我們在設計整套平臺時,從一開始就假設:AI 會同時存在于云端、企業(yè)內(nèi)部和邊緣側。這并不是權宜之計,而是一種必然結果。數(shù)據(jù)的生成地點,決定了計算的部署位置;延遲、安全、合規(guī)性,這些現(xiàn)實因素,決定了 AI 不可能被集中在某一個地方。

在云端,我們與全球幾乎所有主要的云服務商合作。這些云平臺,正在成為前沿模型訓練與大規(guī)模推理的核心載體。而在這些云中運行的,并不僅僅是“通用 AI”,而是越來越多針對行業(yè)定制的模型與系統(tǒng)

在企業(yè)側,我們看到一種非常明確的趨勢:企業(yè)并不想把最核心的數(shù)據(jù)完全交給外部。它們希望在自己的環(huán)境中,構建、運行并控制 AI。這催生了所謂的企業(yè) AI 工廠——一個專門用來訓練、微調(diào)、部署和運營 AI 的基礎設施。

在這種架構下,企業(yè)不再只是“使用 AI”,而是開始擁有 AI。它們可以把自身幾十年積累的數(shù)據(jù)、流程和知識,轉化為獨有的智能能力,而這正是 AI 真正產(chǎn)生長期價值的方式。

而在越來越多的國家,我們還看到了另一種需求:主權 AI(Sovereign AI)

每一個國家,都擁有自己的語言、文化、法律體系和社會結構。它們也擁有自己的數(shù)據(jù)資源和戰(zhàn)略目標。

因此,越來越多的國家意識到:如果 AI 成為未來的基礎能力,那么它就不應該完全依賴外部。一個國家必須能夠在本土訓練模型、運行模型、控制數(shù)據(jù),并確保這些系統(tǒng)符合本國的價值觀和法律體系。

這并不是一個技術問題,而是一個國家級基礎設施問題。

而主權 AI 的實現(xiàn),離不開強大的本地計算能力、開放的模型生態(tài),以及完整的工具鏈。這正是我們在多個國家與政府、科研機構和本地企業(yè)合作的原因。我們的目標,并不是替代任何人,而是賦能各個地區(qū),構建屬于他們自己的 AI 能力。

當你把云、企業(yè)、本地和主權 AI 放在一起看,就會發(fā)現(xiàn):AI 并不是一個單一形態(tài)的產(chǎn)品,而是一整套分布式智能系統(tǒng)。

而支撐這套系統(tǒng)運行的,正是我們前面所講的那整套計算平臺、網(wǎng)絡體系和軟件工具。無論 AI 運行在哪里,它們背后遵循的都是同樣的原則:高效的數(shù)據(jù)流動、可預測的性能、可擴展的架構,以及長期可持續(xù)的運行能力。

這也是為什么,我們并不是在“賣芯片”,而是在構建一個完整的 AI 基礎設施生態(tài)。

當 AI 真正離開屏幕、進入現(xiàn)實世界時,一切都會變得更加具體,也更加嚴苛。因為在物理世界中,錯誤是有成本的,延遲是不可接受的,系統(tǒng)必須在復雜、不確定、持續(xù)變化的環(huán)境中穩(wěn)定運行。這正是為什么,汽車與機器人,會成為物理 AI 最重要、也最具代表性的落地場景。

先從汽車開始。自動駕駛,本質上并不是一個“視覺識別問題”,而是一個完整的物理 AI 系統(tǒng)。它需要實時感知環(huán)境、理解三維空間結構、預測其他參與者的行為,并在極短時間內(nèi)做出安全決策。這些能力,并不是通過規(guī)則堆疊實現(xiàn)的,而是通過大規(guī)模數(shù)據(jù)訓練、仿真和持續(xù)學習逐步獲得的。

因此,我們從一開始就把自動駕駛視為一個端到端的 AI 系統(tǒng)工程。從車端的感知與推理,到數(shù)據(jù)中心中的訓練與仿真,再到模型的持續(xù)迭代,這是一條完整的閉環(huán)。

汽車在現(xiàn)實世界中行駛,每一天都會產(chǎn)生海量數(shù)據(jù);這些數(shù)據(jù)被送回數(shù)據(jù)中心,用于訓練更好的模型;而更好的模型,再被部署回車輛之中。這正是 AI 在物理世界中不斷進化的方式。

機器人也是如此,甚至更加復雜。

一個機器人面對的,并不是結構化的道路環(huán)境,而是高度多樣化、充滿不確定性的真實空間。地面可能是光滑的,也可能是松軟的;物體可能是剛性的,也可能是柔性的;人類的行為更是難以預測。在這樣的環(huán)境中,機器人如果只依賴預先編程的動作,是不可能規(guī)?;?。

因此,我們必須讓機器人具備真正的感知、推理和學習能力。

這也是為什么,我們在機器人領域構建的,不是某一個單點模型,而是一整套系統(tǒng):從感知模型到運動模型,從世界建模到策略規(guī)劃,再到在仿真環(huán)境中進行大規(guī)模訓練。機器人并不是被“寫”出來的,而是被“訓練”出來的。它們通過在虛擬世界中反復嘗試、失敗和修正,逐步學會如何在現(xiàn)實世界中行動。

在這個過程中,仿真扮演著至關重要的角色。

現(xiàn)實世界的數(shù)據(jù)是昂貴的、緩慢的,而且充滿風險;而仿真世界則可以被無限復制、加速和控制。通過高保真的物理仿真,我們可以在虛擬環(huán)境中生成海量訓練數(shù)據(jù),讓機器人和自動駕駛系統(tǒng)在“安全的失敗”中不斷學習。這正是為什么,我們把仿真視為物理 AI 的核心基礎設施之一。

而當這些系統(tǒng)真正開始工作時,你會發(fā)現(xiàn)一個非常重要的事實:物理 AI 從來不是單點部署的。它們總是運行在一個端云協(xié)同的體系中。機器人在本地進行實時感知與決策,而更復雜的規(guī)劃、模型更新和策略學習,則發(fā)生在云端或數(shù)據(jù)中心中。這種協(xié)同,是物理 AI 唯一可行的運行方式。

正因為如此,我們才會看到,越來越多的行業(yè)開始真正擁抱物理 AI。制造業(yè)、物流、醫(yī)療、能源、農(nóng)業(yè),這些領域都存在著大量需要“理解世界并采取行動”的任務。AI 在這些場景中的價值,并不體現(xiàn)在生成一段文本,而體現(xiàn)在提高效率、降低風險、擴展人類能力。

而這一切的前提,是我們必須擁有足夠強大、足夠可靠的計算平臺,來支撐這些系統(tǒng)長期運行。物理 AI 不是一次性的部署,而是一項持續(xù)數(shù)十年的工程。系統(tǒng)必須可以更新、可以擴展、可以在真實世界中不斷學習和進化。

當我們把所有這些變化放在一起看,就會意識到:人工智能并不是一個短期趨勢,而是一場長期、結構性的產(chǎn)業(yè)重構。它不僅改變了軟件如何被編寫,也改變了硬件如何被設計,更改變了企業(yè)如何運作、國家如何建設基礎設施,以及人類如何與技術協(xié)作。

我們正在進入一個新的階段。在這個階段里,AI 不再只是提升效率的工具,而是一種新的生產(chǎn)要素。它像電力一樣,成為所有行業(yè)的基礎能力;又像互聯(lián)網(wǎng)一樣,重塑了信息、服務和價值的流動方式。而與以往任何一次技術革命不同的是,這一次,AI 正在同時重構數(shù)字世界與物理世界。

這意味著,未來十年中,幾乎每一個行業(yè),都會被重新發(fā)明。制造、物流、交通、醫(yī)療、能源、金融、科研——這些領域中的工作方式,將不再以“人如何操作機器”為核心,而是轉向“人如何與智能系統(tǒng)協(xié)同”。AI 將承擔越來越多的認知與執(zhí)行任務,而人類則專注于創(chuàng)造、判斷與價值選擇。

從產(chǎn)業(yè)的角度看,這也是一個規(guī)模前所未有的機會。我們看到,全球范圍內(nèi)正在形成一個新的產(chǎn)業(yè)基礎——AI 工廠。這些工廠并不生產(chǎn)實體商品,而是生產(chǎn)智能本身:模型、推理能力、決策系統(tǒng)和自動化流程。它們需要巨大的計算能力、穩(wěn)定的能源供應、先進的網(wǎng)絡體系,以及高度專業(yè)化的軟件工具。

正是在這樣的背景下,我們判斷:未來十年,將是AI 基礎設施建設的黃金十年。這不僅僅是關于芯片或服務器的需求增長,更是關于整個系統(tǒng)——從數(shù)據(jù)中心到邊緣設備,從云端到本地,從模型到應用——的全面升級。

而在這一過程中,有一點至關重要:這場變革必須是開放的。

如果 AI 只掌握在少數(shù)人手中,它就無法真正釋放潛力;如果 AI 無法被各行各業(yè)、各個國家所使用,它就不可能成為真正的基礎能力。

因此,我們始終堅持一個原則:推動開放的平臺、開放的模型、開放的生態(tài)。我們希望看到的是一個多樣化的 AI 世界——不同的模型、不同的架構、不同的應用,共同推動智能向前發(fā)展。

對我們來說,這并不是一條容易的路。構建這樣的系統(tǒng),需要巨大的投入、長期的耐心,以及跨越多個學科的協(xié)作。

但這也是一條值得走的路。

因為我們相信,人工智能最終的價值,不在于替代人類,而在于擴展人類的能力;不在于制造更多的工具,而在于幫助人類解決那些過去無法解決的問題。

這正是我們在英偉達每天所做的事情。也是我們對未來十年,最堅定的信念。

謝謝大家。新年快樂。
歡迎來到 AI 的新時代。


前沿動態(tài)前沿大會

前沿人物

「在看」,給前前加雞腿

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
剛剛,利好來了!直線暴漲!

剛剛,利好來了!直線暴漲!

中國基金報
2026-03-25 16:06:14
4-3爆冷!中國隊雙殺亞洲勁旅,比5連勝更驚喜的,又出現(xiàn)一個李昊

4-3爆冷!中國隊雙殺亞洲勁旅,比5連勝更驚喜的,又出現(xiàn)一個李昊

侃球熊弟
2026-03-26 00:35:10
倒計時開始!特朗普將迎來終極翻車時刻!

倒計時開始!特朗普將迎來終極翻車時刻!

一個壞土豆
2026-03-25 20:56:19
中國買了歐洲1000億人民幣的飛機:東航向空客購買101架A320

中國買了歐洲1000億人民幣的飛機:東航向空客購買101架A320

觀察者網(wǎng)
2026-03-25 18:00:06
人社部:職稱評審將重大調(diào)整??!

人社部:職稱評審將重大調(diào)整??!

新浪財經(jīng)
2026-03-25 21:42:36
五枚導彈,攔下四枚,就那漏網(wǎng)的一枚,不偏不倚,正好砸中…

五枚導彈,攔下四枚,就那漏網(wǎng)的一枚,不偏不倚,正好砸中…

福建平子
2026-03-25 10:14:49
斬首”讓一將功成萬骨枯成為歷史

斬首”讓一將功成萬骨枯成為歷史

昊軒看世界
2026-03-23 18:50:52
原來她是張雪峰前妻,90后歷史學博士?,兩人離婚后曾一起上節(jié)目

原來她是張雪峰前妻,90后歷史學博士?,兩人離婚后曾一起上節(jié)目

大鐵貓娛樂
2026-03-25 13:03:57
廣東大巴模式影響內(nèi)陸,各地都出現(xiàn)低價大巴,與高鐵、綠皮搶客

廣東大巴模式影響內(nèi)陸,各地都出現(xiàn)低價大巴,與高鐵、綠皮搶客

柏銘銳談
2026-03-25 10:50:46
信達證券所長被曝猥褻女員工,撫摸私密處,正臉照被扒,警方介入

信達證券所長被曝猥褻女員工,撫摸私密處,正臉照被扒,警方介入

180視角
2026-03-25 15:58:41
只剩6天!醫(yī)保全國統(tǒng)一,41-61歲抓緊辦這幾件事,否則就晚了!

只剩6天!醫(yī)保全國統(tǒng)一,41-61歲抓緊辦這幾件事,否則就晚了!

另子維愛讀史
2026-03-25 22:09:07
兩省省委領導班子調(diào)整

兩省省委領導班子調(diào)整

上觀新聞
2026-03-25 15:07:07
臺獨大金主身中29槍暴斃

臺獨大金主身中29槍暴斃

雪中風車
2026-03-24 20:19:46
深夜,暴漲!伊朗,拒絕美國!

深夜,暴漲!伊朗,拒絕美國!

中國基金報
2026-03-26 00:19:55
張雪峰6年前已離婚,獨女張姩菡只能分16.5%遺產(chǎn),現(xiàn)任妻子占大頭

張雪峰6年前已離婚,獨女張姩菡只能分16.5%遺產(chǎn),現(xiàn)任妻子占大頭

楓紅染山徑
2026-03-25 16:56:22
伊朗稱正在搜捕逃亡美軍

伊朗稱正在搜捕逃亡美軍

界面新聞
2026-03-25 23:21:14
退役體操冠軍,直播“擦邊”之后

退役體操冠軍,直播“擦邊”之后

中國新聞周刊
2026-03-25 21:34:08
日本士兵闖入中國使館,意圖刺殺中國大使。高市:降級中日關系

日本士兵闖入中國使館,意圖刺殺中國大使。高市:降級中日關系

清歡百味
2026-03-25 06:26:23
崩了,知名光伏公司大規(guī)模停產(chǎn),大面積待崗!

崩了,知名光伏公司大規(guī)模停產(chǎn),大面積待崗!

黯泉
2026-03-25 21:36:39
堅決反對中國任何城市申辦奧運會,國際奧委會這次怕是真失算了

堅決反對中國任何城市申辦奧運會,國際奧委會這次怕是真失算了

南權先生
2026-03-25 15:25:11
2026-03-26 05:11:00
前沿在線 incentive-icons
前沿在線
前沿在線官方賬號,關注AI、機器人、智能車等前沿領域;
125文章數(shù) 1235關注度
往期回顧 全部

科技要聞

紅極一時卻草草收場,Sora宣布正式關停

頭條要聞

伊朗:正在搜捕逃亡美軍

頭條要聞

伊朗:正在搜捕逃亡美軍

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰遺產(chǎn)分割復雜!是否立遺囑成關鍵

財經(jīng)要聞

管濤:中東局勢如何影響人民幣匯率走勢?

汽車要聞

智己LS8放大招 30萬內(nèi)8系旗艦+全線控底盤秀實力

態(tài)度原創(chuàng)

本地
教育
手機
親子
公開課

本地新聞

來永泰同安 赴一場春天的約會

教育要聞

那些躺平的孩子,其實是看透了父母的偽裝

手機要聞

Bigme大我HiBreak Plus彩墨屏手寫手機亮相,預售價1699元

親子要聞

爸爸的肩膀,永遠是你最堅實的依靠

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版