国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

黃仁勛搶吃龍蝦:英偉達(dá)新核彈10倍算力提升,OpenClaw自由了

0
分享至



機(jī)器之心編輯部

老黃:科技公司的算力焦慮,有 1 萬億刀那么大。

北京時(shí)間今天凌晨兩點(diǎn),英偉達(dá) GTC 大會(huì)在加州圣何塞正式召開,這回的 Keynote 注定要被各大公司 CEO 不斷引用了。



「我們重新定義了計(jì)算,就像個(gè)人電腦革命和互聯(lián)網(wǎng)革命一樣。我們現(xiàn)在正處于一個(gè)全新平臺(tái)變革的開端。」英偉達(dá)聯(lián)合創(chuàng)始人、CEO 黃仁勛說道。

去年 10 月黃仁勛還在表示,他預(yù)計(jì)到 2026 年底的五個(gè)財(cái)季內(nèi),全球公司在 Blackwell 和 Rubin 系統(tǒng)上的支出將達(dá)到 5000 億美元,F(xiàn)在他表示,這一市場將在 2025 年至 2027 年間達(dá)到 1 萬億美元,60% 的業(yè)務(wù)將來自超大規(guī)模云計(jì)算。



數(shù)量直接翻倍,原因在于 AI 到了「推理拐點(diǎn)」(The inference inflection)。如果說之前 AI 還是在實(shí)驗(yàn)室里「瘋狂訓(xùn)練」,那么現(xiàn)在已經(jīng)全面進(jìn)入了「推理和生成」階段。算力的需求不是見頂了,而是剛剛爆發(fā)。

「那么,這合理嗎?」Keynote 剩下的大部分時(shí)間,黃仁勛都在討論這個(gè)問題。

新一代 Vera Rubin 量產(chǎn),世界從未見過的芯片

今年的新產(chǎn)品不再是一塊芯片,而是一個(gè)龐大復(fù)雜的 AI 算力系統(tǒng)。

黃仁勛表示,基于全新 Vera Rubin 架構(gòu)的英偉達(dá) NVL72 是一場「豪賭」。在 AI 的推理任務(wù)上,要想把效率做到極致面臨著最大的挑戰(zhàn)。在合作伙伴的幫助下,英偉達(dá)的努力得到了回報(bào)。

NVL72 架構(gòu)的每瓦 token 性能提升了 50 倍,速度提升遠(yuǎn)超摩爾定律。



這就是「token king」。



基于算力的提升與 AI 技術(shù)的發(fā)展,數(shù)據(jù)中心過去是存儲(chǔ)文件的地方,現(xiàn)在則變成了生成 token 的工廠。老黃指出,推理是工作負(fù)載,而 token 則是新的商品。



在 AI 的推理上,更復(fù)雜的推理,以及更低的延遲將是算力需要解決的挑戰(zhàn)。更高的效率也意味著企業(yè)更多的利潤。



Vera Rubin NVL72 是「為智能體 AI 時(shí)代注入強(qiáng)大動(dòng)力的引擎」。老黃在臺(tái)上展示了 Vera Rubin 的全套系統(tǒng),這是一個(gè)龐大而復(fù)雜的系統(tǒng),包含七款全新芯片,旨在打造全球最大規(guī)模的 AI 工廠,針對 AI 各個(gè)階段進(jìn)行了優(yōu)化,涵蓋從預(yù)訓(xùn)練、后訓(xùn)練和測試時(shí)擴(kuò)展到智能體推理的各個(gè)環(huán)節(jié)。

英偉達(dá)展示了 Vera Rubin 平臺(tái)的細(xì)節(jié),包括 Vera CPU、Rubin GPU、NVLink 6 交換機(jī)、NVIDIA ConnectX 9 超級網(wǎng)卡、BlueField4 DPU 和 Spectrum-6 以太網(wǎng)交換機(jī),以及新集成的 Groq 3 LPU。

具體來說,在 Vera Rubin NVL72 機(jī)架上集成了 72 個(gè) Rubin GPU 和 36 個(gè) Vera CPU,它們通過 NVLink 6 連接,并配備 ConnectX-9 SuperNIC 和 BlueField-4 DPU。Vera Rubin NVL72 實(shí)現(xiàn)了突破性的效率 —— 與 NVIDIA Blackwell 平臺(tái)相比,前者使用四分之一數(shù)量的 GPU 即可訓(xùn)練大型混合專家模型,每瓦推理吞吐量提高了 10 倍,每 token 成本僅為十分之一



NVL72 專為超大規(guī)模 AI 工廠而設(shè)計(jì),可與 Quantum-X800 InfiniBand 和 Spectrum-X 以太網(wǎng)無縫擴(kuò)展,從而在大規(guī)模 GPU 集群中保持高利用率,同時(shí)縮短訓(xùn)練時(shí)間和降低總體擁有成本。



還有更大的核彈嗎?有的兄弟,有的。它就是「NVIDIA Vera Rubin Ultra NVL576」,通過引入一種全新的雙層全互連 NVLink 拓?fù)浣Y(jié)構(gòu),使開發(fā)者能夠?qū)⑾到y(tǒng)縱向擴(kuò)展至最多 576 塊 GPU。



Vera Rubin Ultra NVL576 將把 8 個(gè)獨(dú)立的 MGX NVL 機(jī)架連接在一起,每個(gè)機(jī)架配備 72 塊 Rubin Ultra GPU。所有機(jī)架通過銅纜互連和直連光互連共同組成一個(gè)統(tǒng)一的 576 GPU NVLink 域。

該系統(tǒng)將基于同一套 MGX 機(jī)架級生態(tài)構(gòu)建而成,可以實(shí)現(xiàn)最快的量產(chǎn)落地周期。

為了驗(yàn)證這一跨機(jī)架的大規(guī)模 NVLink 拓?fù)浼軜?gòu), 英偉達(dá)內(nèi)部構(gòu)建一套功能完備、基于 GB200 的原型系統(tǒng) ——Polyphe,如下圖所示:



當(dāng)然,最新的 Vera Rubin 算力也會(huì)部署到太空。

黃仁勛宣布,英偉達(dá)正在研發(fā)名為 Nvidia Vera Rubin Space-1 的用于軌道數(shù)據(jù)中心的新型芯片 / 計(jì)算機(jī),「太空中沒有傳導(dǎo),沒有對流,只有輻射,我們必須想辦法在太空中冷卻這些系統(tǒng),但我們有很多優(yōu)秀的工程師正在研究這個(gè)問題!



英偉達(dá)表示,相比上代架構(gòu),Vera Rubin 的落地速度顯著加快,目前其已在微軟 Azure 上開始部署。隨著 Vera Rubin 的推出,AI 智能體的轉(zhuǎn)折點(diǎn)已經(jīng)到來,史上規(guī)模最大的 AI 基建即將展開。

全新 AI 推理芯片 LPU

Vera Rubin 強(qiáng)大的能力,離不開 LPU(Language Processing Unit,語言處理單元)。

去年 12 月,英偉達(dá)斥資約 200 億美元與 AI 推理芯片公司 Groq 達(dá)成了一項(xiàng)戰(zhàn)略交易,獲得了 Groq 推理技術(shù)授權(quán),收購其部分芯片資產(chǎn),同時(shí)吸納核心團(tuán)隊(duì)成員,包括創(chuàng)始人 Jonathan Ross、總裁 Sunny Madra 等。

Groq 的價(jià)值在于,通過 LPU 專門優(yōu)化的推理流水線與 GPU 協(xié)同計(jì)算,突破純 GPU AI 服務(wù)器在低延遲推理、token 解碼效率和能耗上的瓶頸。

本次 GTC 大會(huì)上,NVIDIA Groq 3 LPX 的發(fā)布標(biāo)志著加速計(jì)算領(lǐng)域迎來了一項(xiàng)重要里程碑。

大模型推理長期面臨一個(gè)核心矛盾:低延遲與高吞吐量往往難以兼得。而 Groq LPX 架構(gòu)與 Vera Rubin GPU 協(xié)同工作,專門針對智能體系統(tǒng)所需的低延遲與超長上下文推理進(jìn)行優(yōu)化。

在這一架構(gòu)下,每兆瓦推理吞吐量最高可提升 35 倍,并為萬億參數(shù)模型帶來最高 10 倍的營收潛力

更高的每瓦吞吐量和 token 級性能,將開啟一個(gè)新的推理層級,使得萬億參數(shù)、百萬上下文的超高端模型推理成為可能,并為所有 AI 服務(wù)提供商帶來更大的商業(yè)空間。



在設(shè)計(jì)上,LPX 機(jī)架采用全液冷設(shè)計(jì),基于 MGX 基礎(chǔ)設(shè)施構(gòu)建,可無縫集成到下一代 Vera Rubin AI 工廠中。

同時(shí),LPX 機(jī)架包含了 256 個(gè) LPU 處理器,提供 128GB 片上 SRAM 和 640 TB/s 的縱向互聯(lián)帶寬。

在大規(guī)模部署時(shí),大量 LPU 可以協(xié)同工作,像一個(gè)巨型單一處理器一樣運(yùn)行,實(shí)現(xiàn)高速、確定性的推理加速。



當(dāng)與 Vera Rubin NVL72 系統(tǒng)一同部署時(shí),Rubin GPU 與 LPU 會(huì)協(xié)同計(jì)算 AI 模型每一層的每個(gè)輸出 token,顯著提升解碼性能。

LPX 架構(gòu)針對萬億參數(shù)模型與百萬 token 上下文進(jìn)行了優(yōu)化,通過與 Vera Rubin 的協(xié)同設(shè)計(jì),在功耗、內(nèi)存與計(jì)算效率之間實(shí)現(xiàn)最佳平衡。



目前,LPU 是由三星代工生產(chǎn),未來的新一代可能會(huì)由臺(tái)積電代工。另外在未來的 GPU(Feynman 架構(gòu))上,也可能整合 Groq 處理器,這有望在提升性能的同時(shí)降低成本。

Nvidia Groq 3 LPX 預(yù)計(jì)將在今年下半年正式推出。

NemoClaw:英偉達(dá)版 OpenClaw 上線

最近科技圈最火的概念是 OpenClaw,老黃在 GTC 上把它比作「操作系統(tǒng)」,簡單來說,OpenClaw 是一個(gè)可以連接到云系統(tǒng)的智能體平臺(tái)。它可以生成其他智能體、進(jìn)行調(diào)度、分解問題等等。

然而,當(dāng)前基于 OpenClaw 的 AI 智能體在與外部通信時(shí)存在安全隱患。而英偉達(dá)推出的 NemoClaw 具有企業(yè)級安全保障,有助于保護(hù)敏感信息。

英偉達(dá)通過在 OpenClaw 創(chuàng)始人 Peter Steinberger 構(gòu)建的基礎(chǔ)架構(gòu)之上添加多層安全防護(hù),成功地將 OpenClaw 定位為企業(yè)級安全解決方案。老黃稱,英偉達(dá)召集了「全球頂尖的安全研究人員,對 OpenClaw 進(jìn)行了修改,使其能夠安全地部署在企業(yè)內(nèi)部。」

他同時(shí)強(qiáng)調(diào),如今每一家企業(yè)都需要制定自己的 OpenClaw 戰(zhàn)略。在黃仁勛看來,OpenClaw 以及更廣義的 Claw 系統(tǒng),未來的重要性將與 Linux、Kubernetes、HTML 等基礎(chǔ)軟件設(shè)施相提并論。



在具體技術(shù)層面,NemoClaw 就是一套讓 OpenClaw 更容易部署、也更安全運(yùn)行的基礎(chǔ)軟件工具。通過 NVIDIA Agent Toolkit,用戶只需一條命令就能完成 OpenClaw 的安裝和優(yōu)化,同時(shí)自動(dòng)部署 OpenShell 運(yùn)行時(shí)。

這個(gè)運(yùn)行時(shí)提供開源模型支持和隔離的沙箱環(huán)境,讓 AI 智能體在執(zhí)行任務(wù)、調(diào)用工具或訪問外部網(wǎng)絡(luò)時(shí),依然能夠受到安全、網(wǎng)絡(luò)和隱私策略的約束。



NemoClaw 同時(shí)支持多種 coding agent。在開放智能體模式下,它可以調(diào)用運(yùn)行在用戶本地專用系統(tǒng)上的開源模型,包括 NVIDIA Nemotron;同時(shí)通過隱私路由(privacy router),智能體也可以訪問運(yùn)行在云端的前沿模型。

本地模型與云端模型的結(jié)合,為智能體持續(xù)學(xué)習(xí)與能力擴(kuò)展提供了基礎(chǔ),使其能夠在既定的隱私與安全規(guī)則下完成更復(fù)雜的任務(wù)。

黃仁勛還提到,與 OpenClaw 搭配部署的最佳模型之一,是英偉達(dá)最近發(fā)布的 Nemotron 3 Super。這是一款面向智能體(agentic)場景的開源大語言模型。



Nemotron 3 Super 專門針對長上下文任務(wù)進(jìn)行了優(yōu)化,同時(shí)模型規(guī)?刂圃 1200 億參數(shù)。結(jié)合 NemoClaw 提供的安全層以及 Nemotron 3 Super 本身具備的隱私優(yōu)勢,英偉達(dá)基本解決了邊緣部署智能體時(shí)最關(guān)鍵的隱私限制問題。

除此之外,NemoClaw 還可以調(diào)用英偉達(dá)生態(tài)中的多種開源工具和框架,例如 cuDF、Nemotron Dynamo、cuOPT 等庫。這些組件為智能體提供了更多能力,使其在處理數(shù)據(jù)、優(yōu)化決策和執(zhí)行復(fù)雜任務(wù)時(shí)更加高效和強(qiáng)大。

從今天起,開發(fā)者可以通過以下鏈接訪問英偉達(dá)的 Agent Toolkit 和 OpenShell,也可以將 OpenShell 與 LangChain 結(jié)合使用,或者直接從 GitHub 下載并在本地運(yùn)行。



鏈接地址:https://build.nvidia.com/

企業(yè)用戶則可以通過 AWS、Google Cloud、Microsoft Azure 等云服務(wù)平臺(tái)創(chuàng)建并部署 AI 智能體。

AI 進(jìn)入物理世界

數(shù)字世界的智能體之外,AI 也正在物理世界大規(guī)模落地。

英偉達(dá)在 GTC 大會(huì)上展示了 110 臺(tái)機(jī)器人,比亞迪、現(xiàn)代、日產(chǎn)和吉利成為了英偉達(dá)最新合作伙伴,這些車企宣布將采用 NVIDIA DRIVE Hyperion 技術(shù)打造 L4 級自動(dòng)駕駛汽車。



在越來越多的汽車制造商平臺(tái)的支持下,英偉達(dá)和 Uber 計(jì)劃在 2028 年在四大洲的 28 個(gè)城市推出完全由 NVIDIA DRIVE AV 全棧軟件驅(qū)動(dòng)的自動(dòng)駕駛車隊(duì)。預(yù)計(jì)到 2027 年上半年,Uber 的自動(dòng)駕駛將會(huì)在洛杉磯和舊金山灣區(qū)率先推出。這支由 DRIVE Hyperion 提供支持的車隊(duì)將利用 NVIDIA Alpamayo 開放模型和 NVIDIA Halos 操作系統(tǒng)。

在 GTC 大會(huì)上, 英偉達(dá)宣布與大量機(jī)器人廠商合作,共同推動(dòng)生產(chǎn)規(guī)模的物理 AI 發(fā)展。英偉達(dá)發(fā)布了全新的 NVIDIA Isaac 仿真框架以及面向業(yè)界的全新 Cosmos、Isaac GR00T 開放模型,用于開發(fā)、訓(xùn)練和部署下一代智能機(jī)器人。

開放式物理 AI 數(shù)據(jù)工廠 Blueprint 則旨在對視覺 AI 智能體、機(jī)器人和自動(dòng)駕駛車輛的物理 AI 模型進(jìn)行大規(guī)模數(shù)據(jù)處理和管理、合成數(shù)據(jù)生成、強(qiáng)化學(xué)習(xí)和評估。

Keynote 最后上場的角色,是在虛擬世界中訓(xùn)練,獲得物理軀體的「雪寶」機(jī)器人,它是完全由英偉達(dá)物理 AI 全家桶構(gòu)建出來的;蛟S不久之后我們會(huì)在迪士尼樂園里看到他。



AI 的下半場才剛剛開始,你準(zhǔn)備好上車了嗎?

https://www.youtube.com/watch?v=jw_o0xr8MWU

https://nvidianews.nvidia.com/news/nvidia-vera-rubin-platform?ncid=no-ncid

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
廣東:力爭到2026年底 建成50個(gè)以上特色鮮明、功能突出的生產(chǎn)性服務(wù)業(yè)集聚區(qū)

廣東:力爭到2026年底 建成50個(gè)以上特色鮮明、功能突出的生產(chǎn)性服務(wù)業(yè)集聚區(qū)

財(cái)聯(lián)社
2026-03-26 10:15:09
中東睿評|表層沖突烈火焚燒,深層矛盾堅(jiān)如寒冰:美以對伊朗戰(zhàn)爭的表與里

中東睿評|表層沖突烈火焚燒,深層矛盾堅(jiān)如寒冰:美以對伊朗戰(zhàn)爭的表與里

澎湃新聞
2026-03-25 13:14:37
法國藝術(shù)圈地震!芭蕾女神、哲學(xué)少女,都被鋼琴家送給了愛潑斯坦!

法國藝術(shù)圈地震!芭蕾女神、哲學(xué)少女,都被鋼琴家送給了愛潑斯坦!

新歐洲
2026-02-18 19:44:34
別想再回國!中國體壇 4 大叛徒,奪冠后否認(rèn)是國人,如今遭報(bào)應(yīng)

別想再回國!中國體壇 4 大叛徒,奪冠后否認(rèn)是國人,如今遭報(bào)應(yīng)

動(dòng)物奇奇怪怪
2026-03-25 14:18:48
叔本華:性欲是一切欲望的焦點(diǎn)

叔本華:性欲是一切欲望的焦點(diǎn)

聽哲學(xué)
2026-03-24 21:42:04
87年薄一波去杭州探望陳云,期間二人神秘交談,薄提醒:你悠著點(diǎn)

87年薄一波去杭州探望陳云,期間二人神秘交談,薄提醒:你悠著點(diǎn)

談古論今歷史有道
2026-03-25 15:15:03
張雪峰死因:吃外賣撐住了?

張雪峰死因:吃外賣撐住了?

李萬卿
2026-03-26 10:48:19
前球探:切爾西擔(dān)憂加納喬的表現(xiàn),他在曼聯(lián)的問題又出現(xiàn)了

前球探:切爾西擔(dān)憂加納喬的表現(xiàn),他在曼聯(lián)的問題又出現(xiàn)了

懂球帝
2026-03-26 12:27:11
穩(wěn)居西部第二!馬刺三大年輕核心,已成聯(lián)盟無解難題!

穩(wěn)居西部第二!馬刺三大年輕核心,已成聯(lián)盟無解難題!

田先生籃球
2026-03-26 14:23:29
丑橘是轉(zhuǎn)基因水果?專家直言:這幾種水果,再便宜也不要買

丑橘是轉(zhuǎn)基因水果?專家直言:這幾種水果,再便宜也不要買

白宸侃片
2026-03-26 11:19:02
農(nóng)用無人機(jī)載客!大疆:吊銷“駕照”

農(nóng)用無人機(jī)載客!大疆:吊銷“駕照”

熱點(diǎn)科技
2026-03-26 11:30:59
四川高縣村支書暴打殘疾村婦致輕傷 法院判決免于刑事處罰引爭議

四川高縣村支書暴打殘疾村婦致輕傷 法院判決免于刑事處罰引爭議

律法刑道
2026-03-26 10:55:03
中國資產(chǎn),大漲!美聯(lián)儲(chǔ),降息大消息!

中國資產(chǎn),大漲!美聯(lián)儲(chǔ),降息大消息!

中國基金報(bào)
2026-03-26 08:22:37
1955年蔣介石想吃奉化老家的黃花泥螺,保密局知道后如何搞到的?

1955年蔣介石想吃奉化老家的黃花泥螺,保密局知道后如何搞到的?

銅臭的歷史味
2026-03-16 13:05:54
林彪的兒子要結(jié)婚,葉群在全國選美,毛主席得知說了5個(gè)字

林彪的兒子要結(jié)婚,葉群在全國選美,毛主席得知說了5個(gè)字

揚(yáng)平說史
2026-03-25 21:04:04
曼聯(lián)標(biāo)價(jià)700萬賣滕哈格愛將!2次出租英冠均重傷,實(shí)力平庸還倒霉

曼聯(lián)標(biāo)價(jià)700萬賣滕哈格愛將!2次出租英冠均重傷,實(shí)力平庸還倒霉

羅米的曼聯(lián)博客
2026-03-26 11:16:06
英國上將揭露:1997年香港回歸真相,誰敢抗衡中國解放軍?

英國上將揭露:1997年香港回歸真相,誰敢抗衡中國解放軍?

老范談史
2026-03-18 23:51:08
馬奎爾曝續(xù)約曼聯(lián)最后要求,評價(jià)紅牌停賽!重返國家隊(duì)讓媽媽落淚

馬奎爾曝續(xù)約曼聯(lián)最后要求,評價(jià)紅牌停賽!重返國家隊(duì)讓媽媽落淚

羅米的曼聯(lián)博客
2026-03-26 12:11:02
美軍全球調(diào)兵、要打地面戰(zhàn)爭?伊朗:要給特朗普一個(gè)“巨大驚喜”

美軍全球調(diào)兵、要打地面戰(zhàn)爭?伊朗:要給特朗普一個(gè)“巨大驚喜”

野史日記
2026-03-25 10:00:12
巴拿馬接手港口僅一個(gè)月,中遠(yuǎn)海運(yùn)集運(yùn)宣布恢復(fù)中東六國新訂艙業(yè)務(wù)!

巴拿馬接手港口僅一個(gè)月,中遠(yuǎn)海運(yùn)集運(yùn)宣布恢復(fù)中東六國新訂艙業(yè)務(wù)!

趣味萌寵的日常
2026-03-26 14:04:01
2026-03-26 15:16:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12604文章數(shù) 142593關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

頭條要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會(huì)喪事從簡

財(cái)經(jīng)要聞

黃仁勛:芯片公司的時(shí)代已經(jīng)結(jié)束了

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

旅游
教育
親子
時(shí)尚
數(shù)碼

旅游要聞

淡季旺銷!南明住宿業(yè)今年前兩月營收斬獲1.18億元

教育要聞

高考地理中的花海經(jīng)濟(jì)

親子要聞

躺平的孩子意外覺醒了,在父母學(xué)會(huì)當(dāng)“烏龜”!

2026年了,最好看的還是“這件針織”!

數(shù)碼要聞

配件制造商清單泄露:2026款iPad將搭載A18芯片

無障礙瀏覽 進(jìn)入關(guān)懷版