国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

剛剛,黃仁勛又讓整個硅谷睡不著了

0
分享至



圣何塞SAP中心,凌晨2點。黃仁勛再次穿著那件似乎永遠不會舊的黑皮衣走上臺。這場長達2小時的演講中,老黃扔出了狂扔“核彈”。

第一顆炸彈:Vera Rubin平臺。七款全新芯片全面投產(chǎn),Vera Rubin平臺由七款突破性芯片、五個機架和一個巨型超級計算機組成。同時發(fā)布Vera CPU,效率是傳統(tǒng)機架式CPU的兩倍,速度提升50%。

第二顆炸彈:1萬億美元。黃仁勛在臺上宣布,英偉達目前看到了至少1萬億美元的需求訂單,覆蓋到2027年。

第三顆炸彈:Token成為商品。“Token是新的商品?!秉S仁勛公開詳細闡述了AI工廠的商業(yè)模式——Token的分層定價體系,從免費層到premium層。

第四顆炸彈:為OpenClaw社區(qū)發(fā)布 NemoClaw。這款開源項目“在幾周內(nèi)就做到了linux 30年才做到的事”,黃仁勛斷言:“每一家公司都需要OpenClaw戰(zhàn)略?!?/p>

這場發(fā)布會留下了太多需要消化的信息。芯片、工廠、機器人、AI Agent......每一個詞都可能是下一個萬億市場的入口。如果你今晚錯過了這場直播,這篇文章會告訴你黃仁勛到底說了什么。

01
芯片核武器庫

Vera Rubin來了。

Vera Rubin是英偉達為“代理式AI”(Agentic AI)專門設計的新一代計算平臺。

與上一代Blackwell 平臺相比,Vera Rubin展現(xiàn)了驚人的效能躍進。該系統(tǒng)僅需1/4的GPU 即可完成混合專家大模型(MoE)的訓練,且每瓦推論吞吐量飆升高達10 倍,成功將單Token的生成成本降至十分之一。在基礎設施配置上,新一代的NVL72機架通過第六代NVLink連接了72塊Rubin GPU與36塊Vera CPU。黃仁勛特別指出,第六代NVLink交換系統(tǒng)是極度難以實現(xiàn)的技術,但英偉達成功達成了這項創(chuàng)舉。



此外,Vera Rubin系統(tǒng)采用100%液冷設計,使用45°C的溫水進行冷卻,徹底移除了傳統(tǒng)繁雜的纜線。這不僅大幅減輕了數(shù)據(jù)中心的冷卻壓力與能源成本,更將過去需要花費兩天才能完成的安裝時間,驚人地縮短至僅需兩小時。

該平臺整合了Vera CPU、Rubin GPU、NVLink 6 交換機、ConnectX - 9 超級網(wǎng)卡、BlueField - 4 DPU和Spectrum-6 以太網(wǎng)交換機,以及新集成的Groq 3 LPU。這些芯片協(xié)同工作,構成一臺強大的AI 超級計算機,為 AI 的各個階段提供支持——從大規(guī)模預訓練、后訓練和測試時擴展,到實時智能推理。

黃仁勛表示:“Vera Rubin 是一次代際飛躍——它由七款突破性芯片、五個機架和一個巨型超級計算機組成,旨在為人工智能的各個階段提供強大支持?!?/p>

Vera CPU強勢登場

本次大會的一大亮點,是英偉達首度展現(xiàn)其在中央處理器(CPU)領域的強大野心。英偉達最初于2022年GTC大會上發(fā)布了第一代Grace CPU,今晚老黃正式發(fā)布了Vera CPU和Vera CPU機架,標志著英偉達正式進軍CPU直銷領域,成為傳統(tǒng)CPU市場中英特爾和AMD的有力競爭對手。



Vera CPU的定位是大規(guī)模數(shù)據(jù)處理、AI 訓練和智能體推理場景,其效率是傳統(tǒng)機架式CPU 的兩倍,速度提升50%。

為了應對AI使用工具時所需的極速反應,Vera CPU專為極高的單線程效能、強大的資料處理能力與極致的能源效率而設計。單顆Vera芯片配備了88個核心與144個線程,采用英偉達深度定制化的Arm v9.2-A Olympus核心,其指令級平行度(IPC)實現(xiàn)了1.5倍的代際提升。

更具革命性的是,該架構首發(fā)引入了"空間多線程(Spatial Multithreading)"黑科技,通過實體隔離流水線組件,讓多個線程能真正在單核上同時運行,徹底消除了傳統(tǒng)多線程技術因資源排隊而造成的算力損耗。Vera CPU也是全球首款采用LPDDR5的數(shù)據(jù)中心CPU,提供無與倫比的單線程效能與每瓦效能。

作為NVIDIA Vera Rubin NVL72平臺的一部分,Vera CPU通過NVLink-C2C互連技術與GPU配對,提供1.8 TB/s的相干帶寬(是PCIe Gen 6帶寬的7倍),實現(xiàn)CPU和GPU之間的高速數(shù)據(jù)共享。

英偉達表示,阿里巴巴、CoreWeave、Meta和Oracle云基礎設施,以及戴爾科技、HPE、聯(lián)想、超微等全球系統(tǒng)制造商都與NVIDIA合作部署Vera。同時,英偉達發(fā)布了Vera CPU機架,提供基于NVIDIA MGX的密集型液冷基礎設施,集成256個Vera CPU,可提供可擴展、節(jié)能的容量以及世界一流的單線程性能,從而大規(guī)模釋放智能AI的潛力。

Vera CPU目前已全面投產(chǎn),預計將于今年下半年開始交付。

收購Groq后,LPU登場



英偉達收購了開發(fā)Groq芯片的團隊,并將其技術與Vera Rubin深度整合。

為什么需要LPU?

與大多數(shù)依賴HBM作為工作內(nèi)存層的AI加速器不同,Groq 3 LPU每個芯片都集成了500MB的SRAM。這種內(nèi)存也用于CPU和GPU的超高速緩存。雖然與每個Rubin GPU上容量高達288GB的HBM4相比,這顯得微不足道,但這塊SRAM可提供150 TB/s的帶寬,遠高于HBM的22 TB/s。對于帶寬敏感型AI解碼操作而言,Groq 3芯片帶寬的大幅提升為推理應用帶來了誘人的優(yōu)勢。

兩種處理器的統(tǒng)一:LPU + Vera Rubin。“我們想出了一個絕妙的主意,”黃仁勛解釋道,“我們將推理過程完全重新架構。我們把適合Vera Rubin的工作放在Vera Rubin上,然后把解碼生成、低延遲、帶寬受限的部分卸載到LPU上?!?/p>

這兩種極端處理器的統(tǒng)一:一個為高吞吐量,一個為低延遲,產(chǎn)生了令人震驚的效果:每兆瓦功耗的推理吞吐量最高可提升35倍,萬億參數(shù)模型的收益機會最高可提升10倍。

“35倍,”黃仁勛重復了一遍,“這是世界從未見過的。”





英偉達構建了包含256個Groq 3 LPU的Groq 3 LPX機架。該機架提供128GB的SRAM和40 PB/s的推理加速帶寬,并通過每個機架640 TB/s的專用擴展接口將這些芯片連接起來。

大規(guī)模部署時,LPU 集群可作為一個巨型單處理器,實現(xiàn)快速、確定性的推理加速。與Vera Rubin NVL72 集成,Rubin GPU 和 LPU 通過聯(lián)合計算每個輸出標記的 AI 模型每一層,顯著提升解碼速度。

LPX采用全液冷設計,基于MGX基礎設施構建,可無縫集成到將于今年下半年推出的下一代Vera Rubin AI工廠中。

重塑網(wǎng)絡與AI 原生存儲架構

在網(wǎng)絡連接與集群擴展方面,英偉達展示了全新一代的Kyber機架,這是一款專為Rubin Ultra 運算節(jié)點設計的系統(tǒng)。有別于傳統(tǒng)的水平插拔,Kyber 采用垂直插入設計,通過背板的中板(Midplane)連接,成功在單一NVLink 網(wǎng)域內(nèi)連接多達144 個GPU,突破了傳統(tǒng)銅纜連接的距離限制。

同時,英偉達也與臺積電合作,獨家量產(chǎn)名為COUPE的革命性共同封裝光學(CPO)技術,并應用于全球首款CPO Spectrum-X 交換器中,讓光學信號直接與芯片對接。

英偉達重新設計了整個存儲系統(tǒng):BlueField - 4 STX 存儲機架??蓪?GPU 內(nèi)存無縫擴展到整個 POD(物理數(shù)據(jù)中心)。STX 由 BlueField-4 提供支持,BlueField-4 結合了Vera CPU和ConnectX-9 SuperNIC,可提供高帶寬共享層,該層針對存儲和檢索大型語言模型和智能 AI 工作流生成的海量鍵值緩存數(shù)據(jù)進行了優(yōu)化。

太空計算也來了



在GTC大會上,老黃還發(fā)布了NVIDIA Space-1 Vera Rubin模塊,標志著英偉達正式推出太空計算服務。與NVIDIA H100 GPU相比,該模塊上的Rubin GPU可為基于太空的推理提供高達25倍的AI計算能力,從而為ODC(分布式計算中心)、高級地理空間智能處理和自主太空操作提供下一代計算能力。

根據(jù)英偉達官方新聞稿,Vera Rubin 空間模塊專為在太空直接運行 LLM 和高級基礎模型的軌道數(shù)據(jù)中心而設計,它采用緊密集成的CPU-GPU 架構和高帶寬互連,旨在實時處理來自太空儀器的大量數(shù)據(jù)流。

黃仁勛說到:“太空計算,這片最后的疆域,已經(jīng)到來。隨著我們部署衛(wèi)星星座并深入探索太空,智能必須存在于數(shù)據(jù)產(chǎn)生的任何地方?!?/p>



這場發(fā)布會還展示了完整的芯片路線圖?!懊磕暌粋€全新架構,”黃仁勛總結道,“這就是英偉達的速度?!?/p>

02
1萬億美元:英偉達看到的需求

“5000億美元?!边@是去年GTC大會上,黃仁勛公布的英偉達看到的高置信度需求和采購訂單。

當時他認為這個數(shù)字已經(jīng)非常驚人?!暗F(xiàn)在,一年過去了,就在我現(xiàn)在站的位置,我看到了至少1萬億美元的需求,覆蓋到2027年。”

為什么需求會這么大?“因為推理的轉(zhuǎn)折點已經(jīng)到來。”黃仁勛在演講中詳細解釋了原因。

過去兩年發(fā)生了什么?“三件事情?!秉S仁勛回顧道。第一,ChatGPT開啟了生成AI時代。“它不只是理解和感知,還能翻譯和生成獨特的內(nèi)容?!?strong>第二,推理AI(o1/o3)出現(xiàn)了。“它能反思,能思考,能規(guī)劃,能把一個無法理解的問題分解成能理解的步驟。這讓ChatGPT真正起飛了。”第三,claude code出現(xiàn)了:第一個代理式模型。“它能讀文件、寫代碼、編譯、測試、評估、迭代。claude code徹底改變了軟件工程?!?/p>

黃仁勛說了一個關鍵數(shù)據(jù):"過去兩年,AI的計算需求增加了大約1萬倍。AI現(xiàn)在必須思考。為了思考、為了執(zhí)行、為了閱讀,它都必須推理。每一次交互,它都在推理。過去的訓練時代已經(jīng)過去了?,F(xiàn)在是推理的時代。”這就是1萬億美元需求的來源。每一個公司都在建設AI工廠,每一個工廠都需要Token生產(chǎn)。

Token是新的商品

“Token是新的商品?!碑旤S仁勛在GTC 2026上說出這句話時,整個AI行業(yè)的商業(yè)模式正在被重新定義。在黃仁勛展示的那張“最重要的圖表”上,橫軸是Token速率,縱軸是吞吐量。這張圖表將決定未來每一個CEO的決策——因為它直接關系到AI工廠的營收。



黃仁勛詳細解釋了AI工廠的商業(yè)模式,其中提到了Token的分層定價:

  • 免費層:高吞吐量、低速度——用于吸引用戶
  • 第一層:中等速度——$3/百萬Token
  • 第二層:高速度、長上下文——$45/百萬Token
  • premium層:超高速度——$150/百萬Token

“就像任何行業(yè)一樣,"黃仁勛解釋道,"更高的質(zhì)量,更高的性能,更低的容量。Grace Blackwell在你的免費層提升了巨大吞吐量,但在你最能變現(xiàn)的層級,它提升了35倍。Vera Rubin又在這個基礎上提升了10倍。

“假設你用25%的電力在免費層,25%在中等層,25%在高層層,25%在premium層。你的數(shù)據(jù)中心只有1吉瓦。你需要決定如何分配?!秉S仁勛算了一筆賬:免費層吸引用戶,premium層服務最有價值的客戶。這種組合,按照這張圖表計算——Blackwell可以產(chǎn)生5倍的營收,Vera Rubin又是5倍。



"你應該在Vera Rubin上盡快行動,"黃仁勛建議道,"因為你的Token成本會下降,吞吐量會上升。"

"在兩年時間內(nèi),在一個1吉瓦的工廠中,使用我之前展示的數(shù)學,摩爾定律只能給我們帶來幾個步驟的提升。但有了這個架構,我們的Token生成速率將從200萬提升到7億,提升350倍。"這就是“極致協(xié)同設計”的力量。黃仁勛稱之為“垂直整合然后水平開放”的策略。

03
黃仁勛夸贊龍蝦

"OpenClaw是人類歷史上最受歡迎的開源項目。它在幾周內(nèi)就做到了Linux 30年才做到的事。"

當黃仁勛宣布英偉達支持OpenClaw時,全場再次沸騰。OpenClaw是一個Agentic系統(tǒng)(代理式系統(tǒng))的操作系統(tǒng)。它連接大型語言模型,管理資源,訪問工具和文件系統(tǒng),執(zhí)行調(diào)度,創(chuàng)建子代理,這些能力讓它幾乎就是一個完整的操作系統(tǒng)。

“在OpenClaw出現(xiàn)之前,個人電腦因為Windows而成為可能,“黃仁勛說道,”現(xiàn)在,OpenClaw讓創(chuàng)建個人Agent成為可能。其含義是深遠的?!?/p>

Agentic系統(tǒng)可以訪問敏感信息、執(zhí)行代碼、與外部通信,這帶來了巨大的安全挑戰(zhàn)。英偉達推出了NemoClaw,使用NVIDIA Agent Toolkit軟件,只需一條命令即可優(yōu)化 OpenClaw。它安裝OpenShell,提供開放模型和隔離的沙箱,為自主代理增加數(shù)據(jù)隱私和安全保障。

04
結語

從一塊GPU到一座AI工廠,黃仁勛用十年時間完成了英偉達的進化。GTC 2026的大幕已經(jīng)拉開。看完這場發(fā)布會,你最關心的問題是什么?

你覺得英偉達的下一個十年會被"神化"還是"拉下神壇"?

評論區(qū)聊聊。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
阿努廷,“狂飆突進”

阿努廷,“狂飆突進”

中國新聞周刊
2026-03-25 22:26:41
沒想到不翻不知道,一翻嚇一跳,張雪峰幾乎每個月都在網(wǎng)上喊累

沒想到不翻不知道,一翻嚇一跳,張雪峰幾乎每個月都在網(wǎng)上喊累

歲月有情1314
2026-03-26 12:13:10
Manus的兩名聯(lián)合創(chuàng)始人被告知不要離開中國

Manus的兩名聯(lián)合創(chuàng)始人被告知不要離開中國

新浪財經(jīng)
2026-03-26 13:50:59
4月1日醫(yī)保7號令落地!1965-1985年出生的,這6件事務必抓緊辦

4月1日醫(yī)保7號令落地!1965-1985年出生的,這6件事務必抓緊辦

混沌錄
2026-03-25 15:50:11
博主被陌生網(wǎng)友辱罵3個月,默默觀察其2年半,終于找到機會碰面了

博主被陌生網(wǎng)友辱罵3個月,默默觀察其2年半,終于找到機會碰面了

離離言幾許
2026-03-26 15:01:41
大陸對全體臺胞發(fā)出邀請:兩岸統(tǒng)一之時,即可從臺島自駕直達北京

大陸對全體臺胞發(fā)出邀請:兩岸統(tǒng)一之時,即可從臺島自駕直達北京

小童歷史
2026-03-25 18:20:29
伊朗軍方:霍爾木茲海峽局勢發(fā)展由伊朗掌控

伊朗軍方:霍爾木茲海峽局勢發(fā)展由伊朗掌控

澎湃新聞
2026-03-26 01:17:13
突發(fā)!以色列徹底失控!

突發(fā)!以色列徹底失控!

財經(jīng)要參
2026-03-26 21:58:11
砸6700億建雄安,面積抵3個紐約,如今究竟咋樣了?

砸6700億建雄安,面積抵3個紐約,如今究竟咋樣了?

娛樂圈的筆娛君
2026-03-26 12:15:32
現(xiàn)貨黃金跌幅擴大至2.5%

現(xiàn)貨黃金跌幅擴大至2.5%

財聯(lián)社
2026-03-27 00:24:12
伊朗稱已組織超百萬人為地面戰(zhàn)斗做準備

伊朗稱已組織超百萬人為地面戰(zhàn)斗做準備

財聯(lián)社
2026-03-26 22:50:26
曾在恒大賺上億!40歲郜林吐槽:在中乙當老總1個月工資不夠油費

曾在恒大賺上億!40歲郜林吐槽:在中乙當老總1個月工資不夠油費

我愛英超
2026-03-26 20:47:14
萬科高管被要求退還薪酬

萬科高管被要求退還薪酬

地產(chǎn)微資訊
2026-03-26 12:22:04
聯(lián)大通過決議,宣布“最嚴重反人類罪”

聯(lián)大通過決議,宣布“最嚴重反人類罪”

澎湃新聞
2026-03-26 11:03:06
人狂自有天收

人狂自有天收

李老逵亂擺龍門陣
2025-09-11 09:01:28
翻到張雪峰2016年婚紗照,瞬間看哭了!

翻到張雪峰2016年婚紗照,瞬間看哭了!

魔都姐姐雜談
2026-03-26 22:06:50
突發(fā),雷軍辭職董事長!

突發(fā),雷軍辭職董事長!

品牌頭版
2026-03-26 14:46:17
尺度大到曾下架!模特冠軍泳裝大雷出演影游即將發(fā)售

尺度大到曾下架!模特冠軍泳裝大雷出演影游即將發(fā)售

游民星空
2026-03-26 11:58:13
手機放床頭輻射傷身?央視實驗給出答案:這樣放手機,輻射降10倍

手機放床頭輻射傷身?央視實驗給出答案:這樣放手機,輻射降10倍

天氣觀察站
2026-03-24 19:02:53
中國、俄羅斯、伊朗等123票贊成,美國、以色列等3票反對,聯(lián)合國認定:最嚴重反人類罪!英法德日等52國投棄權票

中國、俄羅斯、伊朗等123票贊成,美國、以色列等3票反對,聯(lián)合國認定:最嚴重反人類罪!英法德日等52國投棄權票

每日經(jīng)濟新聞
2026-03-26 13:25:09
2026-03-27 03:16:49
半導體產(chǎn)業(yè)縱橫 incentive-icons
半導體產(chǎn)業(yè)縱橫
探索IC產(chǎn)業(yè)無限可能。
2600文章數(shù) 1309關注度
往期回顧 全部

科技要聞

美團發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

親子
本地
時尚
教育
藝術

親子要聞

試工育兒嫂被查出傳染病,寶媽崩潰!家政服務“健康關”如何保障?

本地新聞

救命,這只醬板鴨已經(jīng)在我手機復仇了一萬遍

400萬人愛過的女孩,被黃謠網(wǎng)暴180天后

教育要聞

精準研判,提質(zhì)增效丨我校召開2026屆畢業(yè)生就業(yè)工作研判會

藝術要聞

北京大興機場和青島膠東機場“撞臉”,長得像就是抄襲?

無障礙瀏覽 進入關懷版