国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

剛剛,黃仁勛一口氣解密6顆芯片,召喚出最強(qiáng)AI超算!

黃仁勛一口氣解密6顆芯片

0
分享至


智東西
作者 ZeR0 陳駿達(dá)
編輯 漠影

芯東西拉斯維加斯1月5日?qǐng)?bào)道,剛剛,英偉達(dá)創(chuàng)始人兼CEO黃仁勛在國(guó)際消費(fèi)電子展CES 2026上發(fā)表2026年首場(chǎng)主題演講。黃仁勛一如既往穿著皮衣,在1.5小時(shí)內(nèi)連宣8項(xiàng)重要發(fā)布,從芯片、機(jī)架到網(wǎng)絡(luò)設(shè)計(jì),對(duì)整個(gè)全新代際平臺(tái)進(jìn)行了深入介紹。


在加速計(jì)算和AI基礎(chǔ)設(shè)施領(lǐng)域,英偉達(dá)發(fā)布NVIDIA Vera Rubin POD AI超級(jí)計(jì)算機(jī)、NVIDIA Spectrum-X以太網(wǎng)共封裝光學(xué)器件、NVIDIA推理上下文內(nèi)存存儲(chǔ)平臺(tái)、基于DGX Vera Rubin NVL72的NVIDIA DGX SuperPOD。


NVIDIA Vera Rubin POD采用英偉達(dá)6大自研芯片,涵蓋CPU、GPU、Scale-up、Scale-out、存儲(chǔ)與處理能力,所有部分均為協(xié)同設(shè)計(jì),可滿(mǎn)足先進(jìn)模型需求并降低計(jì)算成本。

其中,Vera CPU采用定制Olympus核心架構(gòu),Rubin GPU引入Transformer引擎后NBFP4推理性能高達(dá)50PFLOPS,每GPU NVLink帶寬快至3.6TB/s,支持第三代通用機(jī)密計(jì)算(第一個(gè)機(jī)架級(jí)TEE),實(shí)現(xiàn)CPU與GPU跨域的完整可信執(zhí)行環(huán)境。


這些芯片均已回片,英偉達(dá)已對(duì)整個(gè)NVIDIA Vera Rubin NVL72系統(tǒng)進(jìn)行驗(yàn)證,合作伙伴也已開(kāi)始運(yùn)行其內(nèi)部集成的AI模型和算法,整個(gè)生態(tài)系統(tǒng)都在為Vera Rubin做部署準(zhǔn)備。

其他發(fā)布中,NVIDIA Spectrum-X以太網(wǎng)共封裝光學(xué)器件顯著優(yōu)化了電源效率和應(yīng)用正常運(yùn)行時(shí)間;NVIDIA推理上下文內(nèi)存存儲(chǔ)平臺(tái)重新定義了存儲(chǔ)堆棧,以減少重復(fù)計(jì)算并提升推理效率;基于DGX Vera Rubin NVL72的NVIDIA DGX SuperPOD將大型MoE模型的token成本降低至1/10。


開(kāi)放模型方面,英偉達(dá)宣布擴(kuò)展開(kāi)源模型全家桶,發(fā)布新的模型、數(shù)據(jù)集和庫(kù),包括NVIDIA Nemotron開(kāi)源模型系列新增Agentic RAG模型、安全模型、語(yǔ)音模型,還發(fā)布了適用于所有類(lèi)型機(jī)器人的全新開(kāi)放模型。不過(guò),黃仁勛并未在演講中詳細(xì)介紹。

物理AI方面,物理AI的ChatGPT時(shí)刻已經(jīng)到來(lái),英偉達(dá)全棧技術(shù)使全球生態(tài)系統(tǒng)能通過(guò)AI驅(qū)動(dòng)的機(jī)器人技術(shù)改變行業(yè);英偉達(dá)廣泛的AI工具庫(kù),包括全新Alpamayo開(kāi)源模型組合,使全球交通行業(yè)能快速實(shí)現(xiàn)安全的L4駕駛;NVIDIA DRIVE自動(dòng)駕駛平臺(tái)現(xiàn)已投入生產(chǎn),搭載于所有全新梅賽德斯-奔馳CLA,用于L2++ AI定義的駕駛。


一、全新AI超級(jí)計(jì)算機(jī):6款自研芯片,單機(jī)架算力達(dá)3.6EFLOPS

黃仁勛認(rèn)為,每10到15年,計(jì)算機(jī)行業(yè)就會(huì)迎來(lái)一次全面的重塑,但這次,兩個(gè)平臺(tái)變革同時(shí)發(fā)生,從CPU到GPU,從“編程軟件”到“訓(xùn)練軟件”,加速計(jì)算與AI重構(gòu)了整個(gè)計(jì)算堆棧。過(guò)去十年價(jià)值10萬(wàn)億美元的計(jì)算產(chǎn)業(yè),正在經(jīng)歷一場(chǎng)現(xiàn)代化改造。

與此同時(shí),對(duì)算力的需求也急劇飆升。模型的尺寸每年增長(zhǎng)10倍,模型用于思考的token數(shù)量每年增長(zhǎng)5倍,而每個(gè)token的價(jià)格每年降低10倍。


為了應(yīng)對(duì)這一需求,英偉達(dá)決定每年都發(fā)布新的計(jì)算硬件。黃仁勛透露,目前Vera Rubin也已經(jīng)全面開(kāi)啟生產(chǎn)。

英偉達(dá)全新AI超級(jí)計(jì)算機(jī)NVIDIA Vera Rubin POD采用了6款自研芯片:Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9(CX9)智能網(wǎng)卡、BlueField-4 DPU、Spectrum-X 102.4T CPO。

(1)Vera CPU:為數(shù)據(jù)移動(dòng)和智能體處理而設(shè)計(jì),擁有88個(gè)英偉達(dá)定制Olympus核心、176線(xiàn)程的英偉達(dá)空間多線(xiàn)程,1.8TB/sNVLink-C2C支持CPU:GPU統(tǒng)一內(nèi)存,系統(tǒng)內(nèi)存達(dá)1.5TB(是Grace CPU的3倍),SOCAMM LPDDR5X內(nèi)存帶寬為1.2TB/s,并支持機(jī)架級(jí)機(jī)密計(jì)算,數(shù)據(jù)處理性能翻倍提升。


(2)Rubin GPU:引入Transformer引擎,NVFP4推理性能高達(dá)50PFLOPS,是Blackwell GPU的5倍,向后兼容,在保持推理精度的同時(shí)提升BF16/FP4級(jí)別的性能;NVFP4訓(xùn)練性能達(dá)到35PFLOPS,是Blackwell的3.5倍

Rubin也是首個(gè)支持HBM4的平臺(tái),HBM4帶寬達(dá)22TB/s,是上一代的2.8倍,能夠?yàn)榭量痰腗oE模型和AI工作負(fù)載提供所需性能。


(3)NVLink 6 Switch:單lane速率提升至400Gbps,采用SerDes技術(shù)實(shí)現(xiàn)高速信號(hào)傳輸;每顆GPU可實(shí)現(xiàn)3.6TB/s的全互連通信帶寬,是上一代的2倍,總帶寬為28.8TB/s,F(xiàn)P8精度下in-network計(jì)算性能達(dá)到14.4TFLOPS,支持100%液冷。


(4)NVIDIA ConnectX-9 SuperNIC:每顆GPU提供1.6Tb/s帶寬,針對(duì)大規(guī)模AI進(jìn)行了優(yōu)化,具備完全軟件定義、可編程、加速的數(shù)據(jù)路徑。


(5)NVIDIA BlueField-4:800Gbps DPU, 用于智能網(wǎng)卡和存儲(chǔ)處理器,配備64核Grace CPU,結(jié)合ConnectX-9 SuperNIC,用于卸載網(wǎng)絡(luò)與存儲(chǔ)相關(guān)的計(jì)算任務(wù),同時(shí)增強(qiáng)了網(wǎng)絡(luò)安全能力,計(jì)算性能是上一代的6倍,內(nèi)存帶寬達(dá)3倍,GPU訪(fǎng)問(wèn)數(shù)據(jù)存儲(chǔ)的速度提升至2倍。


(6)NVIDIA Vera Rubin NVL72:在系統(tǒng)層面將上述所有組件整合成單機(jī)架處理系統(tǒng),擁有2萬(wàn)億顆晶體管,NVFP4推理性能達(dá)3.6EFLOPS,NVFP4訓(xùn)練性能達(dá)2.5EFLOPS

該系統(tǒng)LPDDR5X內(nèi)存容量達(dá)54TB,是上一代的2.5倍;總HBM4內(nèi)存達(dá)20.7TB,是上一代的1.5倍;HBM4帶寬是1.6PB/s,是上一代的2.8倍;總縱向擴(kuò)展帶寬達(dá)到260TB/s,超過(guò)全球互聯(lián)網(wǎng)的總帶寬規(guī)模。


該系統(tǒng)基于第三代MGX機(jī)架設(shè)計(jì),計(jì)算托盤(pán)采用模塊化、無(wú)主機(jī)、無(wú)纜化、無(wú)風(fēng)扇設(shè)計(jì),使組裝和維護(hù)速度比GB200快18倍。原本需要2小時(shí)的組裝工作,現(xiàn)在只需5分鐘左右,而原本系統(tǒng)使用約80%的液冷,目前已經(jīng)100%使用液冷。


NVLink Switch托盤(pán)顆實(shí)現(xiàn)零停機(jī)維護(hù)與容錯(cuò),在托盤(pán)被移除或部分部署時(shí)機(jī)架仍可運(yùn)行。第二代RAS引擎可進(jìn)行零停機(jī)運(yùn)行狀況檢查。

這些特性提升了系統(tǒng)運(yùn)行時(shí)間與吞吐率,進(jìn)一步降低訓(xùn)練與推理成本,滿(mǎn)足數(shù)據(jù)中心對(duì)高可靠性、高可維護(hù)性的要求。

已有超過(guò)80家MGX合作伙伴準(zhǔn)備好支持Rubin NVL72在超大規(guī)模網(wǎng)絡(luò)中的部署。

二、三大新品爆改AI推理效率:新CPO器件、新上下文存儲(chǔ)層、新DGX SuperPOD

同時(shí),英偉達(dá)發(fā)布了3款重要新品:NVIDIA Spectrum-X以太網(wǎng)共封裝光學(xué)器件、NVIDIA推理上下文內(nèi)存存儲(chǔ)平臺(tái)、基于DGX Vera Rubin NVL72的NVIDIA DGX SuperPOD

1、NVIDIA Spectrum-X以太網(wǎng)共封裝光學(xué)器件

NVIDIA Spectrum-X以太網(wǎng)共封裝光學(xué)器件基于Spectrum-X架構(gòu),采用2顆芯片設(shè)計(jì),采用200Gbps SerDes,每顆ASIC顆可提供102.4Tb/s帶寬。

該交換平臺(tái)包括一個(gè)512端口高密度系統(tǒng),以及一個(gè)128端口緊湊系統(tǒng),每個(gè)端口的速率均為800Gb/s。


CPO(共封裝光學(xué))交換系統(tǒng)可實(shí)現(xiàn)5倍的能效提升、10倍的可靠性提升、5倍的應(yīng)用程序正常運(yùn)行時(shí)間提升。

這意味著每天可以處理更多token,從而進(jìn)一步降低數(shù)據(jù)中心的總擁有成本(TCO)。

2、NVIDIA推理上下文內(nèi)存存儲(chǔ)平臺(tái)

NVIDIA推理上下文內(nèi)存存儲(chǔ)平臺(tái)是一個(gè)POD級(jí)AI原生存儲(chǔ)基礎(chǔ)設(shè)施,用于存儲(chǔ)KV Cache,基于BlueField-4與Spectrum-X Ethernet加速,與NVIDIA Dynamo和NVLink緊密耦合,實(shí)現(xiàn)內(nèi)存、存儲(chǔ)、網(wǎng)絡(luò)之間的協(xié)同上下文調(diào)度。

該平臺(tái)將上下文作為一等數(shù)據(jù)類(lèi)型處理,可實(shí)現(xiàn)5倍的推理性能、5倍的更優(yōu)能效。


這對(duì)改進(jìn)多輪對(duì)話(huà)、RAG、Agentic多步推理等長(zhǎng)上下文應(yīng)用至關(guān)重要,這些工作負(fù)載高度依賴(lài)上下文在整個(gè)系統(tǒng)中被高效存儲(chǔ)、復(fù)用與共享的能力。

AI正在從聊天機(jī)器人演進(jìn)為Agentic AI(智能體),會(huì)推理、調(diào)用工具并長(zhǎng)期維護(hù)狀態(tài),上下文窗口已擴(kuò)展到數(shù)百萬(wàn)個(gè)token。這些上下文保存在KV Cache中,每一步都重新計(jì)算會(huì)浪費(fèi)GPU時(shí)間并帶來(lái)巨大延遲,因此需要存儲(chǔ)。

但GPU顯存雖快卻稀缺,傳統(tǒng)網(wǎng)絡(luò)存儲(chǔ)對(duì)短期上下文而言效率過(guò)低。AI推理瓶頸正從計(jì)算轉(zhuǎn)向上下文存儲(chǔ)。所以需要一個(gè)介于GPU與存儲(chǔ)之間、專(zhuān)為推理優(yōu)化的新型內(nèi)存層。


這一層不再是事后補(bǔ)丁,而必須與網(wǎng)絡(luò)存儲(chǔ)協(xié)同設(shè)計(jì),以最低的開(kāi)銷(xiāo)移動(dòng)上下文數(shù)據(jù)。

作為一種新型存儲(chǔ)層級(jí),NVIDIA推理上下文內(nèi)存存儲(chǔ)平臺(tái)并不直接存在于主機(jī)系統(tǒng)中,而是通過(guò)BlueField-4連接到計(jì)算設(shè)備之外。其關(guān)鍵優(yōu)勢(shì)在于,可以更高效地?cái)U(kuò)展存儲(chǔ)池規(guī)模,從而避免重復(fù)計(jì)算KV Cache。

英偉達(dá)正與存儲(chǔ)合作伙伴緊密合作,將NVIDIA推理上下文內(nèi)存存儲(chǔ)平臺(tái)引入Rubin平臺(tái),使客戶(hù)能夠?qū)⑵渥鳛橥暾葾I基礎(chǔ)設(shè)施的一部分進(jìn)行部署。

3、基于Vera Rubin構(gòu)建的NVIDIA DGX SuperPOD

在系統(tǒng)層面,NVIDIA DGX SuperPOD作為大規(guī)模AI工廠(chǎng)部署藍(lán)圖,采用8套DGX Vera Rubin NVL72系統(tǒng),用NVLink 6縱向擴(kuò)展網(wǎng)絡(luò),用Spectrum-X Ethernet橫向擴(kuò)展網(wǎng)絡(luò),內(nèi)置NVIDIA推理上下文內(nèi)存存儲(chǔ)平臺(tái),并經(jīng)過(guò)工程化驗(yàn)證。

整個(gè)系統(tǒng)由NVIDIA Mission Control軟件管理,實(shí)現(xiàn)極致效率??蛻?hù)可將其作為交鑰匙平臺(tái)部署,用更少GPU完成訓(xùn)練與推理任務(wù)。

由于在6款芯片、托盤(pán)、機(jī)架、Pod、數(shù)據(jù)中心與軟件層面實(shí)現(xiàn)了極致協(xié)同設(shè)計(jì),Rubin平臺(tái)在訓(xùn)練與推理成本上實(shí)現(xiàn)了大幅下降。與上一代Blackwell相比,訓(xùn)練相同規(guī)模的MoE模型,僅需1/4的GPU數(shù)量;在相同延遲下,大型MoE模型的token成本降低至1/10。


采用DGX Rubin NVL8系統(tǒng)的NVIDIA DGX SuperPOD也一并發(fā)布。


借助Vera Rubin架構(gòu),英偉達(dá)正與合作伙伴和客戶(hù)一起,構(gòu)建世界上規(guī)模最大、最先進(jìn)、成本最低的AI系統(tǒng),加速AI的主流化落地。

Rubin基礎(chǔ)設(shè)施將于今年下半年通過(guò)CSP與系統(tǒng)集成商提供,微軟等將成為首批部署者。

三、開(kāi)放模型宇宙再擴(kuò)展:新模型、數(shù)據(jù)、開(kāi)源生態(tài)的重要貢獻(xiàn)者

在軟件與模型層面,英偉達(dá)繼續(xù)加大開(kāi)源投入。

OpenRouter等主流開(kāi)發(fā)平臺(tái)顯示,過(guò)去一年,AI模型使用量增長(zhǎng)20倍,其中約1/4的token來(lái)自開(kāi)源模型。


2025年,英偉達(dá)是Hugging Face上開(kāi)源模型、數(shù)據(jù)和配方的最大貢獻(xiàn)者,發(fā)布了650個(gè)開(kāi)源模型和250個(gè)開(kāi)源數(shù)據(jù)集。


英偉達(dá)的開(kāi)源模型在多項(xiàng)排行榜中名列前茅。開(kāi)發(fā)者不僅可以使用這些開(kāi)源模型,還可以從中學(xué)習(xí)、持續(xù)訓(xùn)練、擴(kuò)展數(shù)據(jù)集,并使用開(kāi)源工具和文檔化技術(shù)來(lái)構(gòu)建AI系統(tǒng)。


受到Perplexity的啟發(fā),黃仁勛觀察到,Agents應(yīng)該是多模型、多云和混合云的,這也是Agentic AI系統(tǒng)的基本架構(gòu),幾乎所有的創(chuàng)企都在采用。


借助英偉達(dá)提供的開(kāi)源模型和工具,開(kāi)發(fā)者現(xiàn)在也可以定制AI系統(tǒng),并使用最前沿的模型能力。目前,英偉達(dá)已經(jīng)將上述框架整合為“藍(lán)圖”,并集成到SaaS平臺(tái)中去。用戶(hù)可以借助藍(lán)圖實(shí)現(xiàn)快速部署。

現(xiàn)場(chǎng)演示的案例中,這一系統(tǒng)系統(tǒng)可以根據(jù)用戶(hù)意圖,自動(dòng)判斷任務(wù)應(yīng)由本地私有模型還是云前沿模型處理,也可調(diào)用外部工具(如郵件 API、機(jī)器人控制接口、日歷服務(wù)等),并實(shí)現(xiàn)多模態(tài)融合,統(tǒng)一處理文本、語(yǔ)音、圖像、機(jī)器人傳感信號(hào)等信息。


這些復(fù)雜的能力在過(guò)去是絕對(duì)無(wú)法想象的,但如今已經(jīng)變得微不足道。在ServiceNow、Snowflake等企業(yè)平臺(tái)上,都能使用到類(lèi)似的能力。

四、開(kāi)源Alpha-Mayo模型,讓自動(dòng)駕駛汽車(chē)“思考”

英偉達(dá)相信物理AI和機(jī)器人最終將成為全球最大的消費(fèi)電子細(xì)分市場(chǎng)。所有能夠移動(dòng)的事物,最終都將實(shí)現(xiàn)完全自主,由物理AI驅(qū)動(dòng)。

AI已經(jīng)經(jīng)歷了感知AI、生成式AI、Agentic AI階段,現(xiàn)在正進(jìn)入物理AI時(shí)代,智能走入真實(shí)世界,這些模型能夠理解物理規(guī)律,并直接從物理世界的感知中生成行動(dòng)。


不要要實(shí)現(xiàn)這一目標(biāo),物理AI必須學(xué)會(huì)世界的常識(shí)——物體恒存、重力、摩擦。這些能力的獲取將依賴(lài)三臺(tái)計(jì)算機(jī):訓(xùn)練計(jì)算機(jī)(DGX)用于打造AI模型,推理計(jì)算機(jī)(機(jī)器人/車(chē)載芯片)用于實(shí)時(shí)執(zhí)行,仿真計(jì)算機(jī)(Omniverse)用于生成合成數(shù)據(jù)、驗(yàn)證物理邏輯。

而其中的核心模型是Cosmos世界基礎(chǔ)模型,將語(yǔ)言、圖像、3D與物理規(guī)律對(duì)齊,支撐從仿真生成訓(xùn)練數(shù)據(jù)的全鏈路。

物理AI將出現(xiàn)在三類(lèi)實(shí)體中:建筑(如工廠(chǎng)、倉(cāng)庫(kù)),機(jī)器人,自動(dòng)駕駛汽車(chē)

黃仁勛認(rèn)為,自動(dòng)駕駛將成為是物理AI的第一個(gè)大規(guī)模應(yīng)用場(chǎng)景。此類(lèi)系統(tǒng)需要理解現(xiàn)實(shí)世界、做出決策并執(zhí)行動(dòng)作,對(duì)安全性、仿真和數(shù)據(jù)要求極高。

對(duì)此,英偉達(dá)發(fā)布Alpha-Mayo,一個(gè)由開(kāi)源模型、仿真工具和物理AI數(shù)據(jù)集組成的完整體系,用于加速安全、基于推理的物理AI開(kāi)發(fā)。

其產(chǎn)品組合為全球車(chē)企、供應(yīng)商、創(chuàng)企和研究人員提供構(gòu)建L4級(jí)自動(dòng)駕駛系統(tǒng)的基礎(chǔ)模塊。


Alpha-Mayo這是是業(yè)內(nèi)首個(gè)真正讓自動(dòng)駕駛汽車(chē)“思考”的模型,這一模型已經(jīng)開(kāi)源。它通過(guò)將問(wèn)題拆解為步驟,對(duì)所有可能性進(jìn)行推理,并選擇最安全的路徑。


這種推理型任務(wù)-行動(dòng)模型使自動(dòng)駕駛系統(tǒng)能夠解決此前從未經(jīng)歷過(guò)的復(fù)雜邊緣場(chǎng)景,例如繁忙路口的交通燈失效。

Alpha-Mayo擁有100億個(gè)參數(shù),規(guī)模足以處理自動(dòng)駕駛?cè)蝿?wù),同時(shí)又足夠輕量,可運(yùn)行在為自動(dòng)駕駛研究人員打造的工作站上。

它能接收文本、環(huán)視攝像頭、車(chē)輛歷史狀態(tài)和導(dǎo)航輸入,并輸出行駛軌跡和推理過(guò)程,讓乘客理解車(chē)輛為何采取某個(gè)行動(dòng)。

現(xiàn)場(chǎng)播放的宣傳片中,在Alpha-Mayo的驅(qū)動(dòng)下,自動(dòng)駕駛汽車(chē)可以在0介入的情況下自主完成行人避讓、預(yù)判左轉(zhuǎn)車(chē)輛并變道繞開(kāi)等操作。


黃仁勛稱(chēng),搭載Alpha-Mayo的梅賽德斯奔馳CLA已經(jīng)投產(chǎn),還剛剛被NCAP評(píng)為世界上最安全的汽車(chē)。每條代碼、芯片、系統(tǒng)都經(jīng)過(guò)安全認(rèn)證。該系統(tǒng)將在美國(guó)市場(chǎng)上線(xiàn),并將在今年晚些時(shí)候推出更強(qiáng)駕駛能力,包括高速公路脫手駕駛,以及城市環(huán)境下的端到端自動(dòng)駕駛。


英偉達(dá)亦發(fā)布了用于訓(xùn)練Alpha-Mayo的部分?jǐn)?shù)據(jù)集、開(kāi)源推理模型評(píng)估仿真框架Alpha-Sim。開(kāi)發(fā)者可以使用自有數(shù)據(jù)對(duì)Alpha-Mayo進(jìn)行微調(diào),也可以使用Cosmos生成合成數(shù)據(jù),并在真實(shí)數(shù)據(jù)與合成數(shù)據(jù)結(jié)合的基礎(chǔ)上訓(xùn)練和測(cè)試自動(dòng)駕駛應(yīng)用。除此之外,英偉達(dá)宣布NVIDIA DRIVE平臺(tái)現(xiàn)已投入生產(chǎn)

英偉達(dá)宣布,波士頓動(dòng)力、Franka Robotics、Surgical手術(shù)機(jī)器人、LG電子、NEURA、XRLabs、智元機(jī)器人等全球機(jī)器人領(lǐng)先企業(yè)均基于NVIDIA Isaac和GR00T構(gòu)建。


黃仁勛還官宣了與西門(mén)子的最新合作。西門(mén)子正將英偉達(dá)CUDA-X、AI模型和Omniverse集成到其EDA、CAE和數(shù)字孿生工具與平臺(tái)組合中。物理AI將被廣泛用于設(shè)計(jì)、仿真到生產(chǎn)制造和運(yùn)營(yíng)的全流程。

結(jié)語(yǔ):左手擁抱開(kāi)源,右手將硬件系統(tǒng)做到不可替代

隨著AI基礎(chǔ)設(shè)施的重心正從訓(xùn)練轉(zhuǎn)向大規(guī)模推理,平臺(tái)競(jìng)爭(zhēng)已從單點(diǎn)算力,演進(jìn)為覆蓋芯片、機(jī)架、網(wǎng)絡(luò)與軟件的系統(tǒng)工程,目標(biāo)轉(zhuǎn)向以最低TCO交付最大推理吞吐,AI正進(jìn)入“工廠(chǎng)化運(yùn)行”的新階段。

英偉達(dá)非常注重系統(tǒng)級(jí)設(shè)計(jì),Rubin同時(shí)在訓(xùn)練和推理上實(shí)現(xiàn)了性能與經(jīng)濟(jì)性的提升,并能作為Blackwell的即插即用替代方案,可從Blackwell無(wú)縫過(guò)渡。

在平臺(tái)定位上,英偉達(dá)依然認(rèn)為訓(xùn)練至關(guān)重要,因?yàn)橹挥锌焖儆?xùn)練出最先進(jìn)模型,推理平臺(tái)才能真正受益,因此在Rubin GPU中引入NVFP4訓(xùn)練,進(jìn)一步提升性能、降低TCO。

同時(shí),這家AI計(jì)算巨頭也持續(xù)在縱向擴(kuò)展和橫向擴(kuò)展架構(gòu)上大幅強(qiáng)化網(wǎng)絡(luò)通信能力,并將上下文視作關(guān)鍵瓶頸,實(shí)現(xiàn)存儲(chǔ)、網(wǎng)絡(luò)、計(jì)算的協(xié)同設(shè)計(jì)。

英偉達(dá)一邊大舉開(kāi)源,另一邊正將硬件、互連、系統(tǒng)設(shè)計(jì)做得越來(lái)越“不可替代”,這種持續(xù)擴(kuò)大需求、激勵(lì)token消耗、推動(dòng)推理規(guī)?;?、提供高性?xún)r(jià)比基礎(chǔ)設(shè)施的策略閉環(huán),正為英偉達(dá)構(gòu)筑更加堅(jiān)不可摧的護(hù)城河。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
揮淚斬馬謖!皇馬將驅(qū)逐主帥“嫡系”!欽點(diǎn)1.1億歐若昂·內(nèi)維斯

揮淚斬馬謖!皇馬將驅(qū)逐主帥“嫡系”!欽點(diǎn)1.1億歐若昂·內(nèi)維斯

頭狼追球
2026-01-12 14:40:20
關(guān)于李莉教授的一張圖火了

關(guān)于李莉教授的一張圖火了

關(guān)爾東
2026-01-11 16:32:35
許世友癡迷茅臺(tái),但他每個(gè)月只有400塊工資,是如何頓頓喝到的?

許世友癡迷茅臺(tái),但他每個(gè)月只有400塊工資,是如何頓頓喝到的?

大千世界觀
2026-01-12 21:54:33
謝暉也沒(méi)想到,不愿給自己生娃的佟晨潔,如今卻在給魏巍當(dāng)“媽”

謝暉也沒(méi)想到,不愿給自己生娃的佟晨潔,如今卻在給魏巍當(dāng)“媽”

和平聲浪
2026-01-12 17:14:52
薩巴倫卡領(lǐng)獎(jiǎng)臺(tái)上驚喜暗示求婚,男友措手不及成網(wǎng)絡(luò)熱議話(huà)題

薩巴倫卡領(lǐng)獎(jiǎng)臺(tái)上驚喜暗示求婚,男友措手不及成網(wǎng)絡(luò)熱議話(huà)題

體育妞世界
2026-01-12 08:44:27
不愧是全球第一“綠帽”國(guó)家!女性出軌率60%,男人出軌零容忍?

不愧是全球第一“綠帽”國(guó)家!女性出軌率60%,男人出軌零容忍?

夢(mèng)史
2026-01-12 14:42:54
美國(guó)人預(yù)測(cè):未來(lái)20年,世界上最強(qiáng)大的"7個(gè)國(guó)家",看都有誰(shuí)?

美國(guó)人預(yù)測(cè):未來(lái)20年,世界上最強(qiáng)大的"7個(gè)國(guó)家",看都有誰(shuí)?

小熊侃史
2026-01-07 11:18:33
為什么感覺(jué)美國(guó)在走向衰落?那是因?yàn)槟闶侵袊?guó)人

為什么感覺(jué)美國(guó)在走向衰落?那是因?yàn)槟闶侵袊?guó)人

扶蘇聊歷史
2025-12-19 10:02:54
國(guó)家發(fā)改委原副主任扶持公司上市,原始股十三年后獲利數(shù)千萬(wàn)

國(guó)家發(fā)改委原副主任扶持公司上市,原始股十三年后獲利數(shù)千萬(wàn)

南方都市報(bào)
2026-01-12 22:21:05
外交部:無(wú)論委內(nèi)瑞拉政局如何變化,中方深化兩國(guó)各領(lǐng)域務(wù)實(shí)合作意愿不會(huì)改變

外交部:無(wú)論委內(nèi)瑞拉政局如何變化,中方深化兩國(guó)各領(lǐng)域務(wù)實(shí)合作意愿不會(huì)改變

新京報(bào)政事兒
2026-01-09 15:32:35
大清最有面子的親王!手握重兵卻兩次拒當(dāng)皇帝,為保江山親手處死兒孫,連攝政王多爾袞見(jiàn)了他都要下馬磕頭,這才是真正的頂級(jí)權(quán)謀

大清最有面子的親王!手握重兵卻兩次拒當(dāng)皇帝,為保江山親手處死兒孫,連攝政王多爾袞見(jiàn)了他都要下馬磕頭,這才是真正的頂級(jí)權(quán)謀

史海孤雁
2026-01-11 22:43:17
王石的黃昏

王石的黃昏

云石
2026-01-12 10:09:12
李在明也沒(méi)想到,訪(fǎng)華僅3天,59歲妻子竟憑一個(gè)舉動(dòng)給他長(zhǎng)臉了

李在明也沒(méi)想到,訪(fǎng)華僅3天,59歲妻子竟憑一個(gè)舉動(dòng)給他長(zhǎng)臉了

丁丁鯉史紀(jì)
2026-01-07 11:35:05
27億美元收購(gòu)沃爾沃,吉利李書(shū)福蛇吞象,18年過(guò)去是賺是虧?

27億美元收購(gòu)沃爾沃,吉利李書(shū)福蛇吞象,18年過(guò)去是賺是虧?

芳芳?xì)v史燴
2026-01-11 13:01:04
王玉雯最新活動(dòng)翻車(chē)!妝容太丑照片像AI,評(píng)論區(qū)徹底淪陷了

王玉雯最新活動(dòng)翻車(chē)!妝容太丑照片像AI,評(píng)論區(qū)徹底淪陷了

丁丁鯉史紀(jì)
2026-01-12 10:14:25
考官問(wèn)“什么門(mén)永遠(yuǎn)關(guān)不上”在場(chǎng)考生答錯(cuò),7歲小朋友出正確答案

考官問(wèn)“什么門(mén)永遠(yuǎn)關(guān)不上”在場(chǎng)考生答錯(cuò),7歲小朋友出正確答案

蘭姐說(shuō)故事
2026-01-09 20:05:03
44歲張杰近照曝光:體脂低至8%,這肌肉是認(rèn)真的嗎?

44歲張杰近照曝光:體脂低至8%,這肌肉是認(rèn)真的嗎?

健身迷
2026-01-10 09:47:21
劉嘉玲接受章澤天采訪(fǎng),其公寓內(nèi)部裝修曝光,透露曾與張國(guó)榮為鄰

劉嘉玲接受章澤天采訪(fǎng),其公寓內(nèi)部裝修曝光,透露曾與張國(guó)榮為鄰

臺(tái)州交通廣播
2026-01-12 21:18:18
知三當(dāng)三、被婆婆掃地出門(mén)?孫怡高調(diào)官宣喜訊,徹底打臉董子健

知三當(dāng)三、被婆婆掃地出門(mén)?孫怡高調(diào)官宣喜訊,徹底打臉董子健

傲傲講歷史
2026-01-11 04:50:50
無(wú)意之中和親戚談戀愛(ài)是啥體驗(yàn)?網(wǎng)友:近親不能結(jié)婚,建議五代外

無(wú)意之中和親戚談戀愛(ài)是啥體驗(yàn)?網(wǎng)友:近親不能結(jié)婚,建議五代外

解讀熱點(diǎn)事件
2025-12-29 01:45:30
2026-01-13 00:12:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
11058文章數(shù) 116941關(guān)注度
往期回顧 全部

科技要聞

面對(duì)SpaceX瘋狂“下餃子” 中國(guó)正面接招

頭條要聞

外媒問(wèn)王毅調(diào)整索馬里行程是否出于安全考慮 中方回應(yīng)

頭條要聞

外媒問(wèn)王毅調(diào)整索馬里行程是否出于安全考慮 中方回應(yīng)

體育要聞

一場(chǎng)安東尼奧式勝利,給中國(guó)足球帶來(lái)驚喜

娛樂(lè)要聞

蔡少芬結(jié)婚18周年,與張晉過(guò)二人世界

財(cái)經(jīng)要聞

倍輕松信披迷霧 實(shí)控人占用資金金額存疑

汽車(chē)要聞

增配不加價(jià) 北京現(xiàn)代 第五代 勝達(dá)2026款上市

態(tài)度原創(chuàng)

健康
本地
時(shí)尚
藝術(shù)
公開(kāi)課

血常規(guī)3項(xiàng)異常,是身體警報(bào)!

本地新聞

云游內(nèi)蒙|“包”你再來(lái)?一座在硬核里釀出詩(shī)意的城

看了日本主婦的搭配才明白,年紀(jì)大了這么穿,優(yōu)雅又不油膩

藝術(shù)要聞

畫(huà)完這組畫(huà),他抑郁了,后來(lái)自殺了

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版