国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

關(guān)于Rubin,我們列了六個(gè)關(guān)鍵問題

0
分享至



新眸原創(chuàng)·作者 | 李小東

英偉達(dá)沒有在CES 2026上發(fā)布任何新的顯卡。

取而代之的,黃仁勛用近兩個(gè)小時(shí),詳細(xì)闡述了一個(gè)名為Vera Rubin的全新AI超算架構(gòu),以及一組足以改寫行業(yè)規(guī)則的數(shù)字:

在Rubin上運(yùn)行AI推理,吞吐量提升十倍,訓(xùn)練萬億參數(shù)模型所需的GPU數(shù)量,可以減少到上一代Blackwell的四分之一,而每個(gè)token的成本降至十分之一。

這件事可能埋了個(gè)信號。

它或許預(yù)示,在傳統(tǒng)消費(fèi)級GPU這條線上,通過制程和架構(gòu)微迭代帶來的性能提升,其邊際效應(yīng)正在減弱,或者說,已不足以支撐一個(gè)激動人心的發(fā)布會。

以下是我們就此事的一些思考。

01

關(guān)于沒有新顯卡與Rubin的商業(yè)模式

理解Rubin,關(guān)鍵在于轉(zhuǎn)變視角。

它不是一個(gè)更快的GPU,你可以把它視為一套極度垂直整合的AI計(jì)算系統(tǒng)。英偉達(dá)設(shè)計(jì)了六顆功能各異、但深度耦合的專用芯片去進(jìn)行打包:

Vera CPU(負(fù)責(zé)AI數(shù)據(jù)流調(diào)度)、Rubin GPU(核心算力單元)、NVLink 6(超高帶寬內(nèi)部互聯(lián))、ConnectX-9 SuperNIC(AI專用網(wǎng)絡(luò))、BlueField-4 DPU(卸載存儲與安全任務(wù))、Spectrum-6以太網(wǎng)交換芯片。

六塊芯片協(xié)同工作,目標(biāo)是將整個(gè)數(shù)據(jù)中心機(jī)柜整合為一臺無縫的“巨型AI計(jì)算機(jī)”。



Rubin解決的,是系統(tǒng)規(guī);碾y題,不是單顆芯片的性能極限。讓算力的堆疊,從“手工組裝賽車引擎”變?yōu)椤皹?biāo)準(zhǔn)化汽車工廠流水線”,至于帶來的效率提升和成本下降,是系統(tǒng)級優(yōu)化的必然結(jié)果。

這種模式,確實(shí)與谷歌通過TPU及其互聯(lián)技術(shù)打造自家AI基礎(chǔ)設(shè)施的思路異曲同工。英偉達(dá)的Rubin,正是面向那些與谷歌有相似需求的客戶——即需要處理海量Token、訓(xùn)練和運(yùn)行萬億參數(shù)模型的超大規(guī)模AI廠商或云服務(wù)商。

對比英偉達(dá)在這之前的商業(yè)模式,有一些從“賣鏟子”到“賣生產(chǎn)力車間” 的商業(yè)模式的轉(zhuǎn)向。它帶來的性能提升(如10倍推理吞吐)和成本下降(1/10的Token成本),是這種專用化、系統(tǒng)級優(yōu)化所能釋放的潛力。

但它的限制也在于此。

Rubin的威力只有在處理其預(yù)設(shè)的、高度并行化的AI計(jì)算負(fù)載時(shí)才能完全釋放。對于圖形渲染、通用科學(xué)計(jì)算或小規(guī)模模型推理等場景,其復(fù)雜性和成本可能并不劃算。它瞄準(zhǔn)的是一個(gè)龐大但特定的“主航道”市場。

02

關(guān)于對現(xiàn)有AI硬件生態(tài)的沖擊

Rubin的出現(xiàn),會不會讓“囤積高端GPU”作為核心競爭力的時(shí)代,開始進(jìn)入倒計(jì)時(shí)?

如果說,Rubin真的能夠達(dá)到市場普及,隨之而來就要面對一些尷尬情況:

對于第一波靠買賣或租賃算力(如H100集群)的廠商,他們的商業(yè)模式將承受巨大壓力。當(dāng)新一代系統(tǒng)能以低得多的單位成本提供推理服務(wù)時(shí),舊有集群的性價(jià)比優(yōu)勢會迅速喪失,除非他們能快速升級到新架構(gòu)。

而對于那些早期投入巨資自建GPU集群的AI公司,他們的處境更為微妙。這些硬件資產(chǎn)短期內(nèi)不會報(bào)廢,依然能用于研發(fā)和現(xiàn)有服務(wù)。

但問題在于未來的競爭維度。

當(dāng)新入場的玩家可以憑借Rubin級別的廉價(jià)算力,輕松獲得與你相當(dāng)?shù)耐评砟芰r(shí),你之前用巨額資本構(gòu)筑的算力壁壘,戰(zhàn)略價(jià)值就會急劇縮水。競爭將更快地、更徹底地轉(zhuǎn)向模型算法本身的優(yōu)越性、數(shù)據(jù)的獨(dú)特性和閉環(huán),以及產(chǎn)品與市場的契合度。

英偉達(dá)自身的角色,也會因此在演變。它確實(shí)在向“AI時(shí)代的高通”靠攏,即提供核心的、標(biāo)準(zhǔn)化的計(jì)算模塊。但Rubin所展現(xiàn)的集成度,又比手機(jī)SoC復(fù)雜得多,更接近于提供一整套參考設(shè)計(jì)和系統(tǒng)解決方案。

未來,如果其超算架構(gòu)(如DGX SuperPOD)以云服務(wù)形式被大規(guī)模交付,那么它還將附加一層“運(yùn)營商”的屬性,直接向終端用戶輸出AI算力服務(wù)。

03

關(guān)于Token平價(jià)時(shí)代的窗口期問題

Rubin所承諾的“平價(jià)推理時(shí)代”,其窗口期的長短,取決于兩個(gè)關(guān)鍵變量:Rubin的銷量爬坡速度,以及現(xiàn)有巨頭模型能力的迭代速度。

如果Rubin能在2026年下半年如期規(guī)模上市,并快速被主要云廠商(如AWS、Azure、GCP)部署,那么這個(gè)“平價(jià)算力”的接入點(diǎn)就會迅速普及。

窗口期可能并不長。在這段時(shí)間里,存量公司必須完成從“依賴硬件規(guī)!钡健耙蕾囓浖蜕鷳B(tài)優(yōu)勢”的關(guān)鍵轉(zhuǎn)型。

具體來說,他們可能需要:利用現(xiàn)有算力優(yōu)勢,加速訓(xùn)練出具有代際差異的模型,建立足夠高的算法壁壘;將業(yè)務(wù)迅速與具體商業(yè)場景深度綁定,形成數(shù)據(jù)閉環(huán)和客戶粘性,讓算力成本不再是決定性因素;積極探索基于現(xiàn)有模型的創(chuàng)新應(yīng)用和生態(tài),在平價(jià)算力浪潮到來前,占據(jù)用戶心智和市場份額。

當(dāng)大家獲取先進(jìn)算力的成本拉平時(shí),那些僅靠算力堆砌而無獨(dú)特技術(shù)或產(chǎn)品護(hù)城河的公司,優(yōu)勢可能很快蒸發(fā)。

04

關(guān)于AI泡沫與下一代種子選手

需要注意的是,Rubin的大規(guī)模投入,是為AI商業(yè)價(jià)值的全面實(shí)現(xiàn),拆除了最大的成本和規(guī)模障礙,但它本身并不能自動創(chuàng)造價(jià)值。

簡單來說,解決的是“成本可不可行”問題,而不是“需求存不存在”問題。

AI泡沫論常質(zhì)疑的是:天價(jià)訓(xùn)練成本能否產(chǎn)生與之匹配的商業(yè)價(jià)值?Rubin將成本打下來,實(shí)際上是大幅降低了驗(yàn)證商業(yè)價(jià)值的門檻。

更多的創(chuàng)業(yè)團(tuán)隊(duì)可以用可承受的成本,去測試更激進(jìn)、更復(fù)雜的AI想法。因此,接下來的邏輯不是泡沫破裂,行業(yè)可能正從依靠資本堆砌的蠻力階段,進(jìn)入一個(gè)更健康、更依賴創(chuàng)新而非資本的篩選階段。

最先能有效利用Rubin級別算力的創(chuàng)業(yè)者,未必是現(xiàn)在資金最雄厚的,但一定是對AI原生應(yīng)用有最深洞察、最能發(fā)揮廉價(jià)推理潛力的團(tuán)隊(duì)。他們可能是下一代“殺手級應(yīng)用”的種子選手。

從這個(gè)角度來看,長遠(yuǎn)一些,以往算力的天價(jià)成本導(dǎo)致只有少數(shù)玩家能入場,他們的故事建立在“我有稀缺算力”的基礎(chǔ)上,商業(yè)價(jià)值驗(yàn)證被推遲。

Rubin之后的新邏輯是,算力門檻驟降,入場玩家會激增。當(dāng)然,這可能會導(dǎo)致大量同質(zhì)化應(yīng)用涌現(xiàn),市場競爭會瞬間變得極為殘酷。因?yàn)樵S多僅僅依靠“我有AI功能”的應(yīng)用將迅速失去價(jià)值,因?yàn)樗鼈儫o法在成本相近的情況下提供獨(dú)特優(yōu)勢。

真正的價(jià)值創(chuàng)造者(擁有獨(dú)特?cái)?shù)據(jù)、精妙算法、深刻行業(yè)洞察的團(tuán)隊(duì))會脫穎而出,而裸泳者會更快暴露。所以,Rubin的到來可能并不意味著泡沫結(jié)束,恰恰是一輪更劇烈的淘汰賽開始。

05

關(guān)于不推新顯卡的深層原因

作為天才銷售大師的黃仁勛,在這次CES全球大會上沒有推銷顯卡,這件事本身是很值得討論的,我們甚至可以合理猜測,在半導(dǎo)體物理邊界下,已經(jīng)逼近創(chuàng)新極限?

在傳統(tǒng)GPU的晶體管微縮競賽中,持續(xù)實(shí)現(xiàn)代際性能飛躍的難度確實(shí)在增加。與此同時(shí),AI數(shù)據(jù)中心市場的增長曲線和利潤空間,已經(jīng)形成了絕對的戰(zhàn)略引力。

在先進(jìn)封裝、HBM內(nèi)存等產(chǎn)能可能依然全局緊張的背景下,英偉達(dá)選擇將資源(研發(fā)、產(chǎn)能、市場聲量)絕對優(yōu)先地投入到?jīng)Q定其未來的AI基礎(chǔ)設(shè)施戰(zhàn)場,有一定的必然性。

另一方面,在過去一年里,英偉達(dá)的行業(yè)統(tǒng)治地位或多活動受到不少挑戰(zhàn),尤其是來源于谷歌這類科技公司的一些顛覆。

在缺乏制程紅利或架構(gòu)顛覆性突破的情況下,匆忙推出小幅升級的產(chǎn)品,反而可能打亂市場節(jié)奏、影響現(xiàn)有產(chǎn)品線(如RTX 40系)的銷售。英偉達(dá)有資本選擇等待一個(gè)更合適的發(fā)布時(shí)機(jī)。

06

更實(shí)際的問題

拋開以上,還有兩個(gè)非常實(shí)際的問題:一是從現(xiàn)有架構(gòu)遷移到Rubin的更新成本與收益是否匹配;二是新架構(gòu)下硬件必然會存在的穩(wěn)定性與魯棒性風(fēng)險(xiǎn)。

對于從業(yè)者來說,從Blackwell或更早架構(gòu)遷移到Rubin,遠(yuǎn)不止一次簡單的硬件采購。

最典型的例子,集成六種尖端芯片、采用全液冷設(shè)計(jì)的Rubin系統(tǒng),其單機(jī)柜或單托盤的價(jià)格必然極其昂貴,會顯著高于當(dāng)前一代系統(tǒng)。

還有他們的計(jì)算邏輯,客戶不會單純?yōu)榱水?dāng)前的算力付費(fèi),他們要購買一張通往下一代AI成本結(jié)構(gòu)的門票。核心比較指標(biāo)非“總擁有成本(TCO)”,而是 “單位智能成本(Cost Per Intelligence)”——即處理每萬億token、訓(xùn)練每個(gè)萬億參數(shù)模型的綜合開銷。

那劃不劃得來呢?對于極度稀缺、高速迭代的前沿模型研發(fā)(如追求AGI的實(shí)驗(yàn)室)和超大規(guī)模AI云服務(wù)商來說,答案很可能是肯定的。

即便硬件單價(jià)高,但若能將其服務(wù)的天量Token推理成本降低一個(gè)數(shù)量級,或在競品之前以數(shù)月時(shí)間優(yōu)勢推出更強(qiáng)大的模型,這筆投資就能在極短時(shí)間內(nèi)通過市場領(lǐng)先地位和更低的運(yùn)營成本收回。這是為生存和領(lǐng)先而戰(zhàn)。

除了這些,還有遷移與適配的隱性成本。比如,Rubin的NVFP4張量核心、新的內(nèi)存層次(如由BlueField-4驅(qū)動的上下文存儲平臺)以及CPU-GPU協(xié)同模式,都需要對現(xiàn)有的深度學(xué)習(xí)框架、模型架構(gòu)和調(diào)度軟件進(jìn)行深度優(yōu)化,甚至重寫部分代碼。這需要投入大量工程師時(shí)間和驗(yàn)證成本。

決策者還要考慮什么時(shí)候回本,比如:

基于Rubin更低廉的Token成本,自己的業(yè)務(wù)量(推理請求、模型訓(xùn)練任務(wù))將增長多少?新架構(gòu)帶來的能效提升,能節(jié)省多少電力成本?與“維持舊系統(tǒng),但承擔(dān)更高邊際成本和逐漸喪失競爭力”的路徑相比,提前投資Rubin的凈現(xiàn)值(NPV)是否為正?

對于大多數(shù)企業(yè),這個(gè)平衡點(diǎn)可能不會立即到來。

另一方面,關(guān)于穩(wěn)定性與魯棒性,是這種系統(tǒng)級極致創(chuàng)新的天然反面。

對于任一硬件工藝,復(fù)雜度激增必然帶來故障點(diǎn)的擴(kuò)散。傳統(tǒng)的GPU集群有一兩個(gè)出現(xiàn)問題,任務(wù)可遷移解決。但Rubin是一個(gè)超級有機(jī)體,內(nèi)部(Vera CPU、Rubin GPU、NVLink 6、DPU、超級網(wǎng)卡)精密耦合,任何一個(gè)關(guān)鍵部件的異常,都可能影響整個(gè)系統(tǒng)的協(xié)同效率。

對于工程師來說,故障診斷難度大概率也會上升。當(dāng)性能問題或錯(cuò)誤出現(xiàn)時(shí),排查的根源可能是硬件(六種芯片中的任何一種)、固件、驅(qū)動、互聯(lián)協(xié)議或系統(tǒng)軟件中的任何一環(huán)。這種深度集成使得傳統(tǒng)“分而治之”的調(diào)試方法變得異常困難。

我們也注意到,針對這幾個(gè)風(fēng)險(xiǎn),老黃在演講中回應(yīng)了幾項(xiàng)特性,如全鏈路機(jī)密計(jì)算與加密、徹底重新設(shè)計(jì)的供電與冷卻、通過DPU實(shí)現(xiàn)“卸載”與“隔離”。

只不過,無論設(shè)計(jì)多么精妙,一套如此復(fù)雜的新系統(tǒng),也必須經(jīng)過大規(guī)模、長時(shí)間、多樣化實(shí)際工作負(fù)載的淬火才能得到驗(yàn)證。

按照以往的經(jīng)驗(yàn),早期采用者將不可避免地承擔(dān)“共同測試者”的角色,與英偉達(dá)一同發(fā)現(xiàn)并解決那些在實(shí)驗(yàn)室中無法預(yù)見的問題。

這個(gè)過程可能需要更長時(shí)間。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
不法之徒村田晃大,正面照曝光

不法之徒村田晃大,正面照曝光

新京報(bào)
2026-03-26 11:18:17
誰還敢充長期會員?男子視頻VIP充到2028年,被一紙新規(guī)一夜返貧

誰還敢充長期會員?男子視頻VIP充到2028年,被一紙新規(guī)一夜返貧

溫讀史
2026-03-26 10:41:06
S家發(fā)威了!大S律師已報(bào)警,官方出手,張?zhí)m律師怒斥,牽連馬筱梅

S家發(fā)威了!大S律師已報(bào)警,官方出手,張?zhí)m律師怒斥,牽連馬筱梅

小舟談歷史
2026-03-26 15:44:38
二百多名軍官被槍斃、撤職、處分,長津湖戰(zhàn)役中失職的志愿軍88師

二百多名軍官被槍斃、撤職、處分,長津湖戰(zhàn)役中失職的志愿軍88師

云霄紀(jì)史觀
2026-03-25 12:16:14
馬上評|雙雙被罰,友誼賽不是“友盡賽”

馬上評|雙雙被罰,友誼賽不是“友盡賽”

澎湃新聞
2026-03-25 16:16:26
這4種魚,可能含有甲醛和重金屬,建議:還是少吃比較好!

這4種魚,可能含有甲醛和重金屬,建議:還是少吃比較好!

阿龍美食記
2026-03-24 21:52:23
昊鉑的“新敘事”,一場久違的新豪華“破局”

昊鉑的“新敘事”,一場久違的新豪華“破局”

功夫AUTO
2026-03-19 14:25:02
懟得漂亮!伊朗外長:既然我們連領(lǐng)導(dǎo)層都沒有了,還有什么好談的

懟得漂亮!伊朗外長:既然我們連領(lǐng)導(dǎo)層都沒有了,還有什么好談的

南風(fēng)不及你溫柔
2026-03-26 14:07:38
歐盟威脅越南:若中方參與了…

歐盟威脅越南:若中方參與了…

觀察者網(wǎng)
2026-03-25 15:19:16
國際油價(jià)漲幅擴(kuò)大 布倫特原油期貨站上105美元/桶

國際油價(jià)漲幅擴(kuò)大 布倫特原油期貨站上105美元/桶

每日經(jīng)濟(jì)新聞
2026-03-26 15:11:37
楊振寧猝然離世5個(gè)月后,翁帆突傳新消息,懷孕傳聞早就真相大白

楊振寧猝然離世5個(gè)月后,翁帆突傳新消息,懷孕傳聞早就真相大白

李橑在北漂
2026-03-25 23:30:59
收評:滬指跌1.09% 全市場成交額不足2萬億元

收評:滬指跌1.09% 全市場成交額不足2萬億元

證券時(shí)報(bào)
2026-03-26 15:22:10
一代香港美人,感覺不是很開心的樣子,大家還記得她的名字嗎?

一代香港美人,感覺不是很開心的樣子,大家還記得她的名字嗎?

動物奇奇怪怪
2026-03-26 08:35:16
初代丑男何潤東的突然爆火,狠狠抽了內(nèi)娛一巴掌

初代丑男何潤東的突然爆火,狠狠抽了內(nèi)娛一巴掌

娛樂圈筆娛君
2026-03-24 16:08:36
中方是否了解美伊磋商情況?外交部:支持一切有利緩局降溫的努力

中方是否了解美伊磋商情況?外交部:支持一切有利緩局降溫的努力

澎湃新聞
2026-03-26 15:32:26
帶娃出國的中產(chǎn)后悔了:想回來,但回國失敗

帶娃出國的中產(chǎn)后悔了:想回來,但回國失敗

視覺志
2026-03-24 10:36:13
血管狹窄超90%,重油重膩且生活不規(guī)律,假如第一時(shí)間被搶救,張雪峰能活嗎?

血管狹窄超90%,重油重膩且生活不規(guī)律,假如第一時(shí)間被搶救,張雪峰能活嗎?

消化石醫(yī)生
2026-03-26 12:52:28
強(qiáng)闖中國駐日使館不法之徒照片曝光,3月15日剛晉升三等陸尉

強(qiáng)闖中國駐日使館不法之徒照片曝光,3月15日剛晉升三等陸尉

澎湃新聞
2026-03-26 14:34:04
白宮不裝了,承認(rèn)伊朗拒絕談判,特朗普準(zhǔn)備“釋放地獄”

白宮不裝了,承認(rèn)伊朗拒絕談判,特朗普準(zhǔn)備“釋放地獄”

書紀(jì)文譚
2026-03-26 16:28:13
釋永信“開光”真相大白,過程不堪入目,易中天也有牽扯

釋永信“開光”真相大白,過程不堪入目,易中天也有牽扯

秋姐居
2026-03-25 10:22:58
2026-03-26 18:15:00
新眸深度 incentive-icons
新眸深度
看見商業(yè)另一面。
1448文章數(shù) 2474關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

男子從四家公司貸出共計(jì)356萬元 實(shí)際到手卻僅8萬多元

頭條要聞

男子從四家公司貸出共計(jì)356萬元 實(shí)際到手卻僅8萬多元

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會喪事從簡

財(cái)經(jīng)要聞

長護(hù)險(xiǎn)誰能享受?享受多少?解答來了

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

本地
教育
家居
房產(chǎn)
軍事航空

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬遍

教育要聞

中小學(xué)家長必看數(shù)據(jù),看與不看都會后悔

家居要聞

傍海而居 靜觀蝴蝶海

房產(chǎn)要聞

突發(fā),三亞又有大批征遷補(bǔ)償方案出爐!

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

無障礙瀏覽 進(jìn)入關(guān)懷版