国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Rubin CPX引出的產(chǎn)業(yè)真相:Scale Out網(wǎng)絡(luò)是AI集群不可或缺底座

0
分享至

文/黃海峰的通信生活

當(dāng)下在AI領(lǐng)域,大規(guī)模輸入數(shù)據(jù)進(jìn)行高效、低成本處理的問題,成為關(guān)注熱點(diǎn)。AI大模型處理百萬行代碼、生成小時級視頻等長上下文任務(wù)時,算力需求與成本壓力呈指數(shù)級增長。這導(dǎo)致計算基礎(chǔ)設(shè)施面臨性能瓶頸與性價比失衡的雙重挑戰(zhàn)。

行業(yè)如何應(yīng)對挑戰(zhàn)?網(wǎng)絡(luò)作為連接計算節(jié)點(diǎn)的關(guān)鍵紐帶,是解決該挑戰(zhàn)的關(guān)鍵,且正站在Scale Out(橫向擴(kuò)展,指增加服務(wù)器節(jié)點(diǎn),構(gòu)成分布式架構(gòu))與Scale Up(縱向擴(kuò)展,指增強(qiáng)單個服務(wù)器系統(tǒng)資源)兩條路線的十字路口。

然而,我們看到AI基礎(chǔ)設(shè)施巨頭給出了不一樣的答案。近日,英偉達(dá)Rubin CPX系列GPU以“百萬級令牌上下文處理”和“30至50倍投資回報”的亮眼數(shù)據(jù)亮相,宣告專為長上下文推理優(yōu)化的新路徑:它果斷取消Scale Up設(shè)計,直言行業(yè)已從“唯性能論”轉(zhuǎn)向“性價比最優(yōu)解”。

這讓不少人好奇,當(dāng)下不是有觀點(diǎn)認(rèn)為,超節(jié)點(diǎn)發(fā)展迅猛,Scale Up依靠提升單節(jié)點(diǎn)硬件性能(如增加顯存、算力),可以應(yīng)對長上下文任務(wù),或成發(fā)展方向,甚至將替代Scale Out。

英偉達(dá)這是反其道而行之,還是說行業(yè)走向異構(gòu)集群時Scale Up已無價值?Scale Out與Scale Up難道注定就是“非此即彼”的關(guān)系?



撥開技術(shù)迷霧,我們不難發(fā)現(xiàn),隨著異構(gòu)集群逐漸成為未來AI基礎(chǔ)設(shè)施的主流形態(tài),Scale Out網(wǎng)絡(luò)絕非可被替代的“備選方案”,而是支撐整個AI集群運(yùn)轉(zhuǎn)的“通信底座”,與Scale Up網(wǎng)絡(luò)更將形成相輔相成的協(xié)同關(guān)系,與Scale Up攜手發(fā)展才是正確方向。

從性能崇拜到性價比為王:Rubin CPX折射智算產(chǎn)業(yè)新趨勢

縱觀AI智算產(chǎn)業(yè)的發(fā)展歷程,其本質(zhì)上是計算資源從集中到分布式,再到精準(zhǔn)分工的演進(jìn)史。早期AI任務(wù)依賴單卡單服務(wù)器即可完成,網(wǎng)絡(luò)僅需承擔(dān)基礎(chǔ)的數(shù)據(jù)傳輸功能。



隨著深度學(xué)習(xí)模型參數(shù)從百萬級躍升至萬億級,單節(jié)點(diǎn)算力捉襟見肘,服務(wù)器集群成為主流。此時,網(wǎng)絡(luò)開始需要支撐多節(jié)點(diǎn)間的協(xié)同計算。

而超節(jié)點(diǎn)架構(gòu)的出現(xiàn),通過在單一機(jī)架內(nèi)集成數(shù)十甚至上百塊GPU,將計算密度推向新高度。比如英偉達(dá)推出的GB200 NVL72超節(jié)點(diǎn),由72張英偉達(dá)GB200 GPU互聯(lián)組成。在采用同樣GPU的情況下,相比于把8卡服務(wù)器通過網(wǎng)絡(luò)互連的傳統(tǒng)方式,NVL72這個超節(jié)點(diǎn)的吞吐量可以比非超節(jié)點(diǎn)提升3倍以上。

但隨著超節(jié)點(diǎn)內(nèi)GPU數(shù)量激增,節(jié)點(diǎn)內(nèi)部的互聯(lián)網(wǎng)絡(luò)帶寬與時延性能,成為制約單節(jié)點(diǎn)計算效率的關(guān)鍵瓶頸。

英偉達(dá)Rubin CPX系列的發(fā)布,標(biāo)志著產(chǎn)業(yè)進(jìn)入“精準(zhǔn)優(yōu)化”的新階段。與追求全能性能的傳統(tǒng)GPU不同,Rubin CPX采用成本高效的單片晶圓設(shè)計,集成128GB GDDR7顯存與專用視頻編解碼硬件,在長上下文推理場景中實(shí)現(xiàn)3倍于GB300 NVL72的注意力機(jī)制加速,單機(jī)架即可提供8 exaFLOPS的NVFP4計算能力。

更關(guān)鍵的是,Rubin CPX通過“分解式基礎(chǔ)設(shè)施”理念,將計算與內(nèi)存資源高效分配,其1億美元資本支出可帶來高達(dá)50億美元收入,徹底打破了“高性能必然高成本”的固有認(rèn)知。

這種變革背后,折射出產(chǎn)業(yè)對AI全生命周期成本的深刻反思。訓(xùn)練階段需要處理PB級數(shù)據(jù)與萬億次參數(shù)更新,推理階段則面臨高并發(fā)、低延遲的實(shí)時響應(yīng)需求,單一架構(gòu)難以適配全場景需求。

筆者認(rèn)為,Rubin CPX的出現(xiàn),不僅以“分解式基礎(chǔ)設(shè)施”理念和場景化硬件設(shè)計,直觀證明行業(yè)已跳出“一味追求高性能”的誤區(qū),更印證了“聚焦最優(yōu)性價比”的發(fā)展新趨勢。

這一變化表明,通過硬件專業(yè)化分工與資源精準(zhǔn)匹配,實(shí)現(xiàn)性價比最優(yōu)已成為行業(yè)共識。這種異構(gòu)化、分工化的架構(gòu)趨勢,正從根本上重塑網(wǎng)絡(luò)的角色定位。

網(wǎng)絡(luò)演進(jìn)的雙軌制:Scale Out與Scale Up是協(xié)同而非替代

計算側(cè)的架構(gòu)變革必然驅(qū)動網(wǎng)絡(luò)技術(shù)同步演進(jìn)。早期,AI訓(xùn)練需要“十萬級GPU一起干活”,計算任務(wù)像城市里分散在各個區(qū)域的人流,對網(wǎng)絡(luò)的“覆蓋廣度”和“節(jié)點(diǎn)連接能力”要求陡增。

此時,Scale Out網(wǎng)絡(luò)以“集團(tuán)軍”模式登場。它就像城市里的普通交通路網(wǎng),不依賴單條“主干道”,而是通過增加道路條數(shù)(即網(wǎng)絡(luò)設(shè)備數(shù)量)來提升整體通行能力,就算某幾條路臨時擁堵,整個交通系統(tǒng)依然能正常運(yùn)轉(zhuǎn)。

在AI訓(xùn)練中,Scale Out網(wǎng)絡(luò)依靠優(yōu)化,將數(shù)據(jù)并行(DP)、模型并行(TP)等技術(shù)所需的“十萬級GPU大軍”連接起來,確保All-Reduce等關(guān)鍵指令高效傳達(dá)。

這種網(wǎng)絡(luò)的核心優(yōu)勢很明顯,就像不斷拓寬路網(wǎng)一樣,加幾臺中低端設(shè)備就能讓集群規(guī)?!熬€性擴(kuò)張”,成本不高還靈活,完美適配訓(xùn)練階段“人多力量大”“規(guī)模決定效率”的需求。

可隨著AI技術(shù)深入,推理等場景對網(wǎng)絡(luò)的要求變了,需要數(shù)據(jù)“分秒必達(dá)”。這就對帶寬和時延的要求嚴(yán)苛到“微秒級”。這時,Scale Up 網(wǎng)絡(luò)以“特種部隊”模式橫空出世。

它不像 Scale Out那樣的“人海戰(zhàn)術(shù)”,而是專注升級“單個精英設(shè)備”的能力。這就好比為城市打造專屬“快車道”,不僅把車道從“雙向兩車道”(10G 帶寬)拓寬到“雙向十車道”(100G、400G 帶寬),還優(yōu)化信號系統(tǒng)(硬件加速技術(shù)),讓車輛(數(shù)據(jù))通行時延降到微秒級。

筆者認(rèn)為,兩者的本質(zhì)差異決定了其適配場景的互補(bǔ)性。從技術(shù)特性看,Scale Out以“廣度”取勝,可擴(kuò)展性強(qiáng)、成本低。Scale Up以“深度”見長,性能突出、架構(gòu)簡單但擴(kuò)展受限且成本高昂。

從應(yīng)用場景看,Scale up是訓(xùn)練階段及推理decode階段的重要支撐,負(fù)責(zé)連接海量GPU 節(jié)點(diǎn)完成大規(guī)模并行計算;Scale Out則更適合推理prefill階段的高性價比需求。英偉達(dá)本次發(fā)布的CPX系列就是針對推理prefill階段的高性價比,取消scale up。這種針對特定場景的取舍,并不能印證兩者誰更有價值。

當(dāng)談及兩種網(wǎng)絡(luò)模式,我們就不得不提業(yè)界廣為流傳的“Scale Up會取代Scale Out”的觀點(diǎn)。

在筆者看來,這種觀點(diǎn)如同在談及“城市交通”時,只認(rèn)為城市需要快車道,不需要普通路網(wǎng)。這顯然不全面。

從技術(shù)特性看,Scale Out是“廣度選手”,像普通路網(wǎng)一樣覆蓋廣、能容下大量節(jié)點(diǎn);Scale Up是“深度選手”,像快車道一樣速度快、性能強(qiáng),但能覆蓋的范圍有限,成本也高。

此時再看兩者關(guān)系,大家自然很容易發(fā)現(xiàn)二者根本不是“替代關(guān)系”,而是“搭檔關(guān)系”。



比如英偉達(dá)Vera Rubin NVL144 Rubin CPX機(jī)架,就像一座規(guī)劃合理的“交通樞紐”,用Scale Out鋪好“普通路網(wǎng)”,讓大量服務(wù)器能順暢連接,再靠Scale Up建“快車道”,讓核心節(jié)點(diǎn)的數(shù)據(jù)能高速傳輸,兩者缺一不可。

未來,隨著計算側(cè)需求越來越精細(xì),這兩種網(wǎng)絡(luò)會繼續(xù)各司其職,Scale Out當(dāng)“大管家”,管好AI訓(xùn)練的“大規(guī)模連接”;Scale Up當(dāng)“急先鋒”,滿足AI推理對數(shù)據(jù)低時延的需求。

所以,我們可以肯定的是,兩種網(wǎng)絡(luò)攜手,可以將網(wǎng)絡(luò)架構(gòu)打造成更高效的“交通系統(tǒng)”,而不是走向“非此即彼”的死胡同。

產(chǎn)業(yè)共識下的底座價值:Scale Out網(wǎng)絡(luò)不可替代

隨著異構(gòu)集群成為AI基礎(chǔ)設(shè)施的主流形態(tài),Scale Out網(wǎng)絡(luò)的底座地位愈發(fā)穩(wěn)固。無論是技術(shù)特性與架構(gòu)需求的匹配度,還是全球廠商的戰(zhàn)略布局,都印證了其無法被Scale Up網(wǎng)絡(luò)替代的核心價值。

首先,從技術(shù)本質(zhì)看,異構(gòu)集群的分布式特性與Scale Out網(wǎng)絡(luò)天然契合。異構(gòu)集群通過CPU、GPU、DPU等不同硬件的分工協(xié)作實(shí)現(xiàn)效率最優(yōu),這種架構(gòu)要求網(wǎng)絡(luò)必須具備靈活連接、負(fù)載均衡與故障冗余能力。

Scale Out網(wǎng)絡(luò)的分布式架構(gòu)恰好滿足這些需求。其通過動態(tài)路由技術(shù)可實(shí)現(xiàn)計算節(jié)點(diǎn)的靈活組網(wǎng),通過負(fù)載分擔(dān)機(jī)制避免單點(diǎn)壓力過大,通過多路徑冗余確保某一設(shè)備故障時業(yè)務(wù)不中斷。

相比之下,Scale Up網(wǎng)絡(luò)依賴單節(jié)點(diǎn)性能提升,一旦核心設(shè)備出現(xiàn)故障,可能導(dǎo)致整個子集群癱瘓,難以適配異構(gòu)集群的可靠性要求。

其次,從廠商實(shí)踐看,全球主流玩家均將Scale Out網(wǎng)絡(luò)作為戰(zhàn)略核心。英偉達(dá)在推廣Rubin CPX的同時,同步強(qiáng)化Spectrum-X以太網(wǎng)的Scale Out能力,通過ConnectX-9 SuperNIC與Dynamo平臺編排,實(shí)現(xiàn)百萬級GPU集群的高效互聯(lián)。

Mellanox的InfiniBand網(wǎng)絡(luò)雖以高性能著稱,但仍通過Fat-Tree等拓?fù)浣Y(jié)構(gòu)強(qiáng)化Scale Out擴(kuò)展能力。

再將視線轉(zhuǎn)回國內(nèi),華為推出CloudEngine XH系列交換機(jī),通過iMaster NCE智能管理系統(tǒng)實(shí)現(xiàn)萬級節(jié)點(diǎn)的Scale Out部署。

我們不難發(fā)現(xiàn),這些布局共同印證了一個結(jié)論,Scale Out網(wǎng)絡(luò)是構(gòu)建大規(guī)模AI集群的基礎(chǔ)前提。

最后,從成本效益看,Scale Out網(wǎng)絡(luò)是平衡性能與成本的最優(yōu)解。AI產(chǎn)業(yè)的爆發(fā)式增長帶來算力需求的指數(shù)級提升,單純依賴Scale Up網(wǎng)絡(luò)的高端設(shè)備升級,將導(dǎo)致成本隨規(guī)模呈幾何級增長 。

Scale Out網(wǎng)絡(luò)通過標(biāo)準(zhǔn)化以太網(wǎng)設(shè)備與分布式架構(gòu),實(shí)現(xiàn)“按需擴(kuò)展、線性成本”,在支撐集群規(guī)模從千級向萬級跨越的同時,將單位算力的網(wǎng)絡(luò)成本降低60%以上。對于追求性價比的AI企業(yè)而言,Scale Out網(wǎng)絡(luò)的成本優(yōu)勢使其成為無法替代的選擇。

筆者觀察:攜手同行,才能把握AI時代新機(jī)遇

如今,AI智算產(chǎn)業(yè)正站在從“規(guī)模擴(kuò)張”向“質(zhì)量提升”轉(zhuǎn)型的關(guān)鍵節(jié)點(diǎn),英偉達(dá)Rubin CPX的發(fā)布只是這場變革的縮影。

在異構(gòu)集群成為主流的未來,Scale Out網(wǎng)絡(luò)將如同城市的基礎(chǔ)設(shè)施路網(wǎng),支撐起整個AI生態(tài)的高效運(yùn)轉(zhuǎn),而Scale Up網(wǎng)絡(luò)則如同專屬快車道,為關(guān)鍵場景提供性能加速。兩者的協(xié)同共存將是網(wǎng)絡(luò)架構(gòu)的必然選擇。

產(chǎn)業(yè)需要明確的是,Scale Out網(wǎng)絡(luò)作為通信底座的核心地位,始終不可或缺。對于AI從業(yè)者而言,認(rèn)清這一趨勢,才能在基礎(chǔ)設(shè)施建設(shè)中實(shí)現(xiàn)性能與成本的最優(yōu)平衡,把握AI產(chǎn)業(yè)的下一波機(jī)遇。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
日媒:“忘祖之人”竟是中國乒乓球最大敵人,有中國自媒體支持張本智和

日媒:“忘祖之人”竟是中國乒乓球最大敵人,有中國自媒體支持張本智和

星Xin辰大海
2026-01-05 12:51:57
美軍悍然侵入,馬杜羅已被抓!多國發(fā)聲,中國對委投資打水漂?

美軍悍然侵入,馬杜羅已被抓!多國發(fā)聲,中國對委投資打水漂?

博覽歷史
2026-01-03 19:14:52
中國動“真格”了!中方霸氣警告:90天內(nèi)不給358億賠償金

中國動“真格”了!中方霸氣警告:90天內(nèi)不給358億賠償金

趣生活
2025-12-31 20:59:47
拆了又合?退役軍人事務(wù)局7年后再歸民政,是試點(diǎn)還是全國信號?

拆了又合?退役軍人事務(wù)局7年后再歸民政,是試點(diǎn)還是全國信號?

達(dá)文西看世界
2026-01-03 14:33:02
要涼了?閆學(xué)晶賬號櫥窗已清空,代言產(chǎn)品遭抵制,網(wǎng)友呼吁封殺

要涼了?閆學(xué)晶賬號櫥窗已清空,代言產(chǎn)品遭抵制,網(wǎng)友呼吁封殺

丁丁鯉史紀(jì)
2026-01-05 10:53:19
天津這7人要坐牢了!

天津這7人要坐牢了!

天津生活通
2026-01-05 11:29:38
好萊塢性感男神,跌入谷底再逆襲!然而現(xiàn)在,又快成流浪漢了....

好萊塢性感男神,跌入谷底再逆襲!然而現(xiàn)在,又快成流浪漢了....

英國那些事兒
2026-01-04 23:29:17
給近三年最好的10部年代劇排個名:《老舅》第6,第1名沒有爭議

給近三年最好的10部年代劇排個名:《老舅》第6,第1名沒有爭議

大齡女一曉彤
2026-01-05 09:58:37
著名音樂人、黑豹樂隊創(chuàng)始人郭傳林逝世,享年66歲

著名音樂人、黑豹樂隊創(chuàng)始人郭傳林逝世,享年66歲

澎湃新聞
2026-01-05 09:44:27
養(yǎng)老金發(fā)放新通知!2月到賬時間有變,速查賬戶

養(yǎng)老金發(fā)放新通知!2月到賬時間有變,速查賬戶

李博世財經(jīng)
2026-01-05 10:58:56
盧偉:今晚是向冠軍隊廣廈學(xué)習(xí)的好機(jī)會;張鎮(zhèn)麟已融入球隊體系

盧偉:今晚是向冠軍隊廣廈學(xué)習(xí)的好機(jī)會;張鎮(zhèn)麟已融入球隊體系

懂球帝
2026-01-05 13:46:07
張靈甫身亡,蔣介石當(dāng)眾將湯恩伯打得滿頭血,死后蔣仍冷言相待

張靈甫身亡,蔣介石當(dāng)眾將湯恩伯打得滿頭血,死后蔣仍冷言相待

浩渺青史
2026-01-04 00:58:05
小米澄清“200km/h瞬間剎?!毕禂嗾氯×x,雷軍感嘆:尬黑給我造成了很大心理陰影【附小米造車業(yè)務(wù)分析】

小米澄清“200km/h瞬間剎?!毕禂嗾氯×x,雷軍感嘆:尬黑給我造成了很大心理陰影【附小米造車業(yè)務(wù)分析】

前瞻網(wǎng)
2026-01-04 16:01:10
5日馬杜羅出庭受審,快審快判后投進(jìn)監(jiān)獄,美國老劇本將再次上演

5日馬杜羅出庭受審,快審快判后投進(jìn)監(jiān)獄,美國老劇本將再次上演

長星寄明月
2026-01-05 14:05:23
2026剛開年,人民日報再次點(diǎn)名張藝謀,釋放2大信號,鞏俐沒說錯

2026剛開年,人民日報再次點(diǎn)名張藝謀,釋放2大信號,鞏俐沒說錯

做一個合格的吃瓜群眾
2026-01-05 05:56:55
臺積電2nm量產(chǎn)初期月產(chǎn)能約3.5萬片晶圓 2026年底有望達(dá)14萬片

臺積電2nm量產(chǎn)初期月產(chǎn)能約3.5萬片晶圓 2026年底有望達(dá)14萬片

財聯(lián)社
2026-01-05 13:02:31
羅馬仕停工停產(chǎn)狀態(tài)再延期一年,被傳已啟動重生計劃

羅馬仕停工停產(chǎn)狀態(tài)再延期一年,被傳已啟動重生計劃

南方都市報
2026-01-05 13:44:05
內(nèi)地女游客在香港因手機(jī)沒電付不了款,揮菜刀砍手機(jī)襲警被制服

內(nèi)地女游客在香港因手機(jī)沒電付不了款,揮菜刀砍手機(jī)襲警被制服

元爸體育
2026-01-05 14:06:51
醫(yī)生多次勸告:一旦吃上甲鈷胺,4件事就不要做了,別害了自己

醫(yī)生多次勸告:一旦吃上甲鈷胺,4件事就不要做了,別害了自己

王二哥老搞笑
2026-01-05 12:06:10
羅晉女兒顏值暴擊!詳娃娃臉蛋軟萌,偏心老爸的樣子萌化全網(wǎng)

羅晉女兒顏值暴擊!詳娃娃臉蛋軟萌,偏心老爸的樣子萌化全網(wǎng)

叨叨話影
2026-01-05 10:04:40
2026-01-05 15:23:00
黃海峰 incentive-icons
黃海峰
關(guān)注通信、終端、IT
2247文章數(shù) 990關(guān)注度
往期回顧 全部

科技要聞

雷軍新年首播:確認(rèn)汽車業(yè)務(wù)降速

頭條要聞

媒體:美國捉拿馬杜羅后 多位專家示警賴清德

頭條要聞

媒體:美國捉拿馬杜羅后 多位專家示警賴清德

體育要聞

女子世界第一,9年前在咖啡店洗碗

娛樂要聞

黃宗澤奪雙料視帝,淚灑頒獎臺憶往昔

財經(jīng)要聞

李迅雷:擴(kuò)內(nèi)需要把重心從"投"轉(zhuǎn)向"消"

汽車要聞

不是9S是8X!極氪全新高性能旗艦SUV命名官宣

態(tài)度原創(chuàng)

游戲
家居
數(shù)碼
藝術(shù)
公開課

《碧藍(lán)航線》2025冬日快閃點(diǎn)燃玩家熱情 三城線下嘉年華圓滿落幕

家居要聞

白色大理石 奢華現(xiàn)代

數(shù)碼要聞

瑞美熱水器好不好?這3點(diǎn)實(shí)力遠(yuǎn)超大牌

藝術(shù)要聞

19幅 列賓美院學(xué)生優(yōu)秀畢業(yè)作品

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版