国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

從靈衢協(xié)議,看懂AI計算3.0

0
分享至



公元前219年,秦始皇的南征大軍卡在了五嶺之間。

糧草運不上去,士兵困在山中,前方百越未平,后方補給線幾近斷裂。

長江水系與珠江水系被群山隔斷,水不通,路難行,再強的軍隊也寸步難移。

兩千多年后,中國乃至全球的AI工程師們,竟站在了相似的十字路口。



大模型參數(shù)動輒千億萬億,數(shù)據(jù)如洪流奔涌,但算力卻像被困在“五嶺”之間的秦軍。單張GPU算得再快,也扛不住全局需求;堆疊上千張卡組成集群,又陷入通信擁堵、調度混亂、能耗飆升的泥潭??ㄔ俣?,資源也無法高效流動。

正是在這相似的困局中,人們開始重新思考:如何不靠蠻力開山,而用巧思引水?如何讓算力如活水,而非死湖?

答案悄然指向一條古老智慧的回響——靈渠。



讓我們先從最基本的計算單元說起。

現(xiàn)代GPU就像一艘性能卓越的獨木舟。以NVIDIA H100為例,F(xiàn)P16算力達1979 TFLOPS,內存帶寬3.35 TB/s。如果只是處理圖像分類、語音識別這些傳統(tǒng)任務,它就像在平靜湖面航行的輕舟,游刃有余。

這一階段可以稱為AI計算1.0,單卡主體時代。

那個時代,算力集中在單芯片上。算法優(yōu)化的核心是挖掘單卡潛力,算子融合、內核優(yōu)化、顯存復用,所有技術手段都圍繞如何讓這一張卡跑得更快展開。但模型規(guī)模受限于顯存,模型參數(shù)必須能完整地放入單卡顯存中,顯存容量就是模型規(guī)模的天花板,并且擴展方式簡單粗暴。當單卡不夠用時,解決方案直截了當——換更大的卡。從V100到A100,再到H100,每一代新品都帶來顯存和算力的雙重提升。



那是一個摩爾定律依然有效的美好時代,硬件的迭代速度跟得上算法的增長需求。

然而,2020年之后,風向變了。

大模型訓練不再是湖面泛舟,而是橫渡太平洋。以GPT-4級別的模型為例,參數(shù)量約1.8萬億,是GPT-3的10倍以上;訓練數(shù)據(jù)超過13萬億token,需要處理的知識量相當于人類全部書面記錄的數(shù)倍;訓練周期長達數(shù)月,消耗的計算資源相當于數(shù)萬個GPU年的工作量。



模型參數(shù)量暴漲到萬億級別,單卡已經難以承載AI訓練的需求。一方面,GPT-4級別的模型僅權重就需要約3.6TB顯存空間,單卡連完整模型的一角都無法承載。另一方面,萬億參數(shù)模型的前向傳播和反向傳播涉及海量矩陣運算,單卡算力再強,一次完整的訓練周期也以年為單位,而這顯然滯后于市場。

獨木舟再快,也載不動智能時代的萬噸巨輪。那么,既然一艘船不夠,能否組建一支龐大的艦隊,齊頭并進?



既然獨木舟不行,那就組建船隊。

現(xiàn)代AI超算中心動輒部署成千上萬張GPU。Meta的RSC集群擁有6080張A100,微軟為OpenAI構建的Azure AI超算據(jù)信集成上萬張H100。這標志著AI計算2.0,以大規(guī)模GPU集群為主體的時代到來。

把算力堆到足夠大,就能訓練更大的模型,這聽起來很美好。理論上,萬卡集群的算力應該是單卡的萬倍,訓練時間應該線性縮短。

但現(xiàn)實卻是,所有船只都堵在了幾個狹窄的閘口。實際算力利用率往往不到一半,剩下的資源都在等待、同步、重試中白白消耗。

問題出在哪里?

當集群規(guī)模達到萬卡級別時,系統(tǒng)復雜度呈指數(shù)級增長。每一張GPU都是一個計算節(jié)點,節(jié)點之間需要頻繁交換梯度、參數(shù)、激活值,通信量隨著卡數(shù)增加而成倍放大。



一張卡出問題可能拖累整個訓練任務,一個網絡擁塞可能讓上千張卡空轉等待。擴展效率隨著規(guī)模擴大而顯著下降,從百卡到千卡的效率損失可能是20%,從千卡到萬卡的損失可能超過50%。

這就是分布式訓練中的擴展性墻,規(guī)模越大,每增加一張卡帶來的收益越小。

通信木桶短板效應同樣致命。集群的整體速度不取決于最快的節(jié)點,而受制于最慢的那個。

一張GPU溫度過高降頻、一條網絡鏈路帶寬波動、一個交換機端口延遲抖動,都可能成為整個集群的瓶頸。在同步訓練中,所有節(jié)點必須等待最慢的那個完成當前步驟才能繼續(xù)。



這就像古代漕運,千艘糧船齊發(fā),卻共用幾座狹窄船閘,沒有統(tǒng)一水位調控,沒有智能分流機制,船越多,堵得越死。算力的“五嶺”并未消失,只是從單卡轉移到了集群內部。

顯然,單純增加船只(GPU卡)的數(shù)量,無法根治航道(通信與調度)的擁堵問題。

既然堆數(shù)量解決不了流通問題,我們是否該換一種思路。不是造更多船,而是修一條能貫通南北的水道?



兩千年前,秦人修靈渠,打通湘水與漓水,首次實現(xiàn)長江與珠江水系貫通。此舉非為造更多船,而是重構水的流動方式,讓資源自然匯聚、高效流轉。

今天,靈衢協(xié)議以同樣的思路帶我們走向了AI計算3.0——超節(jié)點時代。

超節(jié)點是指由多個計算節(jié)點通過高速互聯(lián)組成的邏輯上像一臺計算機的計算系統(tǒng)。

這一思路最早可以追溯到英偉達的NVLink技術。



NVLink的核心突破在于重新定義了芯片間的距離。傳統(tǒng)PCIe互聯(lián)帶寬有限、延遲較高,如同鄉(xiāng)間小路,難以承載海量數(shù)據(jù)流通。NVLink則如同在芯片之間修建高速公路,讓GPU之間的通信效率大幅提升。通過NVLink Switch的引入,跨服務器通信效率得以改善,數(shù)百張GPU可以緊密互聯(lián),在軟件層面呈現(xiàn)為單一計算實體。

NVLink的演進證明了高速互聯(lián)的價值,為超節(jié)點概念奠定了技術基礎。但隨著集群規(guī)模繼續(xù)擴張,一些局限也逐漸顯現(xiàn)。協(xié)議相對封閉,主要在自家生態(tài)內部優(yōu)化;跨廠商兼容性有限,異構設備接入成本較高。

用戶若采用NVLink,通常需全面采用英偉達的GPU、軟件棧等,對單一廠商依賴較深。在擴展規(guī)模上,如NVL72超節(jié)點最大支持72張GPU卡,超大規(guī)模擴展時需結合InfiniBand或以太網等其他技術。

當集群規(guī)模從百卡走向萬卡,企業(yè)不愿被單一供應商鎖定時,行業(yè)對開放互聯(lián)標準的呼聲便自然浮現(xiàn)。技術演進的邏輯向來如此,一種方案解決了舊問題,也會帶來新局限,而后繼者便在縫隙中生長。

靈衢協(xié)議的出現(xiàn)正是對這一需求的回應。

靈衢協(xié)議是華為自主研發(fā)的面向超節(jié)點的互聯(lián)協(xié)議,旨在解決大規(guī)模計算資源連接的互聯(lián)技術難題。萬卡超節(jié)點,一臺計算機,也就是說,通過該互聯(lián)協(xié)議,把數(shù)萬規(guī)模的計算卡,聯(lián)接成一個超節(jié)點,能夠像一臺計算機一樣工作、學習、思考、推理。



靈衢的突破體現(xiàn)在對集群時代痛點的逐一化解。

顯存不夠,就構建統(tǒng)一內存池、統(tǒng)一編址,讓多個GPU的顯存池化。萬億參數(shù)模型可以像存放在單一大內存中那樣被訪問,無需感知底層的分布式架構。這如同靈渠將兩條水系連通,水位統(tǒng)一,船只自然暢行。

通信太慢,就用高速互聯(lián)協(xié)議突破帶寬時延瓶頸。靈衢采用總線級互聯(lián)設計,讓跨服務器通信效率接近片內通信。對等協(xié)作的架構讓各計算單元處于平等地位,能夠動態(tài)分配任務和負載,避免單點瓶頸拖累整體進度。

高可靠性方面,單卡故障自動遷移,訓練不中斷。數(shù)千張GPU連續(xù)運行數(shù)周,硬件故障幾乎成為必然事件。靈衢協(xié)議確保故障發(fā)生時,任務可以無縫遷移到其他節(jié)點,確保大規(guī)模算力系統(tǒng)的穩(wěn)定運行,就像漕運中的備用航道,一處阻塞,立刻分流,糧船不至滯留。

并且,基于靈衢協(xié)議支持光電混合互聯(lián),Atlas 950 SuperPoD支持8192卡無收斂全互聯(lián),這一規(guī)模是NVL72的百倍有余。這意味著,原本需要層層網絡轉換、多協(xié)議疊加的萬卡集群,現(xiàn)在可以通過一套統(tǒng)一的互聯(lián)協(xié)議直接打通。

簡言之,流通的關鍵是讓水系變得更智慧,AI計算的突破往往來自對連接的重新理解。

水流淌了兩千年,依舊滋養(yǎng)大地。算力奔涌在芯片間,終將孕育智能。當困在技術的五嶺之間時,不妨回頭看看歷史,答案可能就在身后的古老智慧里。

水之道,即算之道。通則達,阻則滯。此理千古不易,無論湘漓之水,還是0與1之流。



聲明:個人原創(chuàng),僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
驚險領跑!趙心童5-4險壓海菲爾德,世錦賽衛(wèi)冕首戰(zhàn)亮紅燈

驚險領跑!趙心童5-4險壓海菲爾德,世錦賽衛(wèi)冕首戰(zhàn)亮紅燈

友誼第一
2026-04-19 00:49:13
賭王何鴻燊家族的墳場引熱議!網友:外人在門口燒香的資格都沒有

賭王何鴻燊家族的墳場引熱議!網友:外人在門口燒香的資格都沒有

火山詩話
2026-04-16 13:25:46
廣東3消息!杜鋒帶隊再破紀錄,徐杰手感冰涼,焦泊喬回歸遭棄用

廣東3消息!杜鋒帶隊再破紀錄,徐杰手感冰涼,焦泊喬回歸遭棄用

多特體育說
2026-04-18 23:35:10
警告三次不如動真格一次!中方勒令立即停運,西方媒體都看懵了

警告三次不如動真格一次!中方勒令立即停運,西方媒體都看懵了

老鵜愛說事
2026-04-18 10:26:49
美國性感女星:受夠了胸罩!我不在乎這對香腸掉到膝蓋

美國性感女星:受夠了胸罩!我不在乎這對香腸掉到膝蓋

可愛小菜
2026-04-16 19:03:27
《八千里路》跑題嚴重,好好的抗戰(zhàn)劇,硬生生被演成無厘頭鬧劇

《八千里路》跑題嚴重,好好的抗戰(zhàn)劇,硬生生被演成無厘頭鬧劇

鄉(xiāng)野小珥
2026-04-19 00:32:30
鄧家佳黑絲

鄧家佳黑絲

情感大頭說說
2026-04-16 07:13:06
前首富貝索斯56歲老婆要為愛生娃?稱和丈夫恩愛與錢無關,開35億游艇度假被狂噴!

前首富貝索斯56歲老婆要為愛生娃?稱和丈夫恩愛與錢無關,開35億游艇度假被狂噴!

英國報姐
2026-04-18 21:10:46
屬馬人:4月19-21日多去這兩個地方走走,尤其是馬年特別有益

屬馬人:4月19-21日多去這兩個地方走走,尤其是馬年特別有益

阿天愛旅行
2026-04-18 20:29:43
科爾:庫里無疑是我在任何體育項目中見過的最偉大的球隊門面

科爾:庫里無疑是我在任何體育項目中見過的最偉大的球隊門面

懂球帝
2026-04-18 14:03:03
為什么山姆越來越多,麥德龍卻快倒光了?網友:降本增效的問題

為什么山姆越來越多,麥德龍卻快倒光了?網友:降本增效的問題

另子維愛讀史
2026-04-13 13:14:30
她在柬埔寨7天被輪奸9次,被大陸解救后,竟回臺灣后立馬抹黑大陸

她在柬埔寨7天被輪奸9次,被大陸解救后,竟回臺灣后立馬抹黑大陸

樂天閑聊
2026-03-27 04:40:41
英國小妹歧視中國人后續(xù):身份曝光社死,被告學校,下場大快人心

英國小妹歧視中國人后續(xù):身份曝光社死,被告學校,下場大快人心

阿鳧愛吐槽
2026-04-17 13:49:07
普通家庭能給孩子最好的托舉是什么?網友:真的說到點上了

普通家庭能給孩子最好的托舉是什么?網友:真的說到點上了

夜深愛雜談
2025-11-21 20:20:12
福彩3D 26098期(2026-4-18)科學投注策略

福彩3D 26098期(2026-4-18)科學投注策略

藍色海邊
2026-04-18 14:57:21
咖啡再次被關注!醫(yī)生發(fā)現(xiàn):高血脂患者常喝咖啡,或出現(xiàn)這些變化

咖啡再次被關注!醫(yī)生發(fā)現(xiàn):高血脂患者常喝咖啡,或出現(xiàn)這些變化

岐黃傳人孫大夫
2026-04-16 16:30:03
女孩當小姐,一晚要提供4到5次上門服務,被親人點到不赴約

女孩當小姐,一晚要提供4到5次上門服務,被親人點到不赴約

情感藝術家
2026-02-26 10:48:00
饅頭立大功!研究發(fā)現(xiàn):糖尿病患者常吃饅頭,或能降低4類并發(fā)癥

饅頭立大功!研究發(fā)現(xiàn):糖尿病患者常吃饅頭,或能降低4類并發(fā)癥

荊醫(yī)生科普
2026-04-18 13:14:25
高端產品打親民牌,智己LS8做了其它豪華品牌不敢做的事

高端產品打親民牌,智己LS8做了其它豪華品牌不敢做的事

汽車網評
2026-04-18 08:00:19
別克GL8新能源給出1.5萬優(yōu)惠!網友:還好沒著急下手

別克GL8新能源給出1.5萬優(yōu)惠!網友:還好沒著急下手

汽車網評
2026-04-18 22:41:22
2026-04-19 02:40:49
腦極體 incentive-icons
腦極體
從智能密鑰到已知盡頭
3656文章數(shù) 167423關注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領袖發(fā)聲

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領袖發(fā)聲

體育要聞

時隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應潘宏彬去世,拒談喪禮細節(jié)

財經要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態(tài)度原創(chuàng)

時尚
游戲
房產
本地
藝術

選對發(fā)型,真的能少走很多變美彎路

讓老粥批直呼“計劃有變”的歲獸代理人,到底是什么東西?

房產要聞

官宣簽約最強城更!海口樓市,突然殺入神秘房企!

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

藝術要聞

波蘭美女奧拉·卡茲馬雷克,絕美風情讓人驚艷!

無障礙瀏覽 進入關懷版