国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

算力“性能墻”與“生態(tài)墻”何解?超集群與開放協(xié)同成業(yè)內(nèi)共識

0
分享至

《科創(chuàng)板日報》12月19日訊(記者 陳俊清) 當(dāng)前,人工智能已實現(xiàn)從輔助工具到核心生產(chǎn)要素的根本性躍遷??茖W(xué)大模型、世界模型、具身智能等前沿方向迅猛發(fā)展,對底層算力提出了前所未有的規(guī)模與性能要求。

然而,繁榮背后,“性能墻”與“生態(tài)墻”雙重制約依然突出——高端算力供給不足、軟硬件適配不暢、技術(shù)標準不一、應(yīng)用成本高昂,已成為廣大中小企業(yè)發(fā)展的顯著壁壘。在此背景下,“開放”從可選項轉(zhuǎn)變?yōu)楫a(chǎn)業(yè)突破瓶頸、實現(xiàn)可持續(xù)發(fā)展的行業(yè)共識。

在近日于昆山舉辦的首屆光合組織人工智能創(chuàng)新大會(HAIC2025)上,多名演講嘉賓認為,市場需要開放、高效、安全、穩(wěn)定的智能計算基礎(chǔ)設(shè)施,應(yīng)該建設(shè)開放、共享、分工、協(xié)作、團結(jié)、共贏的產(chǎn)業(yè)格局。

超集群破解算力不足、生態(tài)碎片化難題

IDC預(yù)計,全球在人工智能技術(shù)上的支出未來5年累計將超過5萬億美元,并將在未來五年內(nèi)帶動約22.3萬億美元的全球累計經(jīng)濟影響。到2030年,AI將為中國經(jīng)濟累計影響超過4萬億美元,中國未來5年在人工智能技術(shù)上的支出總額將達到5000億美元。

IDC中國區(qū)副總裁兼首席分析師武連峰在會上分析了當(dāng)前算力發(fā)展方向。他表示,為滿足萬億規(guī)模模型訓(xùn)練推理及海量用戶需求,傳統(tǒng)節(jié)點已無法適配,需通過超高速總線將多個GPU整合為高密度計算單元;開放生態(tài)則可避免用戶鎖定于單一廠商,適配不同GPU、CPU發(fā)展。

同時,算力市場也面臨集群規(guī)模持續(xù)增大、性能與效率瓶頸凸顯、生態(tài)壁壘問題突出、綜合運行保障能力不足等多重挑戰(zhàn)。武連峰認為,AI超集群是核心解決方案。與傳統(tǒng)集群相比,AI超集群實現(xiàn)多項跨越:一是在單節(jié)點內(nèi)實現(xiàn)高密度算力集成,規(guī)模可達百P級;二是穩(wěn)定跨越,通過多超節(jié)點連接實現(xiàn)優(yōu)異擴展性,依托高可靠性設(shè)計保障系統(tǒng)容錯能力,支持長時間運行;三是采用更高效的數(shù)據(jù)中心整體設(shè)計以及液冷技術(shù),適配多元需求的同時降低PUE。

中科曙光高級副總裁李斌表示,自2022年AI大模型出現(xiàn)智慧涌現(xiàn)以來,模型參數(shù)的“軍備競賽”推動人工智能綜合能力快速提升,也倒逼算力基礎(chǔ)設(shè)施加速升級。當(dāng)前全球領(lǐng)先AI超級計算機的性能增速,已超越傳統(tǒng)超算發(fā)展黃金時期。與此同時,大模型技術(shù)迭代也對計算裝備提出多重新挑戰(zhàn),涵蓋內(nèi)存容量與帶寬、互聯(lián)帶寬與延遲、系統(tǒng)能耗與效率、穩(wěn)定性及應(yīng)用生態(tài)兼容性等關(guān)鍵維度。

面對行業(yè)挑戰(zhàn),中科曙光明確發(fā)展方向主要包括兩方面,一是在芯片制程等單點技術(shù)相對落后的情況下,通過系統(tǒng)工程創(chuàng)新彌補差距;二是以開放架構(gòu)促進軟硬件協(xié)同?;诖?,中科曙光提出AI計算開放架構(gòu)理念,以GPU算力芯片為核心進行緊耦合系統(tǒng)設(shè)計,優(yōu)化數(shù)據(jù)通路實現(xiàn)存算傳高效協(xié)同,并整合冷卻、供電、管理等環(huán)節(jié)提升效能。

作為HAIC2025的核心亮點之一,中科曙光發(fā)布scaleX萬卡超集群。據(jù)介紹,該集群面向萬億參數(shù)大模型與前沿科學(xué)智能等極致場景設(shè)計,由16個scaleX640超節(jié)點通過全棧自主研發(fā)的原生RDMA高速網(wǎng)絡(luò)互連而成,硬件支持多品牌AI加速卡,軟件兼容主流計算生態(tài)。

針對此次發(fā)布的萬卡超集群,李斌在接受《科創(chuàng)板日報》等媒體采訪時表示,其算力較傳統(tǒng)算力集群提升顯著,一方面,超集群通過提供更充沛的算力供給,解決傳統(tǒng)集群算力不足導(dǎo)致的產(chǎn)業(yè)周期變長問題,在氣象數(shù)據(jù)模擬、新藥研發(fā)等領(lǐng)域成效顯著;其次,通過算力、數(shù)據(jù)、模型一體化管控及智能調(diào)度,超集群可以讓科研人員聚焦核心任務(wù),無需關(guān)注底層運維細節(jié)。在行業(yè)賦能層面,該超集群將為銀行的結(jié)算時效提升、數(shù)據(jù)安全保障以及新能源汽車仿真模擬等重點行業(yè)的數(shù)字化轉(zhuǎn)型提供核心支撐。

對于大規(guī)模超算集群可能因高度定制化而犧牲升級靈活性的問題,李斌坦言“魚與熊掌不可兼得”,當(dāng)前超節(jié)點系統(tǒng)為適配苛刻算力需求,多采用基于業(yè)務(wù)算法的高度定制化耦合設(shè)計,確實存在升級靈活度不足的問題。為此,曙光在通過推動 “AI計算開放架構(gòu)” 來尋求平衡。該架構(gòu)旨在實現(xiàn)從芯片到系統(tǒng)的垂直整合與協(xié)同優(yōu)化,并通過成立“聯(lián)合實驗室”及下設(shè)多個技術(shù)工作組,如芯片互連、底層軟件棧、冷卻技術(shù)等,聯(lián)合產(chǎn)業(yè)鏈伙伴共同制定開放標準,讓硬件架構(gòu)能兼容不同計算芯片,緩解生態(tài)碎片化。

互聯(lián)總線開放提速 國產(chǎn)算力邁向生態(tài)協(xié)同

面對大模型和智能體應(yīng)用快速普及帶來的算力與系統(tǒng)復(fù)雜性提升,開放計算已成為破解生態(tài)碎片化和應(yīng)用遷移成本高企的關(guān)鍵路徑。“當(dāng)前AI芯片正向異構(gòu)融合演進,CPU與加速器協(xié)同能力成為制約系統(tǒng)性能釋放的重要因素。通過軟硬件協(xié)同優(yōu)化和生態(tài)共建,開放計算有望加速AI能力向行業(yè)場景滲透,為數(shù)字化轉(zhuǎn)型提供可持續(xù)的基礎(chǔ)算力支撐?!焙9庑畔⒖偛蒙吵罕硎尽?/p>

在沙超群看來,產(chǎn)業(yè)發(fā)展維度方面,AI領(lǐng)域呈現(xiàn)三大顯著特征:其一,基座大模型競爭白熱化,全球領(lǐng)先科研團隊與科技企業(yè)持續(xù)加碼,參數(shù)規(guī)模向萬億乃至十萬億級突破,世界模型研究加速推進;其二,行業(yè)應(yīng)用邁入深水區(qū),垂類大模型數(shù)量超數(shù)千個,專注解決實際問題的行業(yè)智能體相關(guān)企業(yè)達5000多家,AI正全方位重塑千行百業(yè)信息系統(tǒng)并引發(fā)能效革命;其三,原生應(yīng)用普及度大幅提升,日活用戶逼近3億大關(guān),通過手機、汽車、可穿戴設(shè)備等載體深度融入日常生活,我國日均Token消耗量已達50萬億,未來在數(shù)字融合、具身智能技術(shù)驅(qū)動下將實現(xiàn)更廣泛滲透。

作為AI產(chǎn)業(yè)發(fā)展的核心支撐,算力芯片與AI產(chǎn)業(yè)呈現(xiàn)相輔相成的發(fā)展態(tài)勢。在摩爾定律尚未失效的背景下,萬億級乃至十萬億級大模型預(yù)訓(xùn)練及海量并發(fā)推理需求,推動算力芯片形態(tài)不斷演進。

沙超群認為,當(dāng)前,NVLink已成為主流模型架構(gòu),對通訊效率和性能提出更高要求,算力芯片已從單一GPU向CPU+GPU異構(gòu)協(xié)同轉(zhuǎn)變,再到互聯(lián)技術(shù)、超節(jié)點、超集群技術(shù)的迭代,這不僅是規(guī)模的擴張,更是對通訊、存儲、供電等極致效率的體系化競賽。

沙超群分析稱,我國AI算力產(chǎn)業(yè)具備多重優(yōu)勢:國際影響力開源基礎(chǔ)模型不斷涌現(xiàn)、應(yīng)用場景豐富,且AI基礎(chǔ)投資規(guī)模持續(xù)擴大,今年中國相關(guān)投資達800億美金,未來仍有增長空間。與此同時,AI算力行業(yè)也面臨嚴峻挑戰(zhàn),國內(nèi)30多家算力芯片企業(yè)單體規(guī)模有限,多數(shù)不具備系統(tǒng)能力;產(chǎn)業(yè)生態(tài)孤立、技術(shù)壁壘林立、生態(tài)碎片化問題突出,整機廠商、最終用戶及開發(fā)者需適配多套技術(shù)路線,且與國際主流生態(tài)存在兼容性難題。

針對上述困境,沙超群表示,AI算力發(fā)展需要更加緊耦合的系統(tǒng),也需要開放、統(tǒng)一的互聯(lián)協(xié)議,構(gòu)建開放、協(xié)同、開源、共贏的產(chǎn)業(yè)新生態(tài)是破局關(guān)鍵。據(jù)其介紹,海光信息秉承CPU+DCU雙芯戰(zhàn)略:一方面加強自主迭代,實現(xiàn)每年一代芯片、性能翻一番,同時通過CPU、DCU及互聯(lián)協(xié)同設(shè)計高效超節(jié)點,發(fā)揮系統(tǒng)算力優(yōu)勢;另一方面通過開源開放協(xié)同6000多家合作伙伴,打造系統(tǒng)化能力,聚合國內(nèi)GPU產(chǎn)業(yè)生態(tài)。

據(jù)了解,海光信息已于今年三季度正式宣布開放互聯(lián)總線協(xié)議(HSL),該協(xié)議的核心內(nèi)容包括開放完整的總線協(xié)議、提供IP參考設(shè)計、開放指令集等。據(jù)海光系統(tǒng)互聯(lián)總線工作組負責(zé)人介紹,海光信息將于2026年一季度發(fā)布HSL IP參考設(shè)計以及HSL硬件系統(tǒng)參考設(shè)計,支持海光系統(tǒng)互聯(lián)總線的系統(tǒng)將于2027年實現(xiàn)量產(chǎn)。

此外,在本屆HAIC2025上,由浪潮信息、中興、聯(lián)想開天等30余家頭部科技企業(yè)聯(lián)合發(fā)起的“AI計算開放架構(gòu)聯(lián)合實驗室”首批項目組協(xié)同創(chuàng)新計劃啟動。該聯(lián)合實驗室將重點圍繞系統(tǒng)高速互聯(lián)總線、統(tǒng)一基礎(chǔ)軟件棧、AI服務(wù)器設(shè)計規(guī)范等行業(yè)共性需求,開展協(xié)同研發(fā),以解決國產(chǎn)智算服務(wù)器“適配難”、缺少統(tǒng)一類CUDA基礎(chǔ)軟件棧、異構(gòu)算力間兼容性不足、系統(tǒng)協(xié)同效率低等問題。實驗室相關(guān)技術(shù)成果將遵循開放協(xié)議,推動在不同架構(gòu)與場景中的快速驗證與應(yīng)用。據(jù)悉,這一產(chǎn)學(xué)研協(xié)同平臺預(yù)計未來三年總投入將達10億元,建成涵蓋設(shè)計、仿真、驗證及測試的完整研發(fā)環(huán)境,開展30+聯(lián)合研發(fā)項目。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

科創(chuàng)板日報 incentive-icons
科創(chuàng)板日報
上海報業(yè)集團主管主辦
58260文章數(shù) 44520關(guān)注度
往期回顧 全部

專題推薦

洞天福地 花海畢節(jié) 山水饋贈里的“詩與遠方

無障礙瀏覽 進入關(guān)懷版