国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

推理新范式:動態(tài)效能算法讓算力資源實現(xiàn)最大化

0
分享至


智東西
作者 陳駿達
編輯 漠影

過去兩年,全行業(yè)都在為大模型訓練瘋狂堆GPU、建算力中心。但當視角進入2025年,真正決定企業(yè)競爭力的主戰(zhàn)場,已經(jīng)迅速從訓練轉(zhuǎn)向推理。

推理時代的算力不再是單一物理資源,而是一個跨地域、跨架構(gòu)、跨屬權(quán)的綜合體系:一個企業(yè)的AI服務或許部署在自建IDC,同時又依賴外部云GPU;模型推理與模型訓練并行存在;開發(fā)測試與生產(chǎn)流量共處一套資源;多業(yè)務、多租戶同時爭搶不同規(guī)格的GPU。這意味著算力要實時、動態(tài)、按業(yè)務優(yōu)先級調(diào)度。而傳統(tǒng)調(diào)度做不到。

傳統(tǒng)算力調(diào)度平臺誕生于傳統(tǒng)云的集群運維背景,其核心目標是讓硬件更易管理、更少出故障、更好利用。它們的能力止步于服務器視角:節(jié)點是否在線、顯存是否足夠、任務是否分配成功、權(quán)限是否隔離,在面向大模型的AI推理時代,卻難以回答更重要的問題——推理延遲是否達標?模型吞吐是否最優(yōu)?算力成本與業(yè)務收入是否動態(tài)平衡?在新范式轉(zhuǎn)換下,系統(tǒng)需要重構(gòu)。

這些問題在推理時代被迅速放大。過去算力用于訓練,以“跑成”模型為目標;如今算力直接承載真實業(yè)務,算力調(diào)度被迫承擔更多職責——必須從IT運維邏輯升級為AI業(yè)務邏輯。但挑戰(zhàn)也隨之而來:模型結(jié)構(gòu)差異巨大、推理鏈路時延瓶頸、業(yè)務波峰波谷并發(fā)變化…每一次算力分配,都可能影響一筆業(yè)務成交、一位用戶體驗,甚至一個產(chǎn)品的增長曲線。

GPU不再是靜態(tài)資源,而成為可運營、可定價、可持續(xù)經(jīng)營的資產(chǎn)。

為了支撐這場范式轉(zhuǎn)移,國內(nèi)AI基座平臺技術(shù)公司矩量無限重新定義了算力的基本單元,不再是“服務器/GPU卡”,而是圍繞業(yè)務目標進行抽象的、可度量和可調(diào)度的算力單元,并基于此構(gòu)建了完整的技術(shù)基座,形成了覆蓋算力、模型、服務到商業(yè)回報的全鏈路平臺矩陣。

在技術(shù)創(chuàng)新層面,矩量無限的開物算力調(diào)度系統(tǒng)深度融合了Kubernetes動態(tài)資源分配(DRA)技術(shù) ,通過“異構(gòu)GPU自適應調(diào)度與分配方法及系統(tǒng)”實現(xiàn)了突破性的算力管理能力:

技術(shù)特點:通過具備自學習能力的算力適配器,將異構(gòu)國產(chǎn)GPU間的靜態(tài)硬件資源單元抽象并轉(zhuǎn)化為動態(tài)標準化的“算力能力單元”(CU)以實現(xiàn)精準調(diào)度和分配 。

產(chǎn)生效果:實現(xiàn)了基于任務實際需求的“目標導向”按需調(diào)度,極大地簡化了用戶對異構(gòu)硬件結(jié)構(gòu)和組成的關(guān)注,顯著提高了集群資源利用率和運行穩(wěn)定性。

達成形式:在各廠商設備信息上報的基礎(chǔ)上,通過自學習算力適配器基于歷史推理記錄持續(xù)優(yōu)化動態(tài)折算因子,并將統(tǒng)一的算力容量重發(fā)布為Kubernetes動態(tài)資源分配(DRA)ResourceSlice實現(xiàn)資源的精準綁定與分配 。

以上能力目前已在國產(chǎn)GPU卡上得到規(guī)模驗證。矩量無限已在壁仞、天數(shù)、希姆等國產(chǎn)GPU的千卡級混合集群上完整跑通算力單元化與跨架構(gòu)推理調(diào)度,同時相關(guān)平臺已落地全國多個千卡智算中心,并服務于工信部工業(yè)互聯(lián)網(wǎng)研究院、多家頭部行業(yè)客戶、高??蒲袡C構(gòu)等。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
警示!上海一三甲醫(yī)院發(fā)生一起甲等醫(yī)療事故,醫(yī)院賠償70多萬

警示!上海一三甲醫(yī)院發(fā)生一起甲等醫(yī)療事故,醫(yī)院賠償70多萬

梅斯醫(yī)學
2025-12-19 07:54:40
中方拋118億美債,逼出4接盤國,馬斯克已通知白宮:美基本沒救了

中方拋118億美債,逼出4接盤國,馬斯克已通知白宮:美基本沒救了

普覽
2025-12-20 10:56:16
誰懂!你永遠不知道你的顧客是干什么的,網(wǎng)友:在知識面前顫抖吧

誰懂!你永遠不知道你的顧客是干什么的,網(wǎng)友:在知識面前顫抖吧

夜深愛雜談
2025-12-20 16:51:40
上海城投(集團)有限公司原黨委副書記楊茂鐸被查

上海城投(集團)有限公司原黨委副書記楊茂鐸被查

界面新聞
2025-12-19 22:32:12
臺北襲擊案27歲兇手背景披露:家境不錯從小叛逆,對槍械及軍事設備感興趣

臺北襲擊案27歲兇手背景披露:家境不錯從小叛逆,對槍械及軍事設備感興趣

黃河新聞網(wǎng)呂梁頻道
2025-12-20 14:35:04
網(wǎng)友評南博事件:我不相信有人能為這幅畫謀劃近40年

網(wǎng)友評南博事件:我不相信有人能為這幅畫謀劃近40年

映射生活的身影
2025-12-20 16:36:14
這一次,再多名和利,也救不了“狂妄自大、兩面三刀”的張本智和

這一次,再多名和利,也救不了“狂妄自大、兩面三刀”的張本智和

知法而形
2025-12-20 10:32:18
講個笑話:世界上人口最多的民族,居然連自己的民族服飾都不認識

講個笑話:世界上人口最多的民族,居然連自己的民族服飾都不認識

魔都姐姐雜談
2025-12-18 12:48:41
南京博物館:捐贈已歸國家,無義務返還

南京博物館:捐贈已歸國家,無義務返還

映射生活的身影
2025-12-19 17:13:17
驚喜!哈里梅根全家福曝光:阿奇王子長相帥氣不輸喬治路易

驚喜!哈里梅根全家福曝光:阿奇王子長相帥氣不輸喬治路易

風月得自難尋
2025-12-20 02:08:35
婚禮上新娘冷白皮成焦點,淺淺一笑攝影師看迷糊了:美得挪不開眼

婚禮上新娘冷白皮成焦點,淺淺一笑攝影師看迷糊了:美得挪不開眼

梅子的小情緒
2025-12-17 20:29:38
112-107!森林狼送雷霆第3敗,讓我看清5個事實:追不上勇士73勝

112-107!森林狼送雷霆第3敗,讓我看清5個事實:追不上勇士73勝

球場沒跑道
2025-12-20 13:30:32
大風、暴雪來襲!湖北氣溫暴跌10℃

大風、暴雪來襲!湖北氣溫暴跌10℃

湖北e家庭
2025-12-20 11:06:11
西方媒體:哪怕中國全力以赴,也不可能按時建成這樣龐大的工程

西方媒體:哪怕中國全力以赴,也不可能按時建成這樣龐大的工程

樂天閑聊
2025-12-20 10:59:49
2026央視跨年晚會陣容曝光,看完明星名單難掩激動,該來的都來了

2026央視跨年晚會陣容曝光,看完明星名單難掩激動,該來的都來了

阿纂看事
2025-12-19 14:38:58
近30年評分最高的10部電視劇,《漫長的季節(jié)》第6,第1實至名歸

近30年評分最高的10部電視劇,《漫長的季節(jié)》第6,第1實至名歸

皮皮電影
2025-12-19 10:47:48
別吃太清淡,181個國家研究:吃得越咸,壽命可能越長?真相來了

別吃太清淡,181個國家研究:吃得越咸,壽命可能越長?真相來了

岐黃傳人孫大夫
2025-12-17 09:05:37
他給延安送13萬兩黃金,手握幾十萬大軍,建國后卻成了勞資處長

他給延安送13萬兩黃金,手握幾十萬大軍,建國后卻成了勞資處長

大千世界觀
2025-12-19 21:51:13
犯了大忌!托卡耶夫去日本明治神宮,必將是其政治生涯的一個污點

犯了大忌!托卡耶夫去日本明治神宮,必將是其政治生涯的一個污點

我心縱橫天地間
2025-12-20 15:40:20
烏軍成功奪回庫皮揚斯克,俄軍慘遭全殲。

烏軍成功奪回庫皮揚斯克,俄軍慘遭全殲。

世界探索者探索
2025-12-15 23:02:13
2025-12-20 23:59:00
智東西 incentive-icons
智東西
聚焦智能變革,服務產(chǎn)業(yè)升級。
10947文章數(shù) 116930關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

印度官員:若"臺灣有事" 印度不太可能像西方那樣回應

頭條要聞

印度官員:若"臺灣有事" 印度不太可能像西方那樣回應

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

2026央視跨年晚會陣容曝光,豪華陣仗

財經(jīng)要聞

求解“地方財政困難”

汽車要聞

嵐圖推進L3量產(chǎn)測試 已完成11萬公里實際道路驗證

態(tài)度原創(chuàng)

藝術(shù)
旅游
本地
健康
公開課

藝術(shù)要聞

驚!肢體語言竟如此迷人,讓人無法抗拒!

旅游要聞

虹口新春“五必”榜單來啦!一季度“樂購樂游”攻略輕松拿捏!

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風骨

這些新療法,讓化療不再那么痛苦

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版