国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

如何在Kubernetes上運行AI/ML?

0
分享至

  在機器學習(ML)領(lǐng)域,訓練出高性能模型只是第一步,真正的挑戰(zhàn)在于如何將模型快速、可靠且經(jīng)濟、高效地部署到生產(chǎn)環(huán)境中進行推理。特別是在大規(guī)模場景下,GPU資源管理、延遲優(yōu)化、批處理策略、模型版本控制、可觀測性以及輔助服務(wù)(如預處理器、特征存儲庫和向量數(shù)據(jù)庫)的編排,都是亟待解決的難題。Kubernetes作為容器編排領(lǐng)域的佼佼者,為AI/ML應(yīng)用提供了一個可擴展、可移植的平臺,不僅能夠有效管理GPU等計算資源,還能自動調(diào)整工作負載規(guī)模,以應(yīng)對批處理任務(wù)以及實時推理的不同需求。

  Kubernetes,一個為AI/ML高效分配資源的理想平臺

  Kubernetes通過其強大的調(diào)度能力,能夠高效分配GPU和其他計算資源,實現(xiàn)工作負載的緊密打包和自動伸縮。同時,還能協(xié)調(diào)包含模型服務(wù)器、預處理器、向量數(shù)據(jù)庫和特征存儲在內(nèi)的復雜系統(tǒng),確保低延遲端點的穩(wěn)定運行。容器化技術(shù)為模型環(huán)境提供了可重復性和一致性,使得模型的持續(xù)集成與持續(xù)部署(CI/CD)成為可能。Kubernetes內(nèi)置的滾動更新、流量分割以及指標追蹤功能,進一步增強了生產(chǎn)環(huán)境的安全性和可靠性。

  對于追求操作簡便性的團隊,托管端點服務(wù)或許是一個選擇,但在需要高度控制、可移植性、高級編排以及實時服務(wù)能力的場景下,Kubernetes無疑是首選。

  典型ML推理設(shè)置,KServe在Kubernetes上的應(yīng)用

  使用KServe在Kubernetes上進行機器學習推理,有一個典型架構(gòu),那就是客戶端(如數(shù)據(jù)科學家、應(yīng)用程序或批處理作業(yè))通過Ingress向KServe的InferenceService發(fā)送請求。內(nèi)部,通過可選的Transformer組件負責預處理輸入數(shù)據(jù),預測器用來加載模型并提供預測功能,而可選的解釋器則提供模型洞察。模型工件從模型存儲中提取,并通過TensorFlow、PyTorch、scikit-learn、ONNX或Triton等運行時進行處理。整個系統(tǒng)運行在Knative/Kubernetes之上,支持CPU和GPU計算層,并可與AWS、Azure、Google Cloud等云服務(wù)提供商集成。


  至于,MLFlow與KServe的集成如何操作?MLFlow是一個開源的機器學習框架,旨在解決模型從實驗到生產(chǎn)過程中遇到的常見問題,如實驗數(shù)據(jù)丟失、結(jié)果重現(xiàn)困難以及模型版本管理混亂。它通過跟蹤運行情況、保存環(huán)境代碼和管理模型版本,為模型部署提供了有序的流程。MLFlow還支持將模型打包為Docker鏡像,便于分發(fā)到Kubernetes等服務(wù)平臺。

  MLFlow與Kubernetes的集成,有一個關(guān)鍵點需要注意,雖然MLFlow提供了基于FastAPI的推理服務(wù)器,并通過mlflow models build-docker命令支持容器化部署,但這種方法在大規(guī)模生產(chǎn)環(huán)境中可能不夠高效。FastAPI的輕量級特性使其難以應(yīng)對極端并發(fā)或復雜的自動伸縮模式。相比之下,KServe(前身為KFServing)為TensorFlow、XGBoost、scikit-learn和PyTorch等主流機器學習庫提供了高性能、可擴展且與框架無關(guān)的推理平臺。

  更好地托管AutoML,把Azure ML轉(zhuǎn)為AKS

  首先,Azure ML與AKS進行集成。Azure ML是一個全面的機器學習生命周期管理平臺,支持實驗跟蹤、模型注冊表、訓練、部署和監(jiān)控。對于需要高度控制運行時、擴展和網(wǎng)絡(luò)的場景,Azure Kubernetes Service(AKS)是一個理想的選擇。它允許自定義運行時、進行嚴格的性能調(diào)整,并與現(xiàn)有Kubernetes基礎(chǔ)設(shè)施集成。

  其次,進行分步操作,在AKS上部署Azure ML AutoML模型。

  讓Kubernetes上的LLM服務(wù)更好地運行,還需要vLLM與KServe的集成。接下來的問題是,如何把LLM與Kubernetes進行結(jié)合?在Kubernetes上運行大型語言模型(LLM)可以實現(xiàn)可靠、可擴展且可重復的推理。Kubernetes提供了GPU調(diào)度、自動伸縮和基本功能編排,而vLLM等優(yōu)化運行時則提供了高通量、高內(nèi)存效率的推理能力。通過結(jié)合請求批處理和可觀測性(指標、日志記錄和健康檢查),可以提供低延遲的API服務(wù)。

  使用vLLM和KServe部署LLM的步驟如下:

  1.準備集群和KServe。配置Kubernetes集群(AKS/GKE/EKS或本地),并安裝KServe。

  2.獲取vLLM??寺LLM倉庫,安裝vLLM,并在本地測試vllm serve命令。

  3.創(chuàng)建vLLM服務(wù)運行時/容器。構(gòu)建容器鏡像,或使用KServe支持的vLLM服務(wù)時間配置。

  4.部署InferenceService。應(yīng)用KServe InferenceService YAML文件,引用vLLM服務(wù)的運行時和模型存儲。

  5.驗證和調(diào)諧。通過Ingress/負載均衡器調(diào)用端點,測量延遲/吞吐量,并調(diào)整vLLM批處理/令牌緩存設(shè)置和KServe自動伸縮規(guī)則。

  另外, vLLM、KServe,還要與BentoML進行集成。vLLM,作為高通量、GPU高效的推理引擎,負責實際執(zhí)行LLM;BentoML,封裝模型加載、自定義預處理/后處理以及穩(wěn)定的REST/gRPC API,構(gòu)建可重復的Docker鏡像或工件;KServe,作為Kubernetes控制平面,部署B(yǎng)ento鏡像或vLLM鏡像,并處理自動伸縮、路由、健康檢查和生命周期管理。最終,通過BentoML打包模型和請求邏輯,KServe將該容器以InferenceService的形式運行,提供自動伸縮、流量控制和可觀測性。

  值得一提的是,不同的技術(shù)路線選擇,都有自己的優(yōu)缺點。KServe作為Kubernetes-原生機器學習服務(wù)與編排框架,提供了豐富的路由、內(nèi)置遙測和解釋器集成以及多運行時支持,但學習曲線較陡,操作面較大。BentoML以Python為中心,提供了出色的開發(fā)者人體工學設(shè)計和可重復的圖像,但集群原生控件較少。NVIDIA Triton推理服務(wù)器則以其出色的GPU吞吐量和混合幀支持著稱,但同樣需要額外的設(shè)置來實現(xiàn)自動伸縮和高級Kubernetes操作。

  結(jié)論

  在生產(chǎn)環(huán)境中運行可靠、低延遲的AI/ML應(yīng)用,同時控制成本、性能和可重復性,是每個ML團隊的目標。Kubernetes通過其強大的編排能力,為模型及其支持服務(wù)提供了所需的資源管理和自動伸縮功能。結(jié)合優(yōu)化的運行時、服務(wù)層和推理引擎,我們可以在保持高輸入性能的同時,獲得生產(chǎn)級操作控制。從小處著手,使用單個模型進行驗證,然后根據(jù)清晰的SLO選擇符合性能和操作需求的服務(wù)棧,最終迭代出彈性且可擴展的服務(wù)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
一周竟然7次,41歲男子心源性猝死,妻子:勸了很多次,就是不聽

一周竟然7次,41歲男子心源性猝死,妻子:勸了很多次,就是不聽

健康之光
2026-03-28 13:35:08
14億人集體買房,為什么最后買出了一個爛攤子?

14億人集體買房,為什么最后買出了一個爛攤子?

流蘇晚晴
2026-03-25 18:14:02
現(xiàn)實生活中,間諜都是怎么暴露的?網(wǎng)友:百密一疏呀

現(xiàn)實生活中,間諜都是怎么暴露的?網(wǎng)友:百密一疏呀

夜深愛雜談
2026-03-27 20:48:13
打服錫安!5年2.9億美元!隊史最大合同來了

打服錫安!5年2.9億美元!隊史最大合同來了

籃球教學論壇
2026-03-27 16:46:21
比賴清德更狂的人出現(xiàn)了,如果她當臺灣地區(qū)領(lǐng)導人,我軍該怎么辦

比賴清德更狂的人出現(xiàn)了,如果她當臺灣地區(qū)領(lǐng)導人,我軍該怎么辦

聽風喃
2026-03-27 17:40:05
深夜利好,半導體龍頭利潤增3213%,8股高增5股暴雷,別踩雷

深夜利好,半導體龍頭利潤增3213%,8股高增5股暴雷,別踩雷

鵬哥投研
2026-03-28 08:54:39
何其宗56歲突然脫軍裝走人,中將軍銜說不要就不要了,原因至今沒人說得清

何其宗56歲突然脫軍裝走人,中將軍銜說不要就不要了,原因至今沒人說得清

文史明鑒
2026-03-27 20:55:09
你見過哪些悶聲發(fā)大財?shù)娜??網(wǎng)友:干這個買三套房子,兩個門面

你見過哪些悶聲發(fā)大財?shù)娜耍烤W(wǎng)友:干這個買三套房子,兩個門面

夜深愛雜談
2026-02-01 18:57:04
張雪峰的財產(chǎn)幾個億,竟然沒買車,天天吃外賣,生活簡樸到極致

張雪峰的財產(chǎn)幾個億,竟然沒買車,天天吃外賣,生活簡樸到極致

魔都姐姐雜談
2026-03-25 15:59:12
虛構(gòu):四大靈性動物不能吃,食之折壽,害之受報!別小看其中因果

虛構(gòu):四大靈性動物不能吃,食之折壽,害之受報!別小看其中因果

屏兒愛讀書
2025-03-06 14:40:35
90秒直擊2026中關(guān)村論壇機器人成果

90秒直擊2026中關(guān)村論壇機器人成果

新華社
2026-03-27 21:53:42
猝死也會發(fā)生在健康人身上,請收下醫(yī)生的這10條建議

猝死也會發(fā)生在健康人身上,請收下醫(yī)生的這10條建議

知識分子
2026-03-27 12:18:08
盧靖姍帶4個月兒子賞春,穿禮服踩高跟推嬰兒車像走秀,二胎好乖

盧靖姍帶4個月兒子賞春,穿禮服踩高跟推嬰兒車像走秀,二胎好乖

眼底星碎
2026-03-26 17:10:15
舊手機回收價狂漲五六倍!回收商:開不了機的照樣高價收

舊手機回收價狂漲五六倍!回收商:開不了機的照樣高價收

快科技
2026-03-25 14:53:24
東契奇轟41分創(chuàng)6大神跡:湖人隊史首人比肩科比+一數(shù)據(jù)領(lǐng)跑全聯(lián)盟

東契奇轟41分創(chuàng)6大神跡:湖人隊史首人比肩科比+一數(shù)據(jù)領(lǐng)跑全聯(lián)盟

Emily說個球
2026-03-28 13:19:28
心源性猝死的人越來越多?醫(yī)生再次強調(diào):寧可喝茶水,也別做5事

心源性猝死的人越來越多?醫(yī)生再次強調(diào):寧可喝茶水,也別做5事

任醫(yī)生聊健康
2026-03-28 10:13:36
以色列退出比利-簡-金杯:去不太受歡迎的國家風險太大

以色列退出比利-簡-金杯:去不太受歡迎的國家風險太大

懂球帝
2026-03-27 20:09:24
張雪峰和妻子結(jié)婚照:年輕時帥氣溫柔,他終究沒陪愛人走到白頭

張雪峰和妻子結(jié)婚照:年輕時帥氣溫柔,他終究沒陪愛人走到白頭

草莓解說體育
2026-03-28 13:38:58
俄羅斯人蓋棺定論赫魯曉夫:五功五過,把中國從盟友搞成敵人才是致命傷

俄羅斯人蓋棺定論赫魯曉夫:五功五過,把中國從盟友搞成敵人才是致命傷

寄史言志
2026-03-27 18:16:05
涉嫌嚴重違紀違法,張智舟被查

涉嫌嚴重違紀違法,張智舟被查

都市快報橙柿互動
2026-03-27 17:32:30
2026-03-28 14:19:00
ITPUB學院
ITPUB學院
分享技術(shù)干貨,了解最新動態(tài)
1190文章數(shù) 629關(guān)注度
往期回顧 全部

科技要聞

遭中國學界"拉黑"后,這家AI頂會低頭道歉

頭條要聞

牛彈琴:伊朗狠角色強硬嘲諷美國 卻被美移出獵殺名單

頭條要聞

牛彈琴:伊朗狠角色強硬嘲諷美國 卻被美移出獵殺名單

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

王一博改名上熱搜!個人時代正式開啟!

財經(jīng)要聞

我在小吃培訓機構(gòu)學習“科技與狠活”

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

藝術(shù)
親子
家居
旅游
數(shù)碼

藝術(shù)要聞

細膩優(yōu)雅的花卉靜物畫 | Henrietta Smith

親子要聞

李清心官宣再次懷孕,下體流暗紅色分泌物,胎兒心跳一度消失

家居要聞

曲線華爾茲 現(xiàn)代簡約

旅游要聞

云南鶴慶:“雪”落枝頭 流蘇花開

數(shù)碼要聞

華碩新款商務(wù)本ExpertBook B3 G1,配置超豐富!

無障礙瀏覽 進入關(guān)懷版