国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

智算,云廠商的下一個(gè)戰(zhàn)場(chǎng)

0
分享至


作者 | 陳姚戈

經(jīng)過(guò) 2025 年的試水,Agent 的落地效果將在 2026 年受到集中檢驗(yàn)。能否持續(xù)產(chǎn)生業(yè)務(wù)價(jià)值,將成為衡量 Agent 成功與否的核心標(biāo)準(zhǔn),而支撐其穩(wěn)定、高效運(yùn)行的底層 AI Infra,也隨之被推至臺(tái)前。

隨著大模型技術(shù)從實(shí)驗(yàn)室走向產(chǎn)業(yè),AI 應(yīng)用正從“技術(shù)驗(yàn)證”階段邁向“規(guī)?;逃谩钡纳钏畢^(qū)。企業(yè)不再滿足于模型的單點(diǎn)效果,而是期待 AI 能融入業(yè)務(wù)全流程、創(chuàng)造可衡量的商業(yè)價(jià)值。

在這個(gè)背景下,單一的算力堆砌已無(wú)法應(yīng)對(duì)系統(tǒng)性挑戰(zhàn),企業(yè)需要的是“算存網(wǎng)數(shù)一體的高性能智算底座”。這一架構(gòu)趨勢(shì)強(qiáng)調(diào)計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)與數(shù)據(jù)能力的深度融合與協(xié)同優(yōu)化。計(jì)算層面,需支撐海量訓(xùn)推需求和異構(gòu)算力高效調(diào)度;存儲(chǔ)需靈活應(yīng)對(duì)海量、多模態(tài)的復(fù)雜數(shù)據(jù);網(wǎng)絡(luò)層面,需要保障極致低延遲與高吞吐;數(shù)據(jù)則需實(shí)現(xiàn)從采集、治理到檢索的全鏈路智能管理。

今年,領(lǐng)先云廠商均在積極升級(jí)其計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)與數(shù)據(jù)能力,以構(gòu)建更適配 Agent 大規(guī)模落地的新一代基礎(chǔ)設(shè)施。例如騰訊云,其 2024 年推出的新 AI Infra 品牌“云智算”,今年動(dòng)作頻頻:4 月,基于對(duì) AI 云基礎(chǔ)設(shè)施強(qiáng)需求、訓(xùn)推高頻應(yīng)用的行業(yè) --- 出行領(lǐng)域,發(fā)布了行業(yè)云智算 AI Infra 解決方案;5 月,騰訊云智算,全面擴(kuò)展至全場(chǎng)景 AI 應(yīng)用,技術(shù)能力全面升級(jí),從高效、可靠、易用三大價(jià)值角度,支撐企業(yè)加速 AI 落地。9 月針對(duì)企業(yè)級(jí) Agent 需求,發(fā)布 Agent Runtime 解決方案及基礎(chǔ)設(shè)施專家服務(wù)智能體 CloudMate;10 月推出自進(jìn)化運(yùn)維 Agent 平臺(tái),技術(shù)迭代快速。

這些密集的布局與迭代,共同指向一個(gè)更深刻的趨勢(shì):智算,即圍算存網(wǎng)數(shù)一體的高性能 AI Infra,預(yù)示著云廠商們的下一個(gè)戰(zhàn)場(chǎng)已經(jīng)形成。

1 算力和網(wǎng)絡(luò)協(xié)同,釋放集群極限性能

IDC 與騰訊云聯(lián)合發(fā)布的白皮書《AI Infra: 加速智能體落地的基礎(chǔ)架構(gòu)發(fā)展趨勢(shì)與產(chǎn)業(yè)實(shí)踐》指出,AI Infra 正經(jīng)歷從“云 +AI”向“云原生 +Agent 協(xié)同”的架構(gòu)重構(gòu)。

實(shí)現(xiàn)這一重構(gòu),需建立實(shí)時(shí)推理網(wǎng)絡(luò),以支撐智能體決策所需的毫秒級(jí)延遲;構(gòu)建統(tǒng)一的異構(gòu)算力池,實(shí)現(xiàn)對(duì)多元算力的高效調(diào)度。

未來(lái)的智算底座必須像高度協(xié)同的神經(jīng)系統(tǒng),確保數(shù)據(jù)在計(jì)算單元間無(wú)阻塞地高速流動(dòng),因?yàn)槿魏苇h(huán)節(jié)的延遲或瓶頸都將導(dǎo)致整體響應(yīng)能力的衰減。以典型的 AI 訓(xùn)練流程為例,它涉及數(shù)據(jù)加載、GPU 計(jì)算、跨卡通信、權(quán)重更新等多個(gè)環(huán)節(jié),其中數(shù)據(jù)讀取效率、計(jì)算協(xié)同能力以及網(wǎng)絡(luò)通信質(zhì)量,共同決定了整體計(jì)算效率。

在高性能計(jì)算領(lǐng)域,這被稱為“木桶效應(yīng)”——計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)任一環(huán)節(jié)的短板,都會(huì)導(dǎo)致昂貴的集群算力無(wú)法充分釋放。

如何打破木桶效應(yīng)?

面對(duì)高性能計(jì)算中的木桶效應(yīng),騰訊云 HCC 構(gòu)建了一套從底層硬件到上層軟件的優(yōu)化體系,旨在協(xié)同計(jì)算、存儲(chǔ)、網(wǎng)絡(luò),將大規(guī)模集群的潛力徹底釋放。

HCC 首先直面大規(guī)模 AI 訓(xùn)練的核心矛盾:由于模型參數(shù)過(guò)于龐大,機(jī)器間的互聯(lián)完全依賴于網(wǎng)絡(luò),網(wǎng)絡(luò)時(shí)延會(huì)直接導(dǎo)致高速運(yùn)轉(zhuǎn)的 GPU 進(jìn)入等待狀態(tài),因此網(wǎng)絡(luò)極易成為整個(gè)系統(tǒng)的性能瓶頸。而簡(jiǎn)單地增加 GPU 節(jié)點(diǎn)并不能帶來(lái)線性的性能提升,網(wǎng)絡(luò)擁塞和拓?fù)鋸?fù)雜性會(huì)嚴(yán)重?fù)p耗集群的整體算力。


騰訊云還為星脈網(wǎng)絡(luò)設(shè)計(jì)了高性能集合通信庫(kù) TCCL,避免因網(wǎng)絡(luò)問(wèn)題導(dǎo)致的訓(xùn)練中斷等問(wèn)題。調(diào)度系統(tǒng)為 GPU 卡間的每一次通信智能選擇全局最優(yōu)路徑,避免擁堵。同時(shí),通過(guò)親和性調(diào)度,系統(tǒng)優(yōu)先調(diào)度同一交換機(jī)下的 GPU 進(jìn)行通信,讓數(shù)據(jù)避免不必要的跨機(jī)傳輸。


訓(xùn)練過(guò)程中,Checkpoint 和 KV Cache 的讀寫對(duì)存儲(chǔ) IO 吞吐提出極限要求。同時(shí),海量的訓(xùn)練數(shù)據(jù)通常存放在遠(yuǎn)端的對(duì)象存儲(chǔ)倉(cāng)庫(kù)中,每一次訓(xùn)練迭代都需要數(shù)據(jù)經(jīng)過(guò)遠(yuǎn)程網(wǎng)絡(luò) → 本地磁盤 → 內(nèi)存 → GPU 顯存的鏈路。

為加速數(shù)據(jù)讀取,騰訊云設(shè)計(jì)了多層次存儲(chǔ)加速方案,避免 GPU 空閑等待網(wǎng)絡(luò)數(shù)據(jù)傳輸。


在軟件與運(yùn)維層,騰訊云致力于將硬件效能與系統(tǒng)穩(wěn)定性提升到極致。

作業(yè)集群管理系統(tǒng)會(huì)全面監(jiān)控資源利用率、任務(wù)編排與框架狀態(tài)。當(dāng)訓(xùn)練作業(yè)出現(xiàn)異常時(shí),系統(tǒng)能基于 Checkpoint 在 5 分鐘內(nèi)實(shí)現(xiàn)任務(wù)級(jí)快速自愈;若 GPU 在訓(xùn)練過(guò)程中出現(xiàn)節(jié)點(diǎn)一場(chǎng),集群可在 10 分鐘完成故障節(jié)點(diǎn)剔除與恢復(fù),保障長(zhǎng)周期訓(xùn)練任務(wù)的連續(xù)性。

訓(xùn)練框架上,對(duì)于 PyTorch 等主流訓(xùn)練框架做軟件優(yōu)化,充分釋放硬件潛力。


在推理場(chǎng)景,騰訊云自研 HML 模型權(quán)重分發(fā)技術(shù),可以讓模型快速加載到顯存,滿足實(shí)時(shí)擴(kuò)容場(chǎng)景和模型切換場(chǎng)景的彈性需求。


為了加快推理場(chǎng)景,騰訊云還開(kāi)發(fā)了多機(jī) KV Cache 緩存技術(shù),將 KV Cache 存儲(chǔ)到磁盤,方便未來(lái)多輪對(duì)話等請(qǐng)求場(chǎng)景調(diào)用。今年,騰訊云還新推出推理集群服務(wù),集多樣化模型、彈性算力與多層級(jí)的安全防護(hù)為一體,融合推理加速、機(jī)密計(jì)算、智能監(jiān)控日志分析等核心功能, 保障 AI 應(yīng)用開(kāi)發(fā)落地。


通過(guò)全棧協(xié)同的軟硬件優(yōu)化,騰訊云 HCC 系統(tǒng)破解了大規(guī)模 AI 訓(xùn)推中的“木桶效應(yīng)”,將大規(guī)模 GPU 集群的潛力徹底釋放,為 AI 訓(xùn)練與推理提供穩(wěn)定、高效且極具確定性的算力基石。

目前,騰訊云異構(gòu)計(jì)算已經(jīng)服務(wù)國(guó)內(nèi) 90% 的頭部大模型客戶,覆蓋大模型訓(xùn)練與推理、智能駕駛、互聯(lián)網(wǎng)應(yīng)用、廣告搜索推薦、圖像處理、具身智能、科學(xué)計(jì)算、自然語(yǔ)言處理等豐富場(chǎng)景。

AI SEMI×騰訊云:賦能半導(dǎo)體研發(fā)效率提升

企業(yè)的預(yù)算管理就像“管家過(guò)日子”,AI Infra 的成本,最終都要映射到具體業(yè)務(wù)價(jià)值。誰(shuí)能在同等條件下,提供幫助企業(yè)優(yōu)化成本結(jié)構(gòu)的 AI Infra,誰(shuí)就占有市場(chǎng)先機(jī)。

騰訊云在打破“木桶效應(yīng)”上的努力,尤其是星脈網(wǎng)絡(luò)在大規(guī)模集群擴(kuò)展與效率控制上的能力,正在諸如半導(dǎo)體研發(fā)等高端制造領(lǐng)域轉(zhuǎn)化為直接的生產(chǎn)力。

專注于用 AI 賦能半導(dǎo)體制造的 AI SEMI,業(yè)務(wù)涉及芯片仿真、良率分析等復(fù)雜計(jì)算,對(duì)算力的穩(wěn)定性、擴(kuò)展效率及 TCO 有著嚴(yán)苛要求。AI SEMI 采用混合云架構(gòu),既在公司和客戶本地部署算力,也利用騰訊云的彈性資源。


騰訊云平衡極致算力與網(wǎng)絡(luò)調(diào)度的能力,已在實(shí)際業(yè)務(wù)中轉(zhuǎn)化為顯著優(yōu)勢(shì)。在采用騰訊云 HCC 解決方案后,AI SEMI 一項(xiàng)光刻仿真任務(wù)的完成時(shí)間,從數(shù)周縮短至數(shù)天,不僅加速了研發(fā)迭代周期,更通過(guò)精準(zhǔn)的彈性伸縮,將總體算力成本優(yōu)化了 30% 以上。

AI SEMI 創(chuàng)始人兼 CEO Yoyo Lu 曾指出,客戶在采用大規(guī)模 GPU 集群時(shí),最關(guān)切的問(wèn)題之一便是算力擴(kuò)展后的實(shí)際效率損耗。騰訊云星脈網(wǎng)絡(luò)所提供的“無(wú)損”特性和高達(dá) 95% 的線性擴(kuò)展比,為解決這一顧慮提供了關(guān)鍵技術(shù)支撐。這意味著,當(dāng)半導(dǎo)體企業(yè)為加速芯片設(shè)計(jì)而擴(kuò)容算力時(shí),能夠獲得近乎線性的性能回報(bào),有效控制算力成本。

2 云存儲(chǔ),釋放數(shù)據(jù)價(jià)值

在關(guān)于 AI 基礎(chǔ)設(shè)施的討論中,存儲(chǔ)常常被置于聚光燈外。然而,當(dāng)模型參數(shù)和數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng)時(shí),存儲(chǔ)能力已成為制約 AI 生產(chǎn)力釋放的關(guān)鍵瓶頸。繼“算力缺口”之后,行業(yè)正面臨存儲(chǔ)挑戰(zhàn)——市場(chǎng)缺乏能夠匹配 AI 工作負(fù)載特性、兼具高性能與高性價(jià)比的存儲(chǔ)架構(gòu)與服務(wù)。

這種結(jié)構(gòu)性缺口對(duì)存儲(chǔ)系統(tǒng)提出了前所未有的復(fù)合型要求:它既需要作為海量多模態(tài)數(shù)據(jù)的統(tǒng)一承載平臺(tái),又要支撐從數(shù)據(jù)預(yù)處理、模型訓(xùn)練到推理部署的全鏈路高效流轉(zhuǎn);既要實(shí)現(xiàn)精細(xì)化的數(shù)據(jù)治理與合規(guī)管控,又必須在全生命周期內(nèi)平衡性能、成本與擴(kuò)展性。

在這一背景下,數(shù)據(jù)基礎(chǔ)設(shè)施的角色正在發(fā)生根本性轉(zhuǎn)變。騰訊云存儲(chǔ)研發(fā)總監(jiān)程力認(rèn)為,作為底層基礎(chǔ)設(shè)施,存儲(chǔ)必須向上深度融合,與容器、云函數(shù)、AI 平臺(tái)等上層服務(wù)實(shí)現(xiàn)深度集成與資源協(xié)同調(diào)度。其核心價(jià)值已超越提供存儲(chǔ)空間本身,而在于作為數(shù)據(jù)流轉(zhuǎn)的智能引擎,無(wú)縫融入企業(yè)的整體 AI 工作流,確保數(shù)據(jù)能在計(jì)算與訓(xùn)練環(huán)節(jié)高效流動(dòng)。

Data Platform,更智能的云存儲(chǔ)


騰訊云構(gòu)建的“統(tǒng)一存儲(chǔ) + 智能加速 + 全鏈路處理 + 智能檢索”Data Platform 平臺(tái),正是上述理念的技術(shù)實(shí)現(xiàn)。

Data Platform 以對(duì)象存儲(chǔ) COS 為基礎(chǔ)底座,承載訓(xùn)練數(shù)據(jù)、預(yù)處理樣本及多模態(tài)數(shù)據(jù),在提升系統(tǒng)性能的同時(shí)有效控制存儲(chǔ)成本。

同時(shí),Data Platform 提供 GooseFS 高性能存儲(chǔ)加速層,服務(wù)于近計(jì)算端的數(shù)據(jù)緩存加速,兼容多種語(yǔ)義可與計(jì)算生態(tài)無(wú)縫融合,滿足大規(guī)模數(shù)據(jù)處理和訓(xùn)練對(duì)高性能存儲(chǔ),以及 Checkpoint 寫入需求。


數(shù)據(jù)治理層面,數(shù)據(jù)萬(wàn)象 CI 提供近存儲(chǔ)端的處理能力,其智能檢索組件 MetaInsight 支持對(duì)元數(shù)據(jù)及全媒體內(nèi)容的跨模態(tài)檢索,在保障數(shù)據(jù)可計(jì)算性的同時(shí),實(shí)現(xiàn)內(nèi)容安全與合規(guī)審查。


值得注意的是,騰訊云將高性能檢索與智能緩存能力進(jìn)行了原生融合。MetaInsight 結(jié)合 GooseFS,能夠主動(dòng)從 COS 數(shù)據(jù)湖中識(shí)別并提取高價(jià)值數(shù)據(jù),通過(guò)智能化的緩存與調(diào)度策略,將其高效投遞至計(jì)算節(jié)點(diǎn),實(shí)現(xiàn)“數(shù)據(jù)向計(jì)算靠攏”。例如在自動(dòng)駕駛場(chǎng)景中,該組合可實(shí)現(xiàn)跨存儲(chǔ)桶的數(shù)據(jù)智能標(biāo)識(shí)與統(tǒng)一管理,并根據(jù)不同計(jì)算任務(wù)的實(shí)時(shí)需求,動(dòng)態(tài)、就近地供給數(shù)據(jù)。


AI 時(shí)代下,云存儲(chǔ)不再只是支撐系統(tǒng)運(yùn)行的成本項(xiàng),而是成為釋放 AI 價(jià)值的加速器。騰訊云的云智算存儲(chǔ)方案正是這一理念的集中體現(xiàn)。

文遠(yuǎn)知行×騰訊云:為數(shù)據(jù)洪流提供可無(wú)限拓展的存儲(chǔ)空間

傳統(tǒng)云存儲(chǔ)方案的局限,在自動(dòng)駕駛行業(yè)尤其明顯。

文遠(yuǎn)知行作為業(yè)務(wù)遍布全球、全天候提供服務(wù)的自動(dòng)駕駛公司,每時(shí)每刻都在產(chǎn)生海量、多模態(tài)的非結(jié)構(gòu)化數(shù)據(jù)——這要求團(tuán)隊(duì)建立無(wú)縫擴(kuò)展、統(tǒng)一管理、且不影響核心業(yè)務(wù)性能的全球化存儲(chǔ)方案。

騰訊云等廠商提供的公有云服務(wù),在文遠(yuǎn)知行實(shí)現(xiàn)彈性存儲(chǔ)上起到了重要作用。


文遠(yuǎn)知行構(gòu)建了一套精密的混合云存儲(chǔ)架構(gòu),以廣州和硅谷的自建數(shù)據(jù)中心為核心,結(jié)合騰訊云等云廠商做公有云延伸,滿足數(shù)據(jù)存儲(chǔ)需求。

通過(guò)將極低頻的冷數(shù)據(jù)自動(dòng)、透明地遷移至騰訊云對(duì)象 COS 的低頻或歸檔存儲(chǔ)層級(jí),騰訊云等廠商提供的公有云實(shí)際上成為了一個(gè)可無(wú)限擴(kuò)展的“數(shù)據(jù)冰柜”,而所有數(shù)據(jù)流動(dòng)對(duì)上層業(yè)務(wù)完全透明,業(yè)務(wù)側(cè)始終訪問(wèn)統(tǒng)一的文件索引。

針對(duì)大團(tuán)隊(duì)協(xié)作,文遠(yuǎn)知行實(shí)現(xiàn)了細(xì)粒度帶寬管理機(jī)制,可根據(jù)業(yè)務(wù)優(yōu)先級(jí)(如高優(yōu)訓(xùn)練任務(wù)與低優(yōu)歸檔任務(wù))劃分帶寬通道,確保即使歸檔任務(wù)全力上傳至公有云,核心數(shù)據(jù)處理帶寬仍不受影響,從而保障多租戶環(huán)境下的服務(wù)質(zhì)量。

通過(guò)自建數(shù)據(jù)中心與自研存儲(chǔ)系統(tǒng),并與騰訊云對(duì)象存儲(chǔ) COS 合作,構(gòu)建混合云架構(gòu),文遠(yuǎn)知行持續(xù)探索 AI 存儲(chǔ)的成本、性能和效率最優(yōu)解,也成為重?cái)?shù)據(jù)場(chǎng)景中落地 AI 存儲(chǔ)體系的標(biāo)志性案例。

3 打造 Agent 規(guī)模落地需要的 Infra

隨著 AI 應(yīng)用進(jìn)入規(guī)?;涞仉A段,Agent 正快速滲透至各行各業(yè),成為企業(yè)數(shù)字化轉(zhuǎn)型的核心驅(qū)動(dòng)力。

到 2027 年,部署 Agent 的企業(yè)數(shù)量將翻倍,對(duì) AI 智算的需求也將顯著增長(zhǎng)。并且,Agent 的落地將從醫(yī)療、教育、制造等領(lǐng)域,進(jìn)一步延伸至對(duì)實(shí)時(shí)性、可靠性要求極高的具身智能等前沿場(chǎng)景,底層基礎(chǔ)設(shè)施必須具備更快的模型推理能力、更靈活的工具集成與更可靠的持續(xù)服務(wù)能力。

Agent 能否實(shí)現(xiàn)大規(guī)模、高質(zhì)量的業(yè)務(wù)承載,直接取決于基礎(chǔ)設(shè)施是否具備模型推理的實(shí)時(shí)響應(yīng)能力、外部工具的安全靈活集成機(jī)制,以及復(fù)雜服務(wù)鏈路的長(zhǎng)期穩(wěn)定保障。

面對(duì)這一趨勢(shì),作為“數(shù)字化助手”的騰訊云,在 2025 年再次升級(jí)其云智算全景能力,以加速 Agent 從實(shí)驗(yàn)室走向生產(chǎn)場(chǎng)景。


更懂 Agent 的 Infra

今年 9 月,騰訊云在 Agent Infra 能力上做了兩項(xiàng)關(guān)鍵升級(jí)。

縱向,推出 Agent Runtime,通過(guò)提供運(yùn)行引擎、云沙箱、上下文服務(wù)、網(wǎng)關(guān)、安全可觀測(cè)五大組件,為 AI Agent 的構(gòu)建、部署和運(yùn)行提供堅(jiān)實(shí)底座。值得一提的是,Agent Runtime 可以提供個(gè)輕量級(jí)高并發(fā)的運(yùn)行環(huán)境,目前支持百毫秒級(jí)冷啟動(dòng),并能提供數(shù)十萬(wàn)級(jí)沙箱并發(fā),適配大規(guī)模 Agent 應(yīng)用。


橫向?qū)用妫v訊云推出基礎(chǔ)設(shè)施專家智能體 CloudMate。CloudMate 它提供告警收斂治理和風(fēng)險(xiǎn)主動(dòng)攔截能力,在用戶操作云資源前預(yù)測(cè)并呈現(xiàn)影響,從源頭規(guī)避配置風(fēng)險(xiǎn),并能在編碼階段檢測(cè)低效 SQL 語(yǔ)句。CloudMate 專注于復(fù)雜運(yùn)維場(chǎng)景下的故障定位與根因分析,通過(guò)構(gòu)建自動(dòng)化評(píng)估 - 探索 - 總結(jié) - 檢驗(yàn)閉環(huán)系統(tǒng)(獨(dú)家),處理時(shí)效從傳統(tǒng)的小時(shí)級(jí)提升至分鐘級(jí),無(wú)需人工干預(yù)完成全鏈路故障診斷。


在模型推理側(cè),騰訊云也著力提升效率與性能。針對(duì)手機(jī) AI 助手等需要快速?gòu)椥陨炜s的場(chǎng)景,傳統(tǒng)集群模型加載往往耗時(shí)十幾分鐘,而依托星脈網(wǎng)絡(luò),騰訊云將模型分發(fā)時(shí)間大幅壓縮至 4 秒內(nèi),實(shí)現(xiàn)了近乎實(shí)時(shí)的擴(kuò)容響應(yīng)。

同時(shí),騰訊云推出 TACO DiT 推理引擎,實(shí)現(xiàn)文生圖模型推理加速,覆蓋文生文、文生圖、文生視頻等多種模態(tài),并采用 KV Cache、優(yōu)化通訊協(xié)議等先進(jìn)方案,進(jìn)一步提升了高并發(fā)下的推理穩(wěn)定性與效率。

針對(duì)業(yè)界關(guān)注的 Agent 發(fā)展路徑——通用化還是行業(yè)化,騰訊云也給出了清晰的答案。

在 InfraTalk 直播中,騰訊云異構(gòu)計(jì)算高級(jí)產(chǎn)品經(jīng)理黃陽(yáng)指出,從降本增效的角度出發(fā),必須打造標(biāo)準(zhǔn)化的技術(shù)底座;而面向未來(lái),深入業(yè)務(wù)場(chǎng)景的行業(yè) Agent 將比通用 Agent 更強(qiáng)、規(guī)模更大。因此,騰訊云堅(jiān)持同源同構(gòu)原則,采取標(biāo)準(zhǔn)化底座 + 行業(yè)化解決方案,靈活適配不同行業(yè)對(duì)基礎(chǔ)設(shè)施的要求。

這一模式具體體現(xiàn)在對(duì)不同類型企業(yè)和不同發(fā)展階段客戶的精準(zhǔn)支持上。大模型訓(xùn)練企業(yè)更關(guān)注訓(xùn)練效率與穩(wěn)定性,騰訊云可提供更大規(guī)模集群與更強(qiáng)的故障自愈能力。對(duì)于具身智能或自動(dòng)駕駛企業(yè),由于模型規(guī)模相對(duì)更小,則可通過(guò)優(yōu)化后的 vRDMA 網(wǎng)絡(luò)提供更高性價(jià)比的訓(xùn)練方案。而對(duì)于對(duì)數(shù)據(jù)安全與合規(guī)有嚴(yán)苛要求的政企客戶,騰訊云則提供分布式云或?qū)S性撇渴疬x項(xiàng)。

同時(shí),騰訊云為不同階段的企業(yè)也提供了靈活選擇。面向開(kāi)發(fā)者,提供開(kāi)箱即用的 SaaS 服務(wù)與 API;面向中小企業(yè),提供可快速私有化部署的平臺(tái),并支持微調(diào)與深度定制;面向大型企業(yè)與生態(tài)伙伴,則開(kāi)放更全面的能力,幫助客戶滿足高并發(fā)、多模態(tài)的復(fù)雜訓(xùn)練與推理需求。

智診科技×騰訊云:讓創(chuàng)新科技公司駕馭大模型

Agent 規(guī)?;幕A(chǔ)在于,是否能否在真實(shí)業(yè)務(wù)中穩(wěn)定運(yùn)行、持續(xù)響應(yīng),并承載高并發(fā)與復(fù)雜流程。

在醫(yī)療場(chǎng)景中這一要求尤為突出。醫(yī)療 Agent 并非一次性問(wèn)答工具,而是需要長(zhǎng)期在線,深度參與診療支持與健康管理流程的數(shù)字助手,一旦出現(xiàn)延遲或中斷,都會(huì)直接影響用戶體驗(yàn)甚至業(yè)務(wù)連續(xù)性。

正是在這樣的需求背景下,騰訊云與 AI 醫(yī)療公司智診科技展開(kāi)合作,探索 Agent 在真實(shí)醫(yī)療業(yè)務(wù)中的規(guī)模化運(yùn)行路徑。智診科技自研千億參數(shù)的多模態(tài)醫(yī)學(xué)大模型 WiseDiag,并提供 Agent、醫(yī)學(xué) OCR 等服務(wù),目標(biāo)是將 AI 能力真正嵌入診療與健康管理流程。

對(duì)于研發(fā)大模型的創(chuàng)新科技公司來(lái)說(shuō),構(gòu)建并維護(hù)大規(guī)模算力集群非常有難度。但最大的障礙并非 GPU 本身,而在于 GPU 節(jié)點(diǎn)之間的協(xié)同效率。


騰訊提供的智算集群擁有專為大模型優(yōu)化的星脈高性能網(wǎng)絡(luò),極大地降低了大規(guī)模 GPU 集群間的通信損耗,讓智診科技的模型訓(xùn)練迭代速度提升 20%。

智診科技充分發(fā)揮了騰訊云 GPU 在訓(xùn)練和推理集群上的性能優(yōu)勢(shì)和產(chǎn)品算力優(yōu)化能力,相較于友商同量級(jí)產(chǎn)品具備顯著優(yōu)勢(shì),有力支持了“好伴 AI”個(gè)人健康管理應(yīng)用 C 端的高并發(fā)訪問(wèn)需求。

同時(shí),智診科技采用了高性能并行文件存儲(chǔ) CFS Turbo,將醫(yī)療訓(xùn)練樣本、訓(xùn)練檢查點(diǎn)和最終模型文件保存在統(tǒng)一存儲(chǔ)中,貫穿樣本準(zhǔn)備、模型訓(xùn)練、模型推理的全流程,提高了 GPU 利用率。

騰訊云與智診科技合作,提供了一整套 Agent 原生的基礎(chǔ)設(shè)施,讓智診科技能聚焦于醫(yī)學(xué) AI 算法研發(fā)和業(yè)務(wù)價(jià)值本身。

AI 掀起的浪潮,正在將中國(guó)云市場(chǎng)推入一個(gè)以“智算”為關(guān)鍵詞的新周期。

歷經(jīng)市場(chǎng)教育的中國(guó)企業(yè),需求已變得更加審慎與務(wù)實(shí)——不再只滿足于技術(shù)的可用,還要求云與 AI 的深度協(xié)同能直接轉(zhuǎn)化為可衡量的業(yè)務(wù)價(jià)值。

騰訊云推出的“云智算”,正是對(duì)這一趨勢(shì)的回應(yīng)。通過(guò)整合高性能計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)、安全等全棧能力,騰訊云構(gòu)建了兼具極致性能與業(yè)務(wù)彈性、既能開(kāi)放融合又能安全可控的基礎(chǔ)設(shè)施,將技術(shù)積淀,轉(zhuǎn)化為客戶的競(jìng)爭(zhēng)優(yōu)勢(shì)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
我的美腿:是我最忠誠(chéng)的史官

我的美腿:是我最忠誠(chéng)的史官

疾跑的小蝸牛
2025-12-26 21:10:07
太膈應(yīng)了!東莞一工廠發(fā)元旦禮品,員工4個(gè)蘋果,主管一箱蘋果

太膈應(yīng)了!東莞一工廠發(fā)元旦禮品,員工4個(gè)蘋果,主管一箱蘋果

火山詩(shī)話
2025-12-26 14:28:02
中止運(yùn)營(yíng),萬(wàn)人外貿(mào)大廠轟然倒下

中止運(yùn)營(yíng),萬(wàn)人外貿(mào)大廠轟然倒下

跨境派Pro
2025-12-26 14:34:54
1-0絕殺!恭喜中國(guó)隊(duì)!王鈺棟破門+熱身賽豪取2連勝,球迷歡呼

1-0絕殺!恭喜中國(guó)隊(duì)!王鈺棟破門+熱身賽豪取2連勝,球迷歡呼

籃球看比賽
2025-12-26 10:48:11
5架美制無(wú)人機(jī)圍堵釣魚島,日本賭中方不敢擊落?反制手段早備好

5架美制無(wú)人機(jī)圍堵釣魚島,日本賭中方不敢擊落?反制手段早備好

策前論
2025-12-26 16:02:44
不到48小時(shí),高市大反轉(zhuǎn),支持率飆升至92.4%,日本發(fā)生了什么?

不到48小時(shí),高市大反轉(zhuǎn),支持率飆升至92.4%,日本發(fā)生了什么?

鐵錘簡(jiǎn)科
2025-12-26 19:23:46
媒體人:蘇超一些球隊(duì)給球員開(kāi)出的薪水已遠(yuǎn)超中甲平均水平

媒體人:蘇超一些球隊(duì)給球員開(kāi)出的薪水已遠(yuǎn)超中甲平均水平

懂球帝
2025-12-26 18:29:46
《飛馳人生3》定檔明年春節(jié),陣容很強(qiáng)大,沈騰將成首位400億演員

《飛馳人生3》定檔明年春節(jié),陣容很強(qiáng)大,沈騰將成首位400億演員

影視高原說(shuō)
2025-12-26 12:48:33
故事:聶磊稱霸青島十幾年,最后因惹上一個(gè)女人,踢到鐵板就此滅亡

故事:聶磊稱霸青島十幾年,最后因惹上一個(gè)女人,踢到鐵板就此滅亡

紅豆講堂
2024-12-17 10:54:23
殲-36:當(dāng)我消失在雷達(dá)里,世界才開(kāi)始害怕,5.2馬赫的沉默

殲-36:當(dāng)我消失在雷達(dá)里,世界才開(kāi)始害怕,5.2馬赫的沉默

正直小墨
2025-12-26 21:51:07
孟魯司特困局:被神化的止咳藥與全年齡段的副作用

孟魯司特困局:被神化的止咳藥與全年齡段的副作用

北京商報(bào)
2025-12-25 20:53:51
暴漲17℃!馬上抵達(dá)浙江,大反轉(zhuǎn)......

暴漲17℃!馬上抵達(dá)浙江,大反轉(zhuǎn)......

浙江之聲
2025-12-27 08:32:30
“ 西北頂級(jí)建工 ” 爆雷,將影響多少人的飯碗和房子

“ 西北頂級(jí)建工 ” 爆雷,將影響多少人的飯碗和房子

寶雞新樓市
2025-12-25 20:21:01
滬深交易所發(fā)布:降費(fèi)!

滬深交易所發(fā)布:降費(fèi)!

數(shù)據(jù)寶
2025-12-27 07:35:44
俄官方民調(diào):普京信任度破80%

俄官方民調(diào):普京信任度破80%

桂系007
2025-12-26 16:10:41
影后辛芷蕾,這張照片攝影師得加雞腿,抓拍的太到位了

影后辛芷蕾,這張照片攝影師得加雞腿,抓拍的太到位了

徐幫陽(yáng)
2025-12-23 18:33:38
外交部回應(yīng)日本領(lǐng)導(dǎo)人或參拜靖國(guó)神社:日方不要錯(cuò)上加錯(cuò)

外交部回應(yīng)日本領(lǐng)導(dǎo)人或參拜靖國(guó)神社:日方不要錯(cuò)上加錯(cuò)

環(huán)球網(wǎng)資訊
2025-12-26 15:30:50
宣布交易!楊瀚森,狂喜!

宣布交易!楊瀚森,狂喜!

李帕在北漂
2025-12-26 14:32:35
1958年,2億只麻雀一夜之間沒(méi)了,大家都以為保住了糧食,結(jié)果第二年那報(bào)應(yīng)來(lái)得太猛,還得厚著臉皮找蘇聯(lián)救急

1958年,2億只麻雀一夜之間沒(méi)了,大家都以為保住了糧食,結(jié)果第二年那報(bào)應(yīng)來(lái)得太猛,還得厚著臉皮找蘇聯(lián)救急

歷史回憶室
2025-12-26 11:11:27
曝泰軍端掉了柬埔寨“人體器官”交易點(diǎn),無(wú)數(shù)中國(guó)人拍手叫好

曝泰軍端掉了柬埔寨“人體器官”交易點(diǎn),無(wú)數(shù)中國(guó)人拍手叫好

胡嚴(yán)亂語(yǔ)
2025-12-22 10:00:02
2025-12-27 09:31:00
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術(shù)社區(qū)媒體
11874文章數(shù) 51658關(guān)注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

美媒自問(wèn)自答 稱特朗普的"黃金艦隊(duì)"難匹敵中國(guó)海軍

頭條要聞

美媒自問(wèn)自答 稱特朗普的"黃金艦隊(duì)"難匹敵中國(guó)海軍

體育要聞

開(kāi)翻航母之后,他決定親手造一艘航母

娛樂(lè)要聞

王傳君生病后近照變化大,面部浮腫

財(cái)經(jīng)要聞

投資巨鱷羅杰斯最新持倉(cāng):只留四種資產(chǎn)

汽車要聞

兩大CEO試駕 華為乾崑*啟境開(kāi)啟首款獵裝轎跑路測(cè)

態(tài)度原創(chuàng)

教育
親子
本地
時(shí)尚
公開(kāi)課

教育要聞

衡水中學(xué)神話破滅

親子要聞

彤彤今天開(kāi)心了!

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬(wàn)年史書

推廣中獎(jiǎng)名單-更新至2025年12月15日推廣

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版