国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話 GoodVision AI:用全新的調(diào)度方式解決AI算力的短缺

0
分享至

喂不飽的“龍蝦”:Token爆炸時代的算力困局

被黃仁勛盛贊為“有史以來最重要的軟件發(fā)布”——Open Claw(龍蝦)短短 60 天內(nèi)在Github上斬獲了超過24 萬的星標(biāo)數(shù),其增長速度已經(jīng)“碾壓”了擁有十幾年歷史的 Linux。

它所代表的,是一種能夠精準(zhǔn)理解目標(biāo)、具備長期記憶、調(diào)用工具并持續(xù)執(zhí)行任務(wù)的AI助手,這讓人很難不心動。

但等到你真正開始使用這些自主Agent 時,很快就會發(fā)現(xiàn)一個問題:AI Agent的一次復(fù)雜任務(wù)就需要調(diào)用模型上百次,Token消耗會是普通對話的數(shù)百倍!有開發(fā)者在社區(qū)分享過自己的使用體驗:每個月在Agent任務(wù)上花費的Token費用達到上千美元。甚至有土豪玩家一天消耗的Token就有10個億!

今年的GTC 2026上,黃仁勛直言:AI基礎(chǔ)設(shè)施的本質(zhì),正在從“數(shù)據(jù)中心”轉(zhuǎn)向“Token工廠”,推理計算需求會在未來短短兩年內(nèi)增長近百萬倍。

巨頭們早就注意到了未來的走勢,微軟、亞馬遜、谷歌和 Meta 四家科技巨頭在 2026 年的資本支出計劃超過 2,800 億美元。 并搶空了到2027年的配電額度。但是,僅僅是對算力能級上“大力出奇跡”,真的能夠解決用戶在使用場景中遇到的痛點嗎?

GoodVision AI給出了不一樣的解法:算力智能調(diào)度 + 邊緣算力部署。

算力擠兌,“大算力”是最優(yōu)解嗎?

GoodVision AI 的CEO David 在云計算領(lǐng)域深耕多年,積累了跨越多家全球頭部云廠商的豐富經(jīng)驗。他曾任 IBM 合伙人、AWS 高級管理層成員,同時也是阿里云創(chuàng)始團隊成員之一,并擔(dān)任騰訊云北美負責(zé)人。在 AWS 早期發(fā)展階段,他深度參與區(qū)域業(yè)務(wù)建設(shè),推動其從零起步擴展至數(shù)億美元規(guī)模。

頻繁與云計算行業(yè)打交道的他早早地就意識到:應(yīng)用需求的增長速度往往遠遠快于算力基礎(chǔ)設(shè)施的建設(shè)速度。正是這種結(jié)構(gòu)性的供需錯配,讓他看到了新的機會,也成為他在 2019 年創(chuàng)立 GoodVision AI 的重要動機之一。

隨著大模型和AI應(yīng)用的快速普及,他的觀點不斷地得到了驗證。公司內(nèi)部數(shù)據(jù)顯示,在過去幾年AI需求快速增長的背景下,GoodVision AI 的AI業(yè)務(wù)收入也進入快速增長階段:2025年公司AI相關(guān)業(yè)務(wù)營收已達到近千萬美元,并保持超過100%的年增長率。隨著AI Factory和算力基礎(chǔ)設(shè)施逐步落地,預(yù)計2027年公司整體AI業(yè)務(wù)收入預(yù)計達到數(shù)億美元的規(guī)模,進入新的增長階段。

過去幾年,當(dāng)OpenAI把大模型真正帶到臺前來時,行業(yè)討論 AI 時幾乎所有問題都圍繞“訓(xùn)練算力”展開。但在那時David認為,真正的變化正在發(fā)生在推理側(cè)——模型只需要訓(xùn)練一次,但推理會發(fā)生數(shù)十億次。當(dāng) AI Agent 和各類應(yīng)用被數(shù)百萬用戶同時調(diào)用時,推理需求就會分布在全球不同地區(qū)、設(shè)備與網(wǎng)絡(luò)環(huán)境中。

而現(xiàn)有的云計算體系并不是為這種需求結(jié)構(gòu)設(shè)計的。那么當(dāng)算力需求爆發(fā),AI 推理需求暴增而算力供給跟不上時,就會出現(xiàn)延遲變高、成本飆升,甚至“已讀亂回”的問題。

所以David認為AI算力體系也應(yīng)該逐漸走向類似的結(jié)構(gòu)。大型云端模型適合處理復(fù)雜、高價值的任務(wù);而大量簡單、實時、頻繁的推理需求,則更適合在本地或邊緣側(cè)完成。通過智能調(diào)度系統(tǒng),讓不同復(fù)雜度的任務(wù)被分配到最合適的算力資源上,才能避免所有請求都涌向遠端巨型數(shù)據(jù)中心,從而導(dǎo)致算力擁堵和成本失控。

解決AI算力供需的關(guān)鍵在于分發(fā)

如果把今天的AI算力產(chǎn)業(yè)簡單劃分,大致可以看到幾種不同的模式:

首先就是微軟,亞馬遜,谷歌幾大巨頭。他們也被稱為“Hyperscalers”(超大規(guī)模云服務(wù)商,他們的主要業(yè)務(wù)主要是IAAS(Infrastructure as an Service 基礎(chǔ)設(shè)施即服務(wù))面向通用需求,

一類則以CoreWeave 和Lambda為代表的GPU云基礎(chǔ)設(shè)施公司。這類公司主要為AI訓(xùn)練和推理提供算力資源,本質(zhì)上類似新一代的GPU云服務(wù)。

另一類則是像FireworksAI和OpenRouter這樣的模型服務(wù)平臺。它們?yōu)殚_發(fā)者提供統(tǒng)一接口,讓用戶可以在不同大模型之間切換和調(diào)用。

傳統(tǒng)大型云廠商過于依賴中心化數(shù)據(jù)中心;雖然算力資源池大,但遇到需要遠端需求和計算資源調(diào)度的情景下可能低效。后兩類公司的出現(xiàn)則是為了填補前者夠不到的市場空白,即算力供給大模型路由

但他們也有各自的弱點:API 路由平臺缺乏算力控制權(quán),GPU 租賃平臺缺乏調(diào)度能力。而伴隨AI Agent應(yīng)用的興起,行業(yè)開始出現(xiàn)新的需求。Agent任務(wù)通常包含多個步驟,需要調(diào)用不同模型、執(zhí)行不同類型的計算,并且對響應(yīng)速度和成本都有要求。如果所有推理任務(wù)都集中在遠程云數(shù)據(jù)中心,延遲和成本都會迅速增加。

解決此類問題的核心關(guān)鍵不僅僅只是配置“更大更多的算力”,更需要智能的算力分發(fā)網(wǎng)絡(luò)進行算力的智能調(diào)度;而這也正是GoodVision AI正在做的事情。

算力分發(fā)網(wǎng)絡(luò):Good Vision AI 的“AI CDN”路徑

在互聯(lián)網(wǎng)早期,網(wǎng)站訪問主要集中在少數(shù)服務(wù)器上。隨著用戶規(guī)模擴大,CDN網(wǎng)絡(luò)逐漸出現(xiàn),將內(nèi)容緩存到全球各地的節(jié)點,讓數(shù)據(jù)更接近用戶。在AI時代,類似的結(jié)構(gòu)也可能出現(xiàn)。當(dāng)AI Agent開始大規(guī)模運行時,算力需求將分布在全球不同節(jié)點。推理任務(wù)需要在不同云環(huán)境、不同數(shù)據(jù)中心甚至邊緣設(shè)備之間進行調(diào)度。

如果說算力供需失衡是 AI 時代正在出現(xiàn)的核心矛盾,那么解決這一問題的關(guān)鍵就不只是“生產(chǎn)更多算力”,而是重新思考算力如何被分發(fā)。黃仁勛在GTC 2026中也提到,未來AI系統(tǒng)的核心指標(biāo)不再是算力規(guī)模,而是單位功耗下的Token產(chǎn)出、吞吐效率與響應(yīng)速度,這也重新定義了“Token工廠”的競爭力。Good Vision AI 正是基于這一思路構(gòu)建自身的技術(shù)體系。

在Good Vision AI內(nèi)部,這套架構(gòu)被稱為 AI Factory:它不僅包括 GPU 算力資源本身,還包括一整套全球的推理算力節(jié)點網(wǎng)絡(luò)和智能調(diào)度系統(tǒng),用于在不同環(huán)境之間分配 AI 計算任務(wù)。

在這一架構(gòu)中,Good Vision AI自研了一款A(yù)I Agent進行智慧大腦層級的調(diào)度,并提供現(xiàn)有模式的AI Token聚合器能力,利用自有的物理算力與可部署的私有化模型庫,提升算力資源利用。其中一個關(guān)鍵技術(shù)即Token 級算力調(diào)度。與傳統(tǒng)以“模型”為單位的調(diào)用方式不同,Token 級調(diào)度可以根據(jù)任務(wù)復(fù)雜度、成本要求和延遲需求,在不同模型和算力資源之間進行更細粒度的動態(tài)分配。它能夠在 AWS、GCP 等公有云以及私有機房之間進行動態(tài)調(diào)度,根據(jù)任務(wù)需求自動選擇最合適的算力節(jié)點。同時Good Vision AI具備可控的AI算力資源,在確保在Token供給的穩(wěn)定同時,能夠爭取到市場銷售的定價權(quán)和最大化利潤。

與此同時,GVAI 也在推進邊緣算力節(jié)點的部署。當(dāng) AI Agent 開始進入更多終端設(shè)備與現(xiàn)實場景時,一部分推理任務(wù)并不適合始終依賴遠端云端完成,將算力節(jié)點部署在更靠近用戶的位置,可以顯著降低延遲并提升響應(yīng)速度。這種CDN 網(wǎng)絡(luò)相似的架構(gòu)邏輯解決了調(diào)度系統(tǒng)能夠直接把算力“送到”發(fā)起AI推理意圖的用戶身邊

自有AI算力擴張的速度優(yōu)勢

在 AI 算力競爭日益激烈的背景下,“誰能更快接入電力和算力基礎(chǔ)設(shè)施”,正在成為決定勝負的關(guān)鍵。Good Vision AI和其他同類型產(chǎn)品最大的不同,即團隊在早期便積累了大量的能源基礎(chǔ)設(shè)施資源

自2025年起,GoodVision AI 已經(jīng)開始從亞洲為起點,乃至全球,布局自己的推理算力基礎(chǔ)設(shè)施。其中,日本、韓國與美國被視為最重要的區(qū)域節(jié)點之一。公司在這些地區(qū)已經(jīng)儲備超過400MW 的電力資源,并計劃逐步部署規(guī)模化的AI推理算力中心。按照規(guī)劃,未來整體算力網(wǎng)絡(luò)將具備40萬張推理GPU卡的部署能力,對應(yīng)推理算力資產(chǎn)規(guī)模可達到數(shù)十億美元級別。這些算力節(jié)點將與公司的智能調(diào)度系統(tǒng)共同構(gòu)成一個分布式算力網(wǎng)絡(luò)。

未來愿景:當(dāng)每座城市都有自己的 AI Factory

毫無疑問,隨著 AI Agent 逐漸進入日常工作流,算力需求將迎來爆發(fā)式增長。這些需求本質(zhì)上來自持續(xù)不斷的推理任務(wù)——它們分布在企業(yè)系統(tǒng)、個人設(shè)備乃至城市基礎(chǔ)設(shè)施中,對實時性與穩(wěn)定性提出更高要求。

與之對應(yīng)的,則是AI基礎(chǔ)設(shè)施也會逐漸演化為由全球算力節(jié)點構(gòu)成的網(wǎng)絡(luò),使計算資源能夠像互聯(lián)網(wǎng)數(shù)據(jù)一樣被動態(tài)調(diào)度。這正是 GoodVision AI 提出的 AI Factory 構(gòu)想:為本地與區(qū)域AI應(yīng)用提供推理能力。每一個 AI Factory 都可以理解為一個小型AI生產(chǎn)中心,既服務(wù)本地企業(yè)與開發(fā)者,也接入全球算力網(wǎng)絡(luò)進行協(xié)同調(diào)度。

與傳統(tǒng)大型數(shù)據(jù)中心不同,這些 AI Factory 更接近用戶側(cè),可在城市級節(jié)點完成大量實時推理任務(wù),從而顯著降低延遲并提升算力利用效率。在已落地案例中,客戶遷移至 GoodVision AI Factory 后,整體成本降低約60%,延遲降低約50%,平臺毛利率提升約50%。

目前,Good Vision AI已經(jīng)開始與視頻生成、生物醫(yī)藥等高算力消耗領(lǐng)域的相關(guān)企業(yè)展開合作。對這些行業(yè)而言,真正的問題不在于模型能力,而是持續(xù)增長的推理需求、Token 消耗與算力供給之間的匹配效率。例如視頻生成中海量的圖像與視頻推理請求;和AI制藥體系中,從分子結(jié)構(gòu)生成、蛋白質(zhì)折疊預(yù)測,到藥物篩選、臨床試驗?zāi)M;每一個環(huán)節(jié)都依賴大規(guī)模計算,其背后都需要穩(wěn)定、低延遲且可持續(xù)擴展的推理算力支持。隨著這些高精尖行業(yè),尤其是生物醫(yī)藥對 AI 的依賴不斷加深,它們也會持續(xù)成為 Good Vision AI 算力網(wǎng)絡(luò)的重要客戶與增長來源。

當(dāng)越來越多城市擁有自己的 AI Factory,算力將不再只是少數(shù)科技公司的資源,而會逐漸成為類似電力與網(wǎng)絡(luò)的基礎(chǔ)設(shè)施。個人開發(fā)者乃至普通用戶,也能按需調(diào)用Agent完成創(chuàng)作、開發(fā)與自動化任務(wù)。AI的真正普及,將建立在這樣一張分布式算力網(wǎng)絡(luò)之上。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
騰訊發(fā)布了 7 個座艙智能體,汽車的意義從「空間位移」走向了「時間價值」

騰訊發(fā)布了 7 個座艙智能體,汽車的意義從「空間位移」走向了「時間價值」

愛范兒
2026-04-24 17:22:23
中際旭創(chuàng)市值突破1萬億,山東誕生新首富

中際旭創(chuàng)市值突破1萬億,山東誕生新首富

中國能源網(wǎng)
2026-04-24 17:42:04
廣東91-93不敵福建 球員評價:4人優(yōu)秀,8人低迷

廣東91-93不敵福建 球員評價:4人優(yōu)秀,8人低迷

籃球資訊達人
2026-04-24 21:36:08
中央紀委國家監(jiān)委公開通報八起違反中央八項規(guī)定精神典型問題

中央紀委國家監(jiān)委公開通報八起違反中央八項規(guī)定精神典型問題

新華社
2026-04-24 17:05:33
亞冠官宣擴軍至32隊!中超獲2席+國安海港出戰(zhàn) 沙特日本或5隊參賽

亞冠官宣擴軍至32隊!中超獲2席+國安海港出戰(zhàn) 沙特日本或5隊參賽

我愛英超
2026-04-24 22:28:23
被原村支書駕鏟車推土掩埋村民仍在醫(yī)院輸液,辟謠“警察圍觀” 說法,警察到場后立即制止

被原村支書駕鏟車推土掩埋村民仍在醫(yī)院輸液,辟謠“警察圍觀” 說法,警察到場后立即制止

紅星新聞
2026-04-24 20:05:42
“霍爾木茲決戰(zhàn)”,收兵了?

“霍爾木茲決戰(zhàn)”,收兵了?

中國新聞周刊
2026-04-24 16:35:57
什么是美?這群北體青年給出了最“不設(shè)限”的答案

什么是美?這群北體青年給出了最“不設(shè)限”的答案

網(wǎng)易新聞出品
2026-04-24 15:59:19
中子星有多可怕?每立方厘米重10億噸,最高山峰只有1毫米

中子星有多可怕?每立方厘米重10億噸,最高山峰只有1毫米

觀察宇宙
2026-04-24 18:35:19
100個能救命的冷知識!關(guān)鍵時刻能保命,建議收藏

100個能救命的冷知識!關(guān)鍵時刻能保命,建議收藏

詩詞天地
2026-04-22 14:06:22
出乎意料!2032奧運主辦地確定了,不知名小城市以72:5碾壓當(dāng)選

出乎意料!2032奧運主辦地確定了,不知名小城市以72:5碾壓當(dāng)選

安珈使者啊
2026-04-24 11:44:45
58歲江珊露面,150斤穿西裝腚大腰圓,但臉顯年輕幾乎沒皺紋

58歲江珊露面,150斤穿西裝腚大腰圓,但臉顯年輕幾乎沒皺紋

墨印齋
2026-04-24 16:43:38
太狂了!蘇州商場廣告牌“首先GDP第一,其次比賽第一”走紅網(wǎng)絡(luò)

太狂了!蘇州商場廣告牌“首先GDP第一,其次比賽第一”走紅網(wǎng)絡(luò)

火山詩話
2026-04-24 08:48:26
芯片松綁4個月,中國一塊也沒買,中國不急美國急,形勢反轉(zhuǎn)了

芯片松綁4個月,中國一塊也沒買,中國不急美國急,形勢反轉(zhuǎn)了

王新喜
2026-04-23 20:37:56
刷屏!DeepSeek V4成本暴降73%,梁文鋒聯(lián)手華為寒武紀,源神歸位全體起立

刷屏!DeepSeek V4成本暴降73%,梁文鋒聯(lián)手華為寒武紀,源神歸位全體起立

智東西
2026-04-24 13:08:45
別把寄生于系統(tǒng)的繁榮當(dāng)財富!亞馬遜雨林減少80萬平方公里,只因一個錯誤決策

別把寄生于系統(tǒng)的繁榮當(dāng)財富!亞馬遜雨林減少80萬平方公里,只因一個錯誤決策

三言四拍
2026-04-24 08:22:31
被3個孩子輪流養(yǎng)老后才發(fā)現(xiàn):人老了,房子和存款有多么重要

被3個孩子輪流養(yǎng)老后才發(fā)現(xiàn):人老了,房子和存款有多么重要

惟來
2026-04-23 18:18:12
上海豪取23連勝+主場全勝 姚明之后最強一季誕生

上海豪取23連勝+主場全勝 姚明之后最強一季誕生

體壇周報
2026-04-24 21:52:18
123國同時發(fā)出逮捕令,中國為何選擇此刻在安理會“算總賬”?

123國同時發(fā)出逮捕令,中國為何選擇此刻在安理會“算總賬”?

王姐懶人家常菜
2026-04-24 18:46:27
大反轉(zhuǎn):掌摑女家長的男保安,真實身份曝光!

大反轉(zhuǎn):掌摑女家長的男保安,真實身份曝光!

仕道
2026-04-24 08:12:39
2026-04-24 23:27:00
36k
36k
講解時尚穿搭,感受生活的美
4171文章數(shù) 1621關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

賴清德面臨彈劾投票 島內(nèi)網(wǎng)友:不記名投票一定過

頭條要聞

賴清德面臨彈劾投票 島內(nèi)網(wǎng)友:不記名投票一定過

體育要聞

上海男籃23連勝+主場全勝 姚明之后最強一季

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經(jīng)要聞

LG財閥內(nèi)斗:百億美元商業(yè)帝國爭奪戰(zhàn)

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態(tài)度原創(chuàng)

本地
時尚
數(shù)碼
藝術(shù)
旅游

本地新聞

云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

春天穿衣千萬別老氣橫秋!短長搭配、多穿裙子,優(yōu)雅舒適顯高

數(shù)碼要聞

RGB-Mini LED電視普及風(fēng)暴,海信正式發(fā)布小墨E5S Pro

藝術(shù)要聞

2025最繪畫--第四屆中國青年油畫作品展 | 油畫選刊(三)

旅游要聞

蓉城花正好 “我心中的成都最美賞花地”指南發(fā)布

無障礙瀏覽 進入關(guān)懷版