国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Kimi、Minimax 們的算力荒:智能白菜價,你買不到

0
分享至

云廠商二十年"只降不升"鐵律被打破,AI算力集體漲價;Kimi、MiniMax輕資產(chǎn)模式承壓,上游火山引擎、阿里云傳導(dǎo)成本,下游用戶承受漲價與限流。"白菜價智能"的窗口期,可能比所有人想象的都短。

———— / BEGIN / ————

本地蝦風(fēng)險還是有點大,各家也上線了各種云端蝦。

Kimi出了K2.5,我第一時間開了Allegretto 套餐,199元/月的套餐,布局 KimiClaw 的最低配套餐,想試試Agent集群到底有多能打。MiniMax的Coding Plan也試了。

結(jié)果呢?Kimi隔三差五跳出“高峰時段算力不足”的提示,Agent任務(wù)跑到一半斷掉是家常便飯。MiniMax那邊更離譜,龍蝦部署上去,聊兩句就掉線,API動不動返回限速警告。

199塊買了一張算力排隊票。

翻了翻用戶群,吐槽聲不絕于耳,一個MiniMax用戶@客服:“今天已經(jīng)連續(xù)掉線了,聊2句就掉了?!笨头貜?fù):建議您檢查本地網(wǎng)絡(luò)。另一個人貼出終端截圖,MiniMax API返回rate_limit_error,配圖是一張“賽博牛馬”的表情包:大哥,我就一個蝦,隔了5分鐘發(fā)了條消息,給我限速了。


小紅書上也是,基本都是勸下車的。

簡單來說就是,你花了錢,但算力不一定是你的。什么時候能用上,看運(yùn)氣,因為高峰時期限速太嚴(yán)重了。

那邊的 Claude是動不動就限額,咱們這邊是動不動就限速。還是能工智人好,run 一天只需要倆饅頭。


不過算力緊缺這事兒早就不新鮮了,2月10日,Kimi因算力告急宕機(jī),官方回應(yīng)堪稱行為藝術(shù):“嗯,正在找算力。要不先用DeepSeek?!?/p>

一家融了超20億美元、手握100億現(xiàn)金的公司,在自家產(chǎn)品最火的時候讓用戶去用競品。

DeepSeek自己也沒好到哪去——2月28日、3月5日接連大規(guī)模宕機(jī),服務(wù)器繁忙。

2026年春天,國產(chǎn)AI集體進(jìn)入了“用不了”時代。

算力基建,提前兌現(xiàn)

直覺上,“算力荒”好像是禁令的鍋。這個有道理,但不精確。

禁令是背景板,DeepSeek和Qwen這些模型本身就在資源約束下設(shè)計,MoE架構(gòu)天然省算力。Kimi總裁張予彤之前在達(dá)沃斯說得很直白:僅用美國頂尖實驗室1%的資源,做出了全球領(lǐng)先的開源模型。

真正擊穿基礎(chǔ)設(shè)施的,是Agent。

Chatbot是一問一答,算力消耗線性可預(yù)測。Agent完全不同——一個任務(wù)背后可能觸發(fā)幾十上百次模型調(diào)用:規(guī)劃、拆解、執(zhí)行、反思、糾錯,每一步都過模型。長上下文持續(xù)占顯存,工具調(diào)用讓GPU空轉(zhuǎn)。

Chatbot時代GPU就好像餐廳服務(wù)員,一桌客人上完菜就去下一桌。Agent時代,服務(wù)員全程陪同,從點菜到結(jié)賬,思考菜單的時候也不能走。同樣數(shù)量的服務(wù)員,能服務(wù)的桌數(shù)斷崖式下降。

粗略計算的話,Chatbot單輪對話消耗約1,000到3,000個token。Agent做一個完整任務(wù)——比如用龍蝦跑一次深度研究——要經(jīng)歷感知、規(guī)劃、執(zhí)行、反思等多個循環(huán),中等復(fù)雜度輕松吃掉10萬token,復(fù)雜任務(wù)到百萬級。

有開發(fā)者報告單次OpenClaw運(yùn)行燒掉了800萬token。再疊加K2.5 Thinking這類推理鏈模型,思考過程本身的隱藏token能把成本再放大10到30倍。保守估計,從chatbot到Agent,單次任務(wù)算力消耗放大30到100倍,極端場景1,000倍以上。

Deloitte的研究點出了一個宏觀悖論:過去兩年token單價降了280倍,但企業(yè)AI賬單反而飆升——推理成本降了1,000倍,需求增長了10,000倍。

問題是,Kimi和MiniMax自己并不擁有GPU。

從財報上看,MiniMax固定資產(chǎn)開支都極低,Kimi 雖然還沒上市但情況也類似,算力幾乎全部來自第三方云服務(wù)——輕資產(chǎn)模式,跟OpenAI自建數(shù)據(jù)中心完全不同。

Kimi背后是火山引擎和阿里云雙軌供應(yīng):火山引擎從2023年起獨(dú)家提供訓(xùn)練和推理方案,后來阿里投了月之暗面8億美元,其中一部分直接以阿里云算力結(jié)算,楊植麟公開給阿里云“代言”。

MiniMax更復(fù)雜,阿里云、騰訊云、火山引擎都是它的供應(yīng)商,早期招標(biāo)會上三家殺到2折競價。


誰也沒想到,隨著龍蝦到來,token 需求的爆發(fā)來得如此之快。

Agent來了之后,價格戰(zhàn)的邏輯跑不通了?!耙院蟆弊兂闪恕艾F(xiàn)在”:未來緩慢補(bǔ)充基建的時間瞬間消失。

用戶在罵Kimi卡的時候,Kimi可能也在罵火山引擎和阿里云卡。算力荒是從芯片到云服務(wù)到模型公司到用戶的四層傳導(dǎo),Kimi和MiniMax站在最下游,承受每一層壓力的疊加。

上游扛得住嗎?

信號已經(jīng)出現(xiàn)了。

今年3月,國內(nèi)云廠商開始集體調(diào)價——AI算力和存儲產(chǎn)品價格上漲,漲幅從個位數(shù)到30%以上不等。優(yōu)刻得直接開啟全系漲價。

海外也不例外,AWS和谷歌云在部分產(chǎn)品上試水調(diào)價。SK海力士公開表示2026年存儲芯片持續(xù)漲價已成定局,DRAM庫存僅剩約4周。

持續(xù)二十年的“云服務(wù)只降不升”鐵律,被AI需求擊穿了。

漲價的邏輯不復(fù)雜。

云廠商們過去一年瘋狂擴(kuò)建AI算力基礎(chǔ)設(shè)施,資本開支動輒數(shù)百億量級,但AI業(yè)務(wù)本身的利潤率還很薄,遠(yuǎn)不夠覆蓋基建投入。

Token調(diào)用量在指數(shù)級增長——2026年2月國內(nèi)主流大模型日均消耗合計約180萬億——但賣Token的收入增速追不上建數(shù)據(jù)中心的花錢速度。漲價,不是云廠商貪心,是供應(yīng)鏈漲價的無奈之舉。

更棘手的是設(shè)備折舊。

AWS、Google Cloud、Azure三家在2023-2024年統(tǒng)一把服務(wù)器折舊年限從3-4年延長到了6年,集體節(jié)省了約180億美元的年度折舊開支。

但NVIDIA的芯片迭代周期只有18-24個月——你今天花幾千億建的數(shù)據(jù)中心,里面的GPU可能兩年后就不是最優(yōu)選擇了,折舊卻要攤6年。

Satya Nadella自己都說:“我不想在一代芯片上背四五年的折舊?!?/p>

看一眼算力市場的格局。

火山引擎憑借豆包以日均63萬億Token領(lǐng)跑,拿下公有云大模型調(diào)用量49.2%的份額,幾乎一家占了半壁江山。

阿里云日均32萬億排第二,騰訊元寶28萬億、DeepSeek 22萬億緊隨其后。

但調(diào)用量第一和營收第一不是同一家——按Omdia統(tǒng)計,阿里云以35.8%營收份額穩(wěn)居AI云市場第一,超過第二到第四名總和。

火山贏在“輕”,阿里贏在“重”。

Kimi和MiniMax的算力命脈就握在這兩家手里。

MiniMax上市后資本市場對Token增長狂熱追捧——M2.5發(fā)布首周調(diào)用量暴漲至3.07萬億Token——但每一個Token背后都是真實的推理成本。

MiniMax 2025年全年營收不足8000萬美元,經(jīng)調(diào)整凈虧損2.5億,毛利率剛爬到25%。上游一漲價,這個剛轉(zhuǎn)正的毛利隨時可能被吃掉。

這些問題反映到C端,只有一個結(jié)果:繼續(xù)承受漲價或限流。

Kimi配置最低的Allegretto套餐已經(jīng)199元/月,幾乎和包含Co-work以及Claude Code的Claude Pro同價了。如果繼續(xù)漲價,我們所說的“白菜價”智能,就真的不存在了。

截至文章發(fā)布前,老虎證券剛剛發(fā)布消息,月之暗面已經(jīng)開始考慮赴港上市。

那Kimi就需要正面回答這個問題了:是繼續(xù)租算力還是自己買設(shè)備,是保利潤率還是保用戶。

MiniMax已經(jīng)站在聚光燈下,每一季財報都是照妖鏡。Kimi 本來手握 100 億的賬上資金,至少短期不用受到資本市場的審視,但剛好今天,就傳出了 Kimi 赴港上市的傳聞。


如果傳聞是真的,那么 Kimi和 MiniMax 們真的需要考慮一個問題,到底是保用戶還是保利潤率。

隨著漲價鏈條的傳遞,大模型們被“兩頭堵”的可能性,已經(jīng)驟然提升。

2026年,Agent改變了算力的需求曲線。便宜的智能沒變貴,使用智能的方式變了,資源出現(xiàn)了擠兌。

漲價什么時候會停?

短期內(nèi)恐怕看不到。

Agent的需求曲線還在陡峭的上升期——Kimi K2.5剛上線不到一個月,收入就超過了2025年全年;MiniMax M2.5發(fā)布首周Token消耗量超過三家競品之和。

多Agent并行、長上下文推理、編程場景的爆發(fā)才剛剛開始,每一個新場景打開都意味著Token消耗量再上一個臺階。

而供給側(cè)的擴(kuò)容周期是以年為單位的——數(shù)據(jù)中心從規(guī)劃到投產(chǎn)至少18個月,芯片禁令下國產(chǎn)替代的產(chǎn)能爬坡更慢。需求按周增長,供給按年追趕,中間的剪刀差就是漲價和限流的空間。

更深層的變化是,中國的云廠商們可能正在被迫進(jìn)入一個全新的重資產(chǎn)設(shè)備周期。

過去二十年,云計算的敘事是“輕”——彈性伸縮、按需付費(fèi)、用多少買多少。

但Agent時代的算力需求把這個敘事翻了過來。阿里宣布三年投入3800億建AI基礎(chǔ)設(shè)施,字節(jié)在火山引擎上的算力部署同樣激進(jìn)。

這些投入一旦啟動就停不下來——你今天不建,明天的Token就沒地方跑;但建了之后,折舊攤銷會在未來五到十年持續(xù)壓在利潤表上。

這很像二十年前電信運(yùn)營商鋪3G/4G網(wǎng)絡(luò)的周期:需求爆發(fā)倒逼巨額基建,基建倒逼漲價或補(bǔ)貼退坡,最終整個行業(yè)的利潤結(jié)構(gòu)被重塑。

當(dāng)年中國移動、中國聯(lián)通經(jīng)歷的資本開支競賽,今天可能在阿里云、火山引擎身上重演。

區(qū)別在于,電信行業(yè)有牌照壁壘和政策保護(hù),云廠商沒有。

對于站在鏈條最下游的Kimi和MiniMax們來說,這意味著算力成本不會回到價格戰(zhàn)時代的地板價了。

對于用199元套餐跑龍蝦的你和我來說,這意味著“便宜好用的AI”這個窗口期,可能比所有人想象的都要短。

本文來自公眾號:象先志 作者:阿卡

想要第一時間了解行業(yè)動態(tài)、面試技巧、商業(yè)知識等等等?加入產(chǎn)品經(jīng)理進(jìn)化營,跟優(yōu)秀的產(chǎn)品人一起交流成長!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
伊朗果然上當(dāng)!24小時不到,以色列大量回血,70架運(yùn)輸機(jī)抵達(dá)中東

伊朗果然上當(dāng)!24小時不到,以色列大量回血,70架運(yùn)輸機(jī)抵達(dá)中東

軒逸阿II
2026-04-12 03:11:24
同為星二代!對比Jasper,才知道鄭熙岳被養(yǎng)得有多糟,劉蕓被罵慘

同為星二代!對比Jasper,才知道鄭熙岳被養(yǎng)得有多糟,劉蕓被罵慘

陳意小可愛
2026-04-11 15:17:00
紀(jì)實:曾經(jīng)紅極一時的 10 位成功學(xué)大師,如今為何集體涼涼?

紀(jì)實:曾經(jīng)紅極一時的 10 位成功學(xué)大師,如今為何集體涼涼?

復(fù)轉(zhuǎn)這些年
2026-04-04 08:01:50
馬丁雅克一針見血:澳門人嘗過苦日子,但香港人還沒有

馬丁雅克一針見血:澳門人嘗過苦日子,但香港人還沒有

混沌錄
2026-04-11 15:28:05
你永遠(yuǎn)想不到,日本對我國的土地渴望到了什么程度

你永遠(yuǎn)想不到,日本對我國的土地渴望到了什么程度

賤議你讀史
2026-04-10 12:07:08
崔東樹:建議購車支出納入個稅專項抵扣

崔東樹:建議購車支出納入個稅專項抵扣

財聯(lián)社
2026-04-12 10:46:06
出人意料!遭棄用3個月,卻轟全隊最高20分,球迷:早該用他了

出人意料!遭棄用3個月,卻轟全隊最高20分,球迷:早該用他了

南海浪花
2026-04-12 10:21:17
第三次賭局:歐洲在等待俄羅斯的“自毀時刻”

第三次賭局:歐洲在等待俄羅斯的“自毀時刻”

民間胡扯老哥
2026-04-11 05:48:44
微信開啟“方言采集”返紅包活動 有人累計“薅”到幾百元

微信開啟“方言采集”返紅包活動 有人累計“薅”到幾百元

極目新聞
2026-04-11 18:39:53
約30名常駐北約總部的大使級代表將訪問日本,專家:歐洲或試圖與日本進(jìn)行深層次防務(wù)合作,為兵力調(diào)動提前布局

約30名常駐北約總部的大使級代表將訪問日本,專家:歐洲或試圖與日本進(jìn)行深層次防務(wù)合作,為兵力調(diào)動提前布局

極目新聞
2026-04-11 10:35:06
山西49歲局長在辦突發(fā)疾病搶救無效離世,小兒子今年6月參加高考,妻子稱丈夫常加班到凌晨兩三點,出事前還接了幾個工作電話

山西49歲局長在辦突發(fā)疾病搶救無效離世,小兒子今年6月參加高考,妻子稱丈夫常加班到凌晨兩三點,出事前還接了幾個工作電話

極目新聞
2026-04-11 16:04:10
來來來了!收官戰(zhàn)最強(qiáng)分析!掘金湖人智斗巔峰!東部大亂斗!

來來來了!收官戰(zhàn)最強(qiáng)分析!掘金湖人智斗巔峰!東部大亂斗!

貴圈真亂
2026-04-12 10:43:24
狠人劉強(qiáng)東,對網(wǎng)約車下手了

狠人劉強(qiáng)東,對網(wǎng)約車下手了

新浪財經(jīng)
2026-04-12 01:43:16
朝鮮戰(zhàn)爭期間:美軍原來已接近擊敗中國,卻碰上中國決死的指揮官

朝鮮戰(zhàn)爭期間:美軍原來已接近擊敗中國,卻碰上中國決死的指揮官

最美的巧合
2026-04-12 10:36:36
如果當(dāng)初中國不改革開放,今天仍是全球最落后的國家之一嗎?

如果當(dāng)初中國不改革開放,今天仍是全球最落后的國家之一嗎?

掠影后有感
2026-04-10 09:58:45
我們不應(yīng)忘記,他才是帶領(lǐng)中華民族進(jìn)入文明時代的偉人

我們不應(yīng)忘記,他才是帶領(lǐng)中華民族進(jìn)入文明時代的偉人

一天社
2025-10-17 20:02:41
鄭麗文書法爭議:她的字真的不是自己寫的嗎?

鄭麗文書法爭議:她的字真的不是自己寫的嗎?

書畫相約
2026-04-08 08:19:04
“留學(xué)回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

“留學(xué)回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

皓皓情感說
2026-04-10 22:54:59
日媒:44%的訪日中國游客資產(chǎn)額超680萬元

日媒:44%的訪日中國游客資產(chǎn)額超680萬元

隨波蕩漾的漂流瓶
2026-04-11 17:16:26
西班牙反了,法國反了,印度也反了,全世界都看清特朗普最怕啥

西班牙反了,法國反了,印度也反了,全世界都看清特朗普最怕啥

透視到底
2026-04-12 10:20:42
2026-04-12 12:35:00
人人都是產(chǎn)品經(jīng)理社區(qū) incentive-icons
人人都是產(chǎn)品經(jīng)理社區(qū)
想要成為大牛先從學(xué)做產(chǎn)品開始
64622文章數(shù) 311584關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

美國副總統(tǒng)萬斯:美伊談判未能達(dá)成協(xié)議 將返回美國

頭條要聞

美國副總統(tǒng)萬斯:美伊談判未能達(dá)成協(xié)議 將返回美國

體育要聞

換帥之后,他們從降級區(qū)沖到升級區(qū)

娛樂要聞

46歲趙達(dá)官宣結(jié)婚!曾與殷桃談婚論嫁

財經(jīng)要聞

三輪磋商談至深夜 美伊談判三大議題仍待解

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

數(shù)碼
藝術(shù)
家居
健康
教育

數(shù)碼要聞

戴爾推出Pro Micro瘦客戶機(jī)Q9M1260:7瓦功耗,可選1GbE光纖接口

藝術(shù)要聞

2025殊相——中國油畫學(xué)會創(chuàng)作研修作品展 | 油畫選刊(六)

家居要聞

復(fù)古風(fēng)格 自然簡約

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

教育要聞

誰說中考作文必須寫自身經(jīng)歷?

無障礙瀏覽 進(jìn)入關(guān)懷版