国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Kimi、Minimax 們的算力荒:智能白菜價,你買不到

0
分享至

本地蝦風險還是有點大,各家也上線了各種云端蝦。

Kimi出了K2.5,我第一時間開了Allegretto 套餐,199元/月的套餐,布局 KimiClaw 的最低配套餐,想試試Agent集群到底有多能打。MiniMax的Coding Plan也試了。

結果呢?Kimi隔三差五跳出“高峰時段算力不足”的提示,Agent任務跑到一半斷掉是家常便飯。MiniMax那邊更離譜,龍蝦部署上去,聊兩句就掉線,API動不動返回限速警告。

199塊買了一張算力排隊票。

翻了翻用戶群,吐槽聲不絕于耳,一個MiniMax用戶@客服:“今天已經(jīng)連續(xù)掉線了,聊2句就掉了。”客服回復:建議您檢查本地網(wǎng)絡。另一個人貼出終端截圖,MiniMax API返回rate_limit_error,配是一張“賽博牛馬”的表情包:大哥,我就一個蝦,隔了5分鐘發(fā)了條消息,給我限速了。



小紅書上也是,基本都是勸下車的。

簡單來說就是,你花了錢,但算力不一定是你的。什么時候能用上,看運氣,因為高峰時期限速太嚴重了。

那邊的 Claude是動不動就限額,咱們這邊是動不動就限速。還是能工智人好,run 一天只需要倆饅頭。



不過算力緊缺這事兒早就不新鮮了,2月10日,Kimi因算力告急宕機,官方回應堪稱行為藝術:“嗯,正在找算力。要不先用DeepSeek?!币患胰诹顺?0億美元、手握100億現(xiàn)金的公司,在自家產(chǎn)品最火的時候讓用戶去用競品。DeepSeek自己也沒好到哪去——2月28日、3月5日接連大規(guī)模宕機,服務器繁忙。

2026年春天,國產(chǎn)AI集體進入了“用不了”時代。

算力基建,提前兌現(xiàn)

直覺上,“算力荒”好像是禁令的鍋。這個有道理,但不精確。

禁令是背景板,DeepSeek和Qwen這些模型本身就在資源約束下設計,MoE架構天然省算力。Kimi總裁張予彤之前在達沃斯說得很直白:僅用美國頂尖實驗室1%的資源,做出了全球領先的開源模型。

真正擊穿基礎設施的,是Agent。

Chatbot是一問一答,算力消耗線性可預測。Agent完全不同——一個任務背后可能觸發(fā)幾十上百次模型調用:規(guī)劃、拆解、執(zhí)行、反思、糾錯,每一步都過模型。長上下文持續(xù)占顯存,工具調用讓GPU空轉。

Chatbot時代GPU就好像餐廳服務員,一桌客人上完菜就去下一桌。Agent時代,服務員全程陪同,從點菜到結賬,思考菜單的時候也不能走。同樣數(shù)量的服務員,能服務的桌數(shù)斷崖式下降。

粗略計算的話,Chatbot單輪對話消耗約1,000到3,000個token。Agent做一個完整任務——比如用龍蝦跑一次深度研究——要經(jīng)歷感知、規(guī)劃、執(zhí)行、反思等多個循環(huán),中等復雜度輕松吃掉10萬token,復雜任務到百萬級。

有開發(fā)者報告單次OpenClaw運行燒掉了800萬token。再疊加K2.5 Thinking這類推理鏈模型,思考過程本身的隱藏token能把成本再放大10到30倍。保守估計,從chatbot到Agent,單次任務算力消耗放大30到100倍,極端場景1,000倍以上。

Deloitte的研究點出了一個宏觀悖論:過去兩年token單價降了280倍,但企業(yè)AI賬單反而飆升——推理成本降了1,000倍,需求增長了10,000倍。

問題是,Kimi和MiniMax自己并不擁有GPU。

從財報上看,MiniMax固定資產(chǎn)開支都極低,Kimi 雖然還沒上市但情況也類似,算力幾乎全部來自第三方云服務——輕資產(chǎn)模式,跟OpenAI自建數(shù)據(jù)中心完全不同。Kimi背后是火山引擎和阿里云雙軌供應:火山引擎從2023年起獨家提供訓練和推理方案,后來阿里投了月之暗面8億美元,其中一部分直接以阿里云算力結算,楊植麟公開給阿里云“代言”。MiniMax更復雜,阿里云、騰訊云、火山引擎都是它的供應商,早期招標會上三家殺到2折競價。



誰也沒想到,隨著龍蝦到來,token 需求的爆發(fā)來得如此之快。

Agent來了之后,價格戰(zhàn)的邏輯跑不通了?!耙院蟆弊兂闪恕艾F(xiàn)在”:未來緩慢補充基建的時間瞬間消失。

用戶在罵Kimi卡的時候,Kimi可能也在罵火山引擎和阿里云卡。算力荒是從芯片到云服務到模型公司到用戶的四層傳導,Kimi和MiniMax站在最下游,承受每一層壓力的疊加。

上游扛得住嗎?

信號已經(jīng)出現(xiàn)了。今年3月,國內云廠商開始集體調價——AI算力和存儲產(chǎn)品價格上漲,漲幅從個位數(shù)到30%以上不等。優(yōu)刻得直接開啟全系漲價。海外也不例外,AWS和谷歌云在部分產(chǎn)品上試水調價。SK海力士公開表示2026年存儲芯片持續(xù)漲價已成定局,DRAM庫存僅剩約4周。持續(xù)二十年的“云服務只降不升”鐵律,被AI需求擊穿了。

漲價的邏輯不復雜。云廠商們過去一年瘋狂擴建AI算力基礎設施,資本開支動輒數(shù)百億量級,但AI業(yè)務本身的利潤率還很薄,遠不夠覆蓋基建投入。Token調用量在指數(shù)級增長——2026年2月國內主流大模型日均消耗合計約180萬億——但賣Token的收入增速追不上建數(shù)據(jù)中心的花錢速度。漲價,不是云廠商貪心,是供應鏈漲價的無奈之舉。

更棘手的是設備折舊。AWS、Google Cloud、Azure三家在2023-2024年統(tǒng)一把服務器折舊年限從3-4年延長到了6年,集體節(jié)省了約180億美元的年度折舊開支。但NVIDIA的芯片迭代周期只有18-24個月——你今天花幾千億建的數(shù)據(jù)中心,里面的GPU可能兩年后就不是最優(yōu)選擇了,折舊卻要攤6年。

Satya Nadella自己都說:“我不想在一代芯片上背四五年的折舊。”

看一眼算力市場的格局?;鹕揭鎽{借豆包以日均63萬億Token領跑,拿下公有云大模型調用量49.2%的份額,幾乎一家占了半壁江山。阿里云日均32萬億排第二,騰訊元寶28萬億、DeepSeek 22萬億緊隨其后。但調用量第一和營收第一不是同一家——按Omdia統(tǒng)計,阿里云以35.8%營收份額穩(wěn)居AI云市場第一,超過第二到第四名總和?;鹕节A在“輕”,阿里贏在“重”。

Kimi和MiniMax的算力命脈就握在這兩家手里。MiniMax上市后資本市場對Token增長狂熱追捧——M2.5發(fā)布首周調用量暴漲至3.07萬億Token——但每一個Token背后都是真實的推理成本。MiniMax 2025年全年營收不足8000萬美元,經(jīng)調整凈虧損2.5億,毛利率剛爬到25%。上游一漲價,這個剛轉正的毛利隨時可能被吃掉。

這些問題反映到C端,只有一個結果:繼續(xù)承受漲價或限流。Kimi配置最低的Allegretto套餐已經(jīng)199元/月,幾乎和包含Co-work以及Claude Code的Claude Pro同價了。如果繼續(xù)漲價,我們所說的“白菜價”智能,就真的不存在了。

截至文章發(fā)布前,老虎證券剛剛發(fā)布消息,月之暗面已經(jīng)開始考慮赴港上市。那Kimi就需要正面回答這個問題了:是繼續(xù)租算力還是自己買設備,是保利潤率還是保用戶。MiniMax已經(jīng)站在聚光燈下,每一季財報都是照妖鏡。Kimi 本來手握 100 億的賬上資金,至少短期不用受到資本市場的審視,但剛好今天,就傳出了 Kimi 赴港上市的傳聞。



如果傳聞是真的,那么 Kimi和 MiniMax 們真的需要考慮一個問題,到底是保用戶還是保利潤率。隨著漲價鏈條的傳遞,大模型們被“兩頭堵”的可能性,已經(jīng)驟然提升。

2026年,Agent改變了算力的需求曲線。便宜的智能沒變貴,使用智能的方式變了,資源出現(xiàn)了擠兌。

漲價什么時候會停?短期內恐怕看不到。Agent的需求曲線還在陡峭的上升期——Kimi K2.5剛上線不到一個月,收入就超過了2025年全年;MiniMax M2.5發(fā)布首周Token消耗量超過三家競品之和。多Agent并行、長上下文推理、編程場景的爆發(fā)才剛剛開始,每一個新場景打開都意味著Token消耗量再上一個臺階。而供給側的擴容周期是以年為單位的——數(shù)據(jù)中心從規(guī)劃到投產(chǎn)至少18個月,芯片禁令下國產(chǎn)替代的產(chǎn)能爬坡更慢。需求按周增長,供給按年追趕,中間的剪刀差就是漲價和限流的空間。

更深層的變化是,中國的云廠商們可能正在被迫進入一個全新的重資產(chǎn)設備周期。過去二十年,云計算的敘事是“輕”——彈性伸縮、按需付費、用多少買多少。但Agent時代的算力需求把這個敘事翻了過來。阿里宣布三年投入3800億建AI基礎設施,字節(jié)在火山引擎上的算力部署同樣激進。這些投入一旦啟動就停不下來——你今天不建,明天的Token就沒地方跑;但建了之后,折舊攤銷會在未來五到十年持續(xù)壓在利潤表上。

這很像二十年前電信運營商鋪3G/4G網(wǎng)絡的周期:需求爆發(fā)倒逼巨額基建,基建倒逼漲價或補貼退坡,最終整個行業(yè)的利潤結構被重塑。當年中國移動、中國聯(lián)通經(jīng)歷的資本開支競賽,今天可能在阿里云、火山引擎身上重演。區(qū)別在于,電信行業(yè)有牌照壁壘和政策保護,云廠商沒有。

對于站在鏈條最下游的Kimi和MiniMax們來說,這意味著算力成本不會回到價格戰(zhàn)時代的地板價了。對于用199元套餐跑龍蝦的你和我來說,這意味著“便宜好用的AI”這個窗口期,可能比所有人想象的都要短。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
火箭隊阿門·湯普森在被湖人隊盧克·肯納德打爆后,承擔了責任

火箭隊阿門·湯普森在被湖人隊盧克·肯納德打爆后,承擔了責任

好火子
2026-04-20 03:31:40
蘇林坐火車回到河內,河內火車站鋪了紅毯,迎接人員站一排

蘇林坐火車回到河內,河內火車站鋪了紅毯,迎接人員站一排

星星會墜落
2026-04-19 17:08:00
48小時內,俄美伊都對中國提了一個要求,涉及中方主權,必須滿足

48小時內,俄美伊都對中國提了一個要求,涉及中方主權,必須滿足

安珈使者啊
2026-04-17 11:50:45
國家一級女演員陳麗云被逮捕!

國家一級女演員陳麗云被逮捕!

許三歲
2026-03-28 09:24:30
罕見!黃仁勛談芯片禁售突然情緒失控:你不是在和一個Loser說話

罕見!黃仁勛談芯片禁售突然情緒失控:你不是在和一個Loser說話

DeepAuto車探
2026-04-19 20:37:54
反轉來了,伊朗對印度油船開炮,事態(tài)極為嚴重,特朗普或登機離國

反轉來了,伊朗對印度油船開炮,事態(tài)極為嚴重,特朗普或登機離國

輝輝歷史記
2026-04-20 06:55:09
許家印大兒的加拿大生活:無錢但自由、每天抽中華、二弟前途未卜

許家印大兒的加拿大生活:無錢但自由、每天抽中華、二弟前途未卜

茶喝多了睡不著
2026-04-15 22:15:05
炒蒜苔時,最忌直接下鍋炒,少了這1步,蒜苔不香,更不入味

炒蒜苔時,最忌直接下鍋炒,少了這1步,蒜苔不香,更不入味

阿龍美食記
2026-04-16 20:21:17
泰國白龍王一生不敢去中國,和弟子吐露:749局讓他心生畏懼

泰國白龍王一生不敢去中國,和弟子吐露:749局讓他心生畏懼

宅家伍菇?jīng)?/span>
2025-02-05 17:44:30
他帶厚禮投靠紅軍,但征戰(zhàn)16年僅升半級,授銜時讓羅榮桓犯了難

他帶厚禮投靠紅軍,但征戰(zhàn)16年僅升半級,授銜時讓羅榮桓犯了難

云霄紀史觀
2026-04-16 01:07:06
最新 | 資深女演員去世!竟因這個病......

最新 | 資深女演員去世!竟因這個病......

天津廣播
2026-04-19 15:09:03
68歲趙本山海南逛街,打扮潮流很瀟灑,買幾袋奢侈品,生活好愜意

68歲趙本山海南逛街,打扮潮流很瀟灑,買幾袋奢侈品,生活好愜意

草莓解說體育
2026-04-19 09:22:54
比賽進行中,現(xiàn)場近2萬人,觀眾突然喊話:懂不懂人情世故?

比賽進行中,現(xiàn)場近2萬人,觀眾突然喊話:懂不懂人情世故?

極目新聞
2026-04-19 10:17:37
馬克龍證實:有法國士兵身亡

馬克龍證實:有法國士兵身亡

魯中晨報
2026-04-18 21:24:20
勇士休賽期每一刀都疼,庫里不敢不簽,格林想給不起,未來不敢賭

勇士休賽期每一刀都疼,庫里不敢不簽,格林想給不起,未來不敢賭

老癘體育解說
2026-04-20 07:52:56
10名美軍核心科學家接連死亡!特朗普:我剛開完秘密會議

10名美軍核心科學家接連死亡!特朗普:我剛開完秘密會議

青煙小先生
2026-04-20 10:09:53
外觀非常驚艷 全新一代寶馬6系有望回歸

外觀非常驚艷 全新一代寶馬6系有望回歸

車質網(wǎng)
2026-04-20 10:06:04
雷軍挑戰(zhàn)成功!小米新SU7行駛1313公里只充1次電,連續(xù)直播15個小時,多名車友一路跟隨

雷軍挑戰(zhàn)成功!小米新SU7行駛1313公里只充1次電,連續(xù)直播15個小時,多名車友一路跟隨

極目新聞
2026-04-17 22:41:31
女大學生感覺多位男生喜歡自己,到處表白被拒確診桃花癲

女大學生感覺多位男生喜歡自己,到處表白被拒確診桃花癲

半島晨報
2026-04-19 20:41:49
劉雨鑫吃了6000家餐廳、走遍幾十個國家,他的錢其實就3個來源

劉雨鑫吃了6000家餐廳、走遍幾十個國家,他的錢其實就3個來源

老吳教育課堂
2026-04-14 07:44:56
2026-04-20 10:43:00
象先志 incentive-icons
象先志
專注互聯(lián)網(wǎng)、電商,聚焦產(chǎn)業(yè)、核心,洞察前沿、趨勢
142文章數(shù) 9關注度
往期回顧 全部

科技要聞

藍色起源一級火箭完美回收 客戶衛(wèi)星未入軌

頭條要聞

失蹤女老板被找到 嫌犯曾改名整容還催警察"還我清白"

頭條要聞

失蹤女老板被找到 嫌犯曾改名整容還催警察"還我清白"

體育要聞

七大獎項候選官宣!文班或全票DPOY

娛樂要聞

章子怡!增重20斤素顏拍新片

財經(jīng)要聞

月之暗面IPO迷局

汽車要聞

外觀非常驚艷 全新一代寶馬6系有望回歸

態(tài)度原創(chuàng)

時尚
房產(chǎn)
本地
數(shù)碼
公開課

今年最流行的衣服竟然是它?高級又氣質!

房產(chǎn)要聞

官宣簽約最強城更!海口樓市,突然殺入神秘房企!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

數(shù)碼要聞

內存短缺或致蘋果推遲上新 新款Mac Studio據(jù)稱延遲數(shù)月發(fā)布

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版