国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

國產(chǎn)芯片,能否解決智譜和MiniMax的算力荒問題

0
分享至


4月24日,DeepSeek正式發(fā)布新模型V4,以開源、低價、高性能給市場帶來沖擊,智譜與MiniMax雙雙跳水,市值一度跌超10%和12%。有網(wǎng)友戲稱,DeepSeek果然是國產(chǎn)大模型最嚴厲的父親。

無論是新模型V4,還是近期DeepSeek的融資消息,無疑都會給智譜和MiniMax的股價帶來較大波動。4月23日,我們獨家報道DeepSeek最新估值達到3000億元,目前這個數(shù)字已經(jīng)得到一位DeepSeek內(nèi)部人士的確認。

當前真正卡住智譜和MiniMax的不是別的,而是年初龍蝦火爆后帶來的算力荒。

一位頭部大廠算法人員算了一筆賬,在同一個項目里改幾行代碼,不搭skills,AI先得讀完整套系統(tǒng)的上下文,工程文件、依賴聲明和類定義統(tǒng)統(tǒng)加載,單次任務幾十萬Token可能一下就燒完了。去年底同樣花10塊錢能跑完的任務,今年賬單上變成了近20塊。

“真到了需要復雜推理還原問題的時候,真不如自己手寫,AI的性價比不如大學生,好用還便宜?!苯衲暌詠?,智譜API價格連漲三次,4月發(fā)布GLM-5.1后Token價格再度上調(diào)10%,外版Coding Plan月付價格幾乎翻倍,算下來,第一季度智譜的API定價累計上調(diào)約83%。MiniMax則將之前的Coding Plan全面升級為Token Plan,新增免費額度減少。

做出同樣動作的還有阿里和騰訊,他們都將Coding Plan下架換成Token Plan。4月,阿里云四天內(nèi)連發(fā)三條產(chǎn)品漲價公告,部分項目漲幅最高達34%。更早的3月,騰訊云部分模型價格漲幅高達463%。這意味著,哪怕成為高階會員,Token量大管飽的日子也已經(jīng)一去不復返了。

智譜CEO張鵬上個月在內(nèi)部會議表示,“未來12個月最大問題是算力,不是需求。”而為了在有限的資源下求生存,MiniMax創(chuàng)始人閆俊杰表示,雖然公司同期收入增長了158.9%,但公司內(nèi)部已經(jīng)不再盲目追求用戶量的絕對值,并宣布,截至2月,M2系列模型的百萬Token推理成本已較2025年12月下降了超50%。

摩根大通最近將智譜與MiniMax同列為“中國AI采用周期的結(jié)構(gòu)性受益者”,面對同樣的算力擠兌,智譜和MiniMax交出了截然不同的答卷。

01

算力成了大模型廠商的生死線

春節(jié)以來,開發(fā)者社區(qū)的投訴帖幾乎沒有停過。Kimi自2月起高峰期?,F(xiàn)算力不足,智譜更是一連遭遇了多輪危機,2月GLM-5上線后調(diào)用量暴增,API排隊蔓延,部分開發(fā)者的長鏈代碼生成任務直接中斷。

智譜不得不公開致歉,承認“規(guī)則透明度不夠、GLM-5灰度節(jié)奏太慢、老用戶升級機制設計粗糙”,甚至開啟全額退款通道。

4月12日,MiniMax正式開源M2.7模型,首日完成華為昇騰、摩爾線程、沐曦等多款國產(chǎn)GPU的Day-0適配,宣布通過MoE架構(gòu)優(yōu)化顯著降低了推理成本。但即便如此,用戶們吐槽MiniMax服務器繁忙、連續(xù)掉線、限流的帖子也不在少數(shù)。

這種算力短缺的根源在兩端的同時失控。需求端,OpenClaw等智能體應用將Token消耗量推高了不止一個數(shù)量級。傳統(tǒng)對話場景一篇文章消耗幾千Token,一個典型的Openclaw自動化任務,其Token消耗量是傳統(tǒng)對話場景的3至5倍,在文件整理、代碼生成、多輪工具調(diào)用等環(huán)節(jié),單次任務的上下文攜帶量成倍增長。

根據(jù)智譜發(fā)布的2025年度財報,公司全年實現(xiàn)營業(yè)收入7.24億元,同比增長131.9%。但營收增速背后是更驚人的虧損擴大,年內(nèi)虧損達到47.18億元,同比擴大59.5%,經(jīng)調(diào)整凈虧損31.82億元,同比擴大29.1%。研發(fā)開支高達31.80億元,其中支付給第三方算力供應商的計算服務費用占據(jù)大頭。

張鵬在一次AI開源前沿論壇上說:“所有的技術(shù),包括智能體框架,在很多場景下可以帶來十倍級的效率提升,但前提是算力充足?!痹?026中關(guān)村論壇上,他再次強調(diào):“大模型未來12個月面臨的最大問題可能是算力?!?/p>

這種“增收巨虧”的局面并非智譜獨有。閆俊杰也不止一次公開表示,用戶量的增長和模型廠商收入的增長間并不存在正相關(guān)。這恰好解釋了當下大模型公司“增收不增利”的窘境來源。

供給端則被死死卡住。2025年5月,美國商務部升級芯片出口限制,英偉達H20被納入禁售名單。雖然后續(xù)H20有望重返中國市場,但配額大幅縮減。據(jù)SemiAnalysis數(shù)據(jù),H100一年期租賃價格從2025年10月的約1.70美元/小時/GPU漲至2026年3月的約2.35美元/小時,漲幅近40%。

我們獨家獲悉,某頭部大廠更是拿出數(shù)百億的預算從年初就開始求卡,但仍然買卡無門。

據(jù)中國信通院數(shù)據(jù),2025年英偉達在中國數(shù)據(jù)中心市場的份額已從2022年的95%下滑至50%,而國產(chǎn)AI芯片份額從12%增長至25%。華為昇騰以約81.2萬塊的出貨量位居國產(chǎn)第一,市場份額約49.2%,但與英偉達剩余份額相加仍難以滿足爆發(fā)式增長的算力需求。

這種供給失衡,讓Token市場出現(xiàn)了K型分化。低成本“閑聊型”Token價格一降再降,阿里通義千問一度壓至0.0005元/千Tokens,字節(jié)豆包0.0008元/千Tokens。這些面向基礎場景的Token,成了黃仁勛口中類似“水電煤”的基礎設施。

而另一端的“黃金型”Token——長鏈推理、復雜代碼生成、企業(yè)私有化部署,價格卻一路走高。智譜的API定價去年以來已累計提價83%,而市場需求非但沒有減弱,API調(diào)用量反而增長了400%。算力這把達摩克利斯之劍,落在了所有廠商的脖子上。

02

智譜選保毛利,MiniMax選保份額

算力短缺如同一道共同的緊箍咒,但智譜和MiniMax選擇了兩種截然不同的解脫路徑。智譜的打算很清楚,漲價,篩選,保利潤。

張鵬在3月的一次活動中表示,低價競爭不利于行業(yè)發(fā)展,上調(diào)API價格是成本變化的結(jié)果。而從今年2月至4月,智譜用連續(xù)三次上調(diào)API價格來回應了這個判斷:Coding Plan套餐漲30%,旗艦API服務漲20%,GLM-5上線后漲10%,GLM-5.1再漲10%。

Anthropic在海外已經(jīng)劃出了一條清晰的參考線。最近,Anthropic調(diào)整了企業(yè)版Claude Enterprise的定價模式,從每月最高200美元的固定費用,改為每月20美元基礎費加按實際算力消耗收費。而在漲價的同時,Anthropic年化收入從2025年1月的約10億美元,一年后,AnthropicARR突破300億美元,超過OpenAI同期約250億美元的規(guī)模。

如今,Anthropic估值已突破1萬億美元,超過了OpenAI(同期約8800億美元)。

智譜選擇跟上。通過連續(xù)漲價篩選出高付費意愿的客戶,將有限的算力集中在Vibe Coding(氛圍編程)向Agentic Engineering(智能體工程)演進的高價值場景。

2026年一季度,智譜API定價累計上調(diào)83%,同期調(diào)用量卻暴增400%,云端API業(yè)務毛利率從3.3%升至18.9%。在剛結(jié)束的2025年財報電話會上,張鵬將智譜定位為 “中國的Anthropic”,并提出:“大模型公司商業(yè)價值取決于Token消耗的規(guī)模,而定價權(quán)完全取決于模型的智能上界?!?/p>

在張鵬看來,能高效處理長鏈復雜推理任務的高端Token永遠是稀缺品,而誰掌握了高端Token的定價權(quán),誰就能在下一代競爭中占住入口。這正是智譜在毛利率從56.3%降至41%的背景下,仍堅持聚焦高價值場景的邏輯所在。

MiniMax則走了一條完全相反的路線,開源、優(yōu)化、搶規(guī)模。2025年10月以來,MiniMax在不到半年的時間內(nèi)完成了M2、M2.1、M2.5和M2.7四代模型迭代。2026年4月12日,M2.7在全球開源。這款2300億參數(shù)的MoE模型在推理時僅激活100億參數(shù),激活率約4.3%,極大降低了推理成本。

為了降本,MiniMax與華為昇騰、摩爾線程、沐曦、昆侖芯等海內(nèi)外芯片廠商在開源首日完成了Day-0適配。摩爾線程基于MUSA架構(gòu)實現(xiàn)了深度調(diào)優(yōu),在MTT S5000上完成高性能推理部署。沐曦曦云C系列GPU依托全棧自研的MXMACA軟件棧實現(xiàn)了“模型發(fā)布即算力就緒”。

MiniMax已經(jīng)拿到了成果。模型調(diào)用量爆發(fā),M2系列文本模型單日Token消耗量在2026年前兩個月較2025年12月激增6倍以上,2月ARR已突破1.5億美元。經(jīng)調(diào)整凈虧損約2.5億美元,虧損率顯著收窄。

但這也是一場危險的賭注。MiniMaxAPI客單價明顯低于智譜,單位算力的盈利空間被極度壓縮。MiniMax打的是“以規(guī)模換生態(tài)”的算盤,閆俊杰的策略是先讓Token足夠便宜,讓開發(fā)者習慣它的生態(tài),再通過增值服務完成商業(yè)閉環(huán)。可如果開源生態(tài)變現(xiàn)的進度趕不上研發(fā)投入的增長,這條路就可能被高成本堵死。

而低價策略能否支撐Minimax在下一代模型研發(fā)上與智譜、阿里等巨頭競爭,仍是未知數(shù)。

03

破局關(guān)鍵在國產(chǎn)芯片和時間窗口

2025年度智譜研發(fā)開支為31.8億元,算力成本占研發(fā)總開支的七成以上,但仍無法滿足需求。GLM-5單次推理的算力消耗是前代GLM-4.7的3倍,而國產(chǎn)GPU的適配優(yōu)化尚在推進中。

盡管智譜已完成與華為昇騰、寒武紀等7大國產(chǎn)芯片的深度優(yōu)化,長序列部署成本下降50%,整體算力缺口依然巨大。

海外巨頭同樣承受著巨大算力緊缺的重壓。OpenAI放棄Sora視頻生成應用,將算力集中到核心模型開發(fā)中。Anthropic用鎖定AWS旗下Trainium芯片高達5吉瓦的算力資源來換取客戶穩(wěn)定性,不只是傳統(tǒng)的風險投資。

算力的“絞索”正在勒緊每一位玩家的脖頸。而在算力的“絞索”被解除之前,智譜和MiniMax各自的探索都只是權(quán)宜之計,真正的變數(shù)是國產(chǎn)芯片的時間窗口。

2025年,英偉達在中國市場的AI加速卡占有率從2022年的約95%大幅下滑到約55%。國產(chǎn)AI加速卡總出貨量約165萬張,市占率約41%。華為昇騰以約81.2萬張的出貨量斷層領跑,占國產(chǎn)份額約49.2%。阿里平頭哥、百度昆侖芯、寒武紀、海光信息緊隨其后。

在智譜發(fā)布的GLM-5中,華為昇騰、摩爾線程、寒武紀等國產(chǎn)芯片平臺已完成深度推理適配與算子級優(yōu)化。

更關(guān)鍵的一步可能在2026年到來。2026年3月,華為在合作伙伴大會上正式發(fā)布了搭載全新昇騰950PR的AI訓練推理加速卡Atlas 350。這款芯片性能據(jù)估計可達英偉達H20的近三倍,并且對CUDA體系的兼容性已大幅提升,字節(jié)跳動、阿里巴巴等大廠都計劃采用。

這意味著通往國產(chǎn)GPU的高質(zhì)量替代之路已不是紙上談兵。這次DeepSeek V4跳過英偉達CUDA生態(tài),適配的是華為昇騰平臺,可能動搖英偉達在AI算力市場的主導地位,打破其軟件生態(tài)壟斷。這也正是黃仁勛最近預言的“災難”。

不過當前DeepSeek自身也卡算力。V4發(fā)布時官方明確坦言,V4-Pro當前高端算力吞吐有限,自身都受高端芯片供給約束,無法向外大規(guī)模輸出富余算力。

未來的錨點在于,昇騰950PR能否在實際部署中兌現(xiàn)百萬級高吞吐與低延遲的承諾,國產(chǎn)芯片是否能在2026年實現(xiàn)大規(guī)模、穩(wěn)定的ToB商用。假設國產(chǎn)芯片能做到大規(guī)模穩(wěn)定商用,讓算力成本驟降,屆時低價、規(guī)?;穆窂綗o疑將占據(jù)上風。

留給國內(nèi)大模型廠商的問題已然清晰,那就是能否在國產(chǎn)算力芯片全面成熟之前,搶先跑通一條脫離英偉達依賴獨立發(fā)展的路徑。

撰寫|馬文佩、馬舒葉

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“4只皮皮蝦1035元”消費者再發(fā)聲:否認“想吃白食”,已拒絕先行賠付,不是錢的問題,等待調(diào)查出租車和商家的問題

“4只皮皮蝦1035元”消費者再發(fā)聲:否認“想吃白食”,已拒絕先行賠付,不是錢的問題,等待調(diào)查出租車和商家的問題

揚子晚報
2026-05-08 22:15:38
3-0復仇韓國!中國隊成功晉級倫敦世乒賽男團四強

3-0復仇韓國!中國隊成功晉級倫敦世乒賽男團四強

體壇周報
2026-05-08 21:47:15
89歲謝賢被CoCo爆料,分手原因:他身體跟不上我,張柏芝也被牽連

89歲謝賢被CoCo爆料,分手原因:他身體跟不上我,張柏芝也被牽連

好賢觀史記
2026-05-08 15:57:30
實測76.42℃!比亞迪閃充深陷“電池溫升門”風波

實測76.42℃!比亞迪閃充深陷“電池溫升門”風波

新能源前瞻
2026-05-08 21:14:42
危機四伏,俄高官:他已失去了對俄羅斯控制

危機四伏,俄高官:他已失去了對俄羅斯控制

史政先鋒
2026-05-08 20:50:11
美軍再次對多艘伊朗油輪發(fā)動空襲

美軍再次對多艘伊朗油輪發(fā)動空襲

新華社
2026-05-08 21:13:24
4只皮皮蝦花了1035元后續(xù):店老板離世,真相曝出,顧客騙了全網(wǎng)

4只皮皮蝦花了1035元后續(xù):店老板離世,真相曝出,顧客騙了全網(wǎng)

李晚書
2026-05-08 16:09:22
“極度兇殘變態(tài)”!香港豪宅雙尸案:外籍銀行高層性虐及殺害兩女子,還拍犯案經(jīng)過!被判終身監(jiān)禁

“極度兇殘變態(tài)”!香港豪宅雙尸案:外籍銀行高層性虐及殺害兩女子,還拍犯案經(jīng)過!被判終身監(jiān)禁

大風新聞
2026-05-08 21:45:04
三花智控:目前上市公司暫無收購特斯拉、英偉達的想法

三花智控:目前上市公司暫無收購特斯拉、英偉達的想法

貝殼財經(jīng)
2026-05-08 17:48:02
曝王暖暖凌晨被送往醫(yī)院搶救!全身浮腫、滿臉脹紅,昏迷原因曝光

曝王暖暖凌晨被送往醫(yī)院搶救!全身浮腫、滿臉脹紅,昏迷原因曝光

阿廢冷眼觀察所
2026-05-08 18:26:49
稀土戰(zhàn)爭其實早就打完了——一份從 1985 到 2026 的完整賬本,告訴你 AI 時代真正的勝負手是什么

稀土戰(zhàn)爭其實早就打完了——一份從 1985 到 2026 的完整賬本,告訴你 AI 時代真正的勝負手是什么

六子吃涼粉
2026-05-06 18:14:18
國務院一紙令下!六月起強制執(zhí)行,騎電動車再也不用見警就躲了

國務院一紙令下!六月起強制執(zhí)行,騎電動車再也不用見警就躲了

今朝牛馬
2026-05-07 20:58:21
人倫之亂,正在悄悄毀掉無數(shù)家庭!看完一身冷汗

人倫之亂,正在悄悄毀掉無數(shù)家庭!看完一身冷汗

三農(nóng)老歷
2026-05-08 19:20:12
一艘中國船東所有的油輪遇襲,外交部:船上有中國籍船員,目前暫無傷亡情況

一艘中國船東所有的油輪遇襲,外交部:船上有中國籍船員,目前暫無傷亡情況

澎湃新聞
2026-05-08 15:36:29
揮淚斬馬謖!皇馬正式批準出售1億“頂星”!2.5億強援空降伯納烏

揮淚斬馬謖!皇馬正式批準出售1億“頂星”!2.5億強援空降伯納烏

頭狼追球
2026-05-08 17:23:49
浙江:今起,這幾類海鮮禁售

浙江:今起,這幾類海鮮禁售

上觀新聞
2026-05-08 21:25:09
別碰!別吃!別養(yǎng)!一只就攜帶100條蟲,看到趕緊遠離

別碰!別吃!別養(yǎng)!一只就攜帶100條蟲,看到趕緊遠離

齊魯壹點
2026-05-08 06:35:47
理想新車突然官宣:5月15日,全新上市

理想新車突然官宣:5月15日,全新上市

科技堡壘
2026-05-08 11:10:56
炸鍋!李湘暴瘦50斤判若兩人,真實瘦身原因太驚人

炸鍋!李湘暴瘦50斤判若兩人,真實瘦身原因太驚人

鄉(xiāng)野小珥
2026-05-09 01:41:16
江蘇生態(tài)環(huán)境廳工作組赴徐州調(diào)查,多部門連夜轉(zhuǎn)運黑臭水體

江蘇生態(tài)環(huán)境廳工作組赴徐州調(diào)查,多部門連夜轉(zhuǎn)運黑臭水體

上觀新聞
2026-05-08 06:34:12
2026-05-09 05:00:49
白鯨實驗室one incentive-icons
白鯨實驗室one
記錄 AI改變世界的瞬間
133文章數(shù) 16關(guān)注度
往期回顧 全部

科技要聞

SK海力士平均獎金600萬 工服成相親神器

頭條要聞

美公布首批UFO文件 視頻公開:阿聯(lián)酋現(xiàn)水母狀物體

頭條要聞

美公布首批UFO文件 視頻公開:阿聯(lián)酋現(xiàn)水母狀物體

體育要聞

他把首勝讓給隊友,然后用一年時間還清賬單

娛樂要聞

古天樂被曝隱婚生子,新娘竟是她

財經(jīng)要聞

估值3000億 DeepSeek尋求500億元融資

汽車要聞

MG 4X實車亮相 將于5月11日開啟盲訂

態(tài)度原創(chuàng)

家居
藝術(shù)
親子
旅游
軍事航空

家居要聞

流動的尺度 打破家的形式主義

藝術(shù)要聞

砸22億!OPPO在東莞建了一批“O字樓”

親子要聞

北京兒童配眼鏡指南:從看得清到管得住,守住孩子的視力第一條防線

旅游要聞

社評:中國的“Country Walk”何以吸引西方年輕人

軍事要聞

伊朗:最高領袖穆杰塔巴全面掌控局勢

無障礙瀏覽 進入關(guān)懷版