国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

熱度第一、Tokens周調(diào)用破3T,MiniMax這個(gè)春節(jié)殺瘋了

0
分享至



編輯|楊文

這個(gè)春節(jié),MiniMax 殺瘋了。

2 月 20 日,港股馬年首個(gè)交易日,MiniMax 收盤股價(jià)報(bào)漲 14.52%,市值一度沖破 3042 億港元。



這輪上漲并非只是資本市場(chǎng)的情緒宣泄。

過去兩年,AI 行業(yè)的敘事幾乎集中在供給側(cè),比如更強(qiáng)的模型、更快的芯片、更大的數(shù)據(jù)中心。然而,制約 AI 產(chǎn)業(yè)規(guī)?;涞氐?,除了供給側(cè)的能力上限外,還有大量長(zhǎng)期憋著、始終未能真正釋放的需求。

春節(jié)假期前后,MiniMax 發(fā)布新一代模型 M2.5,這些被壓制的需求終于找到了一個(gè)出口。

M2.5 發(fā)布后 12 小時(shí)內(nèi)登頂 OpenRouter 熱度榜,一周內(nèi)登頂調(diào)用量榜首,周調(diào)用量暴漲至 3.07T tokens,超過 Kimi K2.5、GLM-5 與 DeepSeek V3.2 三家的總和。



這還不是故事的全部。OpenRouter 整體調(diào)用量也在同步攀升。官方隨后確認(rèn),M2.5 帶動(dòng)了 100K 至 1M 長(zhǎng)文本區(qū)間的增量調(diào)用需求,而這個(gè)區(qū)間正是 Agent 工作流的典型消耗場(chǎng)景。

此前因?yàn)檎也坏侥芰统杀就瑫r(shí)過關(guān)的模型,大量開發(fā)者手里攥著現(xiàn)成的工作流卻遲遲無(wú)法啟動(dòng)。Agent 任務(wù)的 token 消耗遠(yuǎn)比普通對(duì)話密集,需求一旦被激活,帶動(dòng)的調(diào)用增量自然相當(dāng)可觀。



硅谷在用什么,已經(jīng)悄悄變了

早在 MiniMax 推出 M2.1 模型時(shí),被公認(rèn)為 Cursor 最強(qiáng)挑戰(zhàn)者的硅谷新貴 Kilo Code 就已表態(tài)。這家可調(diào)用全球超過 500 種模型的 AI 編程工具,在核心產(chǎn)品的默認(rèn)模型位置上,曾高調(diào)宣布首選 MiniMax M2.1。

Kilo 聯(lián)合創(chuàng)始人兼 CEO Breitenother 給出的理由簡(jiǎn)單粗暴:在開發(fā)者直接評(píng)判的真實(shí)編碼工作流程中,M2.1 能夠與前沿模型相媲美。

此次 M2.5 發(fā)布后隨即全面開源,模型權(quán)重在 HuggingFace 上發(fā)布,支持本地部署,Kilo 再次宣布接入。與此同時(shí),OpenCode、OpenClaw、Fireworks、Factory、TRAE、Cline、OpenHands、Roo Code,以及 Ollama、vLLM、SGLang、Dify、魔搭社區(qū)等國(guó)內(nèi)外知名開源 Agent 應(yīng)用、開源工具平臺(tái),也在第一時(shí)間接入



Kilo 代表新一代 AI 編程工具的方向,OpenClaw 代表最新的 AgentOS,它們?cè)诘讓幽P偷倪x擇上極為挑剔,M2.5 能夠成為這類產(chǎn)品的優(yōu)先推薦,意味著在真實(shí)生產(chǎn)環(huán)境中對(duì)于模型的認(rèn)可。

在編程領(lǐng)域最具代表性的 SWE-Bench Verified 評(píng)測(cè)中,M2.5 以 80.2% 的通過率達(dá)到了與 Claude Opus 系列相當(dāng)?shù)乃?,在多語(yǔ)言任務(wù) Multi-SWE-Bench 上排名第一。

知名技術(shù)博主 Simon Willison 使用 mini-swe-agent 對(duì)當(dāng)前主流模型進(jìn)行了獨(dú)立測(cè)評(píng),結(jié)果顯示 M2.5 排名第三,僅次于 Claude Opus 4.5 和 Gemini 3 Flash,且是開源模型中的第一名





執(zhí)行效率也有實(shí)質(zhì)性提升。研究機(jī)構(gòu) SemiAnalysis 實(shí)測(cè)顯示,在 8 張 H200 顯卡上,M2.5 在合理首 token 延遲范圍內(nèi)能夠持續(xù)達(dá)到每 GPU 每秒約 2500 個(gè) token 的吞吐量,即便在嚴(yán)格要求每用戶每秒 20 個(gè) token 交互性的條件下,處理超過 1 萬(wàn)個(gè) token 的上下文時(shí)仍能維持穩(wěn)定的解碼速度。



開源 Agent 社區(qū)的密集接入同樣說明問題。對(duì)于需要長(zhǎng)時(shí)間運(yùn)行、高頻調(diào)用工具的 Agent 框架來說,模型的定價(jià)直接決定了產(chǎn)品能否跑通商業(yè)邏輯。

M2.5 的價(jià)格區(qū)間恰好落在這批產(chǎn)品真正能接受的范圍里。它提供兩個(gè)版本:100 TPS 快速版,輸入每百萬(wàn) tokens 僅需 0.3 美元,輸出每百萬(wàn) tokens 僅需 2.4 美元;50 TPS 版本輸出價(jià)格還要再降一半。

能力、速度、成本,這三個(gè)維度在 M2.5 上同時(shí)達(dá)標(biāo),帶來的結(jié)果在 OpenRouter 上看得尤為清楚,M2.5 第一次走出了一條接近指數(shù)型的曲線。

滿足真實(shí)需求,從底層重新設(shè)計(jì)

這些提升的背后,得益于 MiniMax 從工程底層重新設(shè)計(jì)的一套原生 Agent 強(qiáng)化學(xué)習(xí)系統(tǒng),代號(hào) Forge。

Forge 將 Agent 的執(zhí)行邏輯與底層訓(xùn)練推理引擎徹底解耦。在此之前,大多數(shù) RL 框架要求把 Agent 當(dāng)作白盒來處理,Agent 與框架之間需要深度共享內(nèi)部狀態(tài),一旦涉及動(dòng)態(tài)上下文管理或多 Agent 協(xié)作,工程復(fù)雜度就會(huì)急劇膨脹;傳統(tǒng)的 Token-In-Token-Out 模式還迫使 Agent 與底層 Tokenizer 深度綁定,維護(hù)訓(xùn)練和推理之間的一致性成本極高。

Forge 通過引入中間件抽象層繞開了這兩個(gè)問題。Gateway Server 作為標(biāo)準(zhǔn)化通信網(wǎng)關(guān),將 Agent 的高層行為與底層模型復(fù)雜性隔離;Data Pool 異步收集訓(xùn)練軌跡,使生成與訓(xùn)練徹底解耦。這套架構(gòu)讓 MiniMax 可以在不修改任何 Agent 內(nèi)部代碼的前提下,接入數(shù)百種框架和數(shù)千種工具調(diào)用格式進(jìn)行訓(xùn)練。



訓(xùn)練效率上,F(xiàn)orge 引入了 Prefix Tree Merging 方案,將訓(xùn)練樣本從線性序列重構(gòu)為樹形結(jié)構(gòu),消除了多輪 Agent 請(qǐng)求之間大量重復(fù)的上下文前綴,實(shí)現(xiàn)了約 40 倍的訓(xùn)練加速,同時(shí)顯著降低了顯存開銷。



異步調(diào)度上,F(xiàn)orge 提出 Windowed FIFO 策略,在最大化系統(tǒng)吞吐量的同時(shí),通過滑動(dòng)窗口約束控制樣本的離策略程度,避免訓(xùn)練分布向「快而簡(jiǎn)單」的樣本嚴(yán)重偏移,兼顧了效率與穩(wěn)定性。



算法層面,MiniMax 沿用自研的 CISPO 算法保障 MoE 模型在大規(guī)模訓(xùn)練中的穩(wěn)定性,并針對(duì) Agent 場(chǎng)景的長(zhǎng)軌跡信用分配難題,設(shè)計(jì)了由過程獎(jiǎng)勵(lì)、任務(wù)完成時(shí)間獎(jiǎng)勵(lì)與 Reward-to-Go 三部分組成的復(fù)合獎(jiǎng)勵(lì):過程獎(jiǎng)勵(lì)對(duì) Agent 中間行為進(jìn)行密集監(jiān)督,不只依賴最終結(jié)果;任務(wù)完成時(shí)間獎(jiǎng)勵(lì)將相對(duì)完成時(shí)間作為獎(jiǎng)勵(lì)信號(hào),激勵(lì)模型主動(dòng)利用并行策略選擇最短執(zhí)行路徑;Reward-to-Go 則通過標(biāo)準(zhǔn)化回報(bào)大幅降低梯度方差,穩(wěn)定優(yōu)化過程。

此外,MiniMax 還將上下文管理機(jī)制直接整合進(jìn)了 RL 交互循環(huán),將其視為驅(qū)動(dòng)狀態(tài)轉(zhuǎn)換的功能性動(dòng)作,讓模型在訓(xùn)練階段就學(xué)會(huì)預(yù)見并適應(yīng)上下文變遷,這從根本上解決了長(zhǎng)程任務(wù)中隨交互輪次增加而出現(xiàn)的注意力稀釋問題。

正是這套系統(tǒng),讓 M2.5 在 Kilo、OpenClaw 這類對(duì)模型要求頗為苛刻的 Agent 框架上跑出了穩(wěn)定的表現(xiàn)。

超越 Agentic Engineering,面向下一代應(yīng)用生態(tài)

在過去 108 天里,MiniMax 陸續(xù)推出了 M2、M2.1 和 M2.5,在 SWE-Bench Verified 榜單上,M2 系列的進(jìn)步速度超過了 Claude、GPT 和 Gemini 系列,是行業(yè)迭代最快的



這個(gè)節(jié)奏,恰好踩在一個(gè)需求爆發(fā)的窗口上。OpenClaw 從籍籍無(wú)名到席卷全球,前后不過一兩個(gè)月時(shí)間。如今 OpenRouter 上已有上千種類似工具和應(yīng)用在此生長(zhǎng),這片 ChatGPT、Claude、Gemini「御三家」之外的生態(tài)里,開發(fā)者只認(rèn)一個(gè)標(biāo)準(zhǔn):模型跑不跑得通、用不用得起。

能力達(dá)到第一梯隊(duì)、價(jià)格只有主流旗艦?zāi)P褪种?、還支持本地部署,MiniMax M2.5 和一系列國(guó)產(chǎn)模型的出現(xiàn),恰好在性能與成本之間擊穿了那個(gè)臨界點(diǎn),讓開源社區(qū)里那些原本只存在于 Demo 中的復(fù)雜多 Agent 系統(tǒng),第一次具備了大規(guī)模商業(yè)落地的經(jīng)濟(jì)可行性。

3T tokens 的周調(diào)用量背后,是開發(fā)者們用腳投出的票。這個(gè)數(shù)字不只是 M2.5 模型的增量,更是硅谷下一代的開源生態(tài)應(yīng)用的增量

那些被壓制了許久的 Agent 需求,真的要開始跑起來了。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗要死!

伊朗要死!

求實(shí)處
2026-02-22 17:53:28
回顧:四川一男子陰莖撕裂入院,9天后復(fù)查結(jié)果如何了

回顧:四川一男子陰莖撕裂入院,9天后復(fù)查結(jié)果如何了

新時(shí)代的兩性情感
2026-02-23 18:01:52
美國(guó)賭定中國(guó)不敢登船檢查運(yùn)往臺(tái)灣的軍火船,最多只是抗議而已

美國(guó)賭定中國(guó)不敢登船檢查運(yùn)往臺(tái)灣的軍火船,最多只是抗議而已

我心縱橫天地間
2026-02-21 18:42:41
春節(jié)檔較去年下滑40%

春節(jié)檔較去年下滑40%

犀牛娛樂
2026-02-24 15:26:50
澳大利亞驚現(xiàn)封閉亂倫家族:4代人近親繁衍38名成員全是亂倫產(chǎn)物

澳大利亞驚現(xiàn)封閉亂倫家族:4代人近親繁衍38名成員全是亂倫產(chǎn)物

第7情感
2026-02-23 20:45:16
Melody道歉了!遭指「服務(wù)業(yè)殺手」負(fù)評(píng)如雪崩:我會(huì)悔改調(diào)整反省

Melody道歉了!遭指「服務(wù)業(yè)殺手」負(fù)評(píng)如雪崩:我會(huì)悔改調(diào)整反省

ETtoday星光云
2026-02-24 13:10:04
別嫌遠(yuǎn)、別嫌偏!十年后深圳這5個(gè)地方,你高攀不起!

別嫌遠(yuǎn)、別嫌偏!十年后深圳這5個(gè)地方,你高攀不起!

據(jù)說說娛樂
2026-02-24 12:23:29
不能令人信服的通報(bào),媒體就別轉(zhuǎn)發(fā)了吧!

不能令人信服的通報(bào),媒體就別轉(zhuǎn)發(fā)了吧!

林中木白
2026-02-23 12:40:41
別再喊四大文明古國(guó)了,把中國(guó)放進(jìn)去,本身就是個(gè)認(rèn)知誤區(qū)

別再喊四大文明古國(guó)了,把中國(guó)放進(jìn)去,本身就是個(gè)認(rèn)知誤區(qū)

談史論天地
2026-02-24 13:23:29
臺(tái)海問題還要等多久?

臺(tái)海問題還要等多久?

百態(tài)人間
2026-02-24 15:36:32
長(zhǎng)和:反對(duì)巴拿馬政府強(qiáng)行接管巴拿馬港口公司之資產(chǎn)、員工與營(yíng)運(yùn)

長(zhǎng)和:反對(duì)巴拿馬政府強(qiáng)行接管巴拿馬港口公司之資產(chǎn)、員工與營(yíng)運(yùn)

財(cái)聯(lián)社
2026-02-24 11:55:06
調(diào)整!中央5臺(tái)直播斯諾克中國(guó)德比有變,趙心童沖擊三連冠

調(diào)整!中央5臺(tái)直播斯諾克中國(guó)德比有變,趙心童沖擊三連冠

皮皮觀天下
2026-02-24 03:28:36
被吹上天的越南,是如何迎來至暗時(shí)刻的?東南亞新格局逐漸形成

被吹上天的越南,是如何迎來至暗時(shí)刻的?東南亞新格局逐漸形成

混沌錄
2026-02-24 19:37:06
2月24日晚間重要公告一覽

2月24日晚間重要公告一覽

GPLP
2026-02-24 18:25:51
剛剛!廣東定調(diào)未來10年!錢往哪流?哪些行業(yè)要爆發(fā)?大白話解讀

剛剛!廣東定調(diào)未來10年!錢往哪流?哪些行業(yè)要爆發(fā)?大白話解讀

愛看劇的阿峰
2026-02-24 16:22:35
中國(guó)正在大量囤油,一度吞掉世界9成囤量,有什么大事要發(fā)生?

中國(guó)正在大量囤油,一度吞掉世界9成囤量,有什么大事要發(fā)生?

森羅萬(wàn)象視頻
2026-02-23 21:13:07
吳艷妮小露性感腹肌迷人:普通的日子也會(huì)有說不清的快樂

吳艷妮小露性感腹肌迷人:普通的日子也會(huì)有說不清的快樂

懂球帝
2026-02-24 11:01:05
《鏢人》謝霆鋒帶2人進(jìn)組,別人上綜藝說場(chǎng)面話,他還真言出必行

《鏢人》謝霆鋒帶2人進(jìn)組,別人上綜藝說場(chǎng)面話,他還真言出必行

大鐵貓娛樂
2026-02-23 22:55:03
被國(guó)家隊(duì)開除,加拿大送國(guó)籍千萬(wàn)合同,王濛一句話震撼冰壇

被國(guó)家隊(duì)開除,加拿大送國(guó)籍千萬(wàn)合同,王濛一句話震撼冰壇

觀察者海風(fēng)
2026-02-24 13:45:09
伊朗最強(qiáng)外援缺席,哈梅內(nèi)伊開始交待后事,最危險(xiǎn)的局面要來了

伊朗最強(qiáng)外援缺席,哈梅內(nèi)伊開始交待后事,最危險(xiǎn)的局面要來了

一簌月光
2026-02-22 23:22:57
2026-02-24 20:11:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12344文章數(shù) 142569關(guān)注度
往期回顧 全部

數(shù)碼要聞

AOC“AGP277QKD”顯示器國(guó)行上架:2K 540Hz/HD 720Hz,7999元

頭條要聞

20家日本實(shí)體被列入管制名單 中方:完全正當(dāng) 合理合法

頭條要聞

20家日本實(shí)體被列入管制名單 中方:完全正當(dāng) 合理合法

體育要聞

蘇翊鳴總結(jié)米蘭征程:我仍是那個(gè)熱愛單板滑雪的少年

娛樂要聞

汪小菲官宣三胎出生:承諾會(huì)照顧好3個(gè)孩子

財(cái)經(jīng)要聞

縣城消費(fèi)「限時(shí)繁榮」了十天

科技要聞

AI顛覆發(fā)展最新犧牲品!IBM跳水重挫超13%

汽車要聞

入門即滿配 威蘭達(dá)AIR版上市 13.78萬(wàn)元起

態(tài)度原創(chuàng)

房產(chǎn)
數(shù)碼
手機(jī)
本地
公開課

房產(chǎn)要聞

330萬(wàn)人涌入!春節(jié)全國(guó)樓市,第一個(gè)賣爆的區(qū)域出現(xiàn)了!

數(shù)碼要聞

宜鼎推出CXL AIC擴(kuò)展卡:可為兼容設(shè)備擴(kuò)展最大256GB內(nèi)存

手機(jī)要聞

iQOO 15R發(fā)布,這配置能打嗎?

本地新聞

春花齊放2026:《駿馬奔騰迎新歲》

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版