国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

MiniMax-M2.7 開源了,本地部署指南

0
分享至

MiniMax-M2.7 上月推出,時隔半個多月,剛剛開源了

這次開源,可以發(fā)現(xiàn)很多更細(xì)節(jié)的內(nèi)容,不過我就不過多介紹了

因為我簡單測試之后,沒達(dá)到我的預(yù)期,主要介紹一下本地部署相關(guān)的內(nèi)容吧

我是用的 Nvidia 提供的線上測試,用例依然是閱讀理解+svg 代碼生成 + 審美

結(jié)果是比較跌眼睛的,甚至感覺有 Qwen3 的水平

與 GLM-5.1 半斤八兩

它倆都遠(yuǎn)不及 Qwen3.6 Plus(僅代表本人觀點,僅此測試用例感受)


簡介

M2.7 的核心亮點:

  • 模型自我進(jìn)化 :M2.7 能自主更新記憶、構(gòu)建技能、改進(jìn)學(xué)習(xí)流程,經(jīng)過 100+ 輪自主優(yōu)化,性能提升 30%

  • 專業(yè)軟件工程 :SWE-Pro 達(dá)到 56.22%,與 GPT-5.3-Codex 持平,生產(chǎn)環(huán)境事故恢復(fù)時間壓縮到 3 分鐘以內(nèi)

  • 專業(yè)辦公能力 :GDPval-AA ELO 1495,開源模型最高,Word/Excel/PPT 高保真多輪編輯

  • 原生 Agent Teams :支持多智能體協(xié)作,角色穩(wěn)定、自主決策

M2.7 模型技術(shù)規(guī)格藍(lán)圖

代碼能力號稱媲美 GPT-5.3-Codex


M2.7 基準(zhǔn)性能全景 部署方式:生態(tài)全面開花 M2.7 部署生態(tài)全景

成本是 230GB 起步,我覺得 2 張 H200 可能都勉強(qiáng),官方建議至少 4 張 H200


目前量化版本應(yīng)該都在加急中,截止此刻,還都只創(chuàng)建好了文件夾而已

按照以往 unSloth 的戰(zhàn)績,壓縮到幾十 GB 不是難事


MLE Bench Lite 自我進(jìn)化性能 Ollama

Ollama 最新版 已經(jīng)有 minimax-m2.7:cloud 可以免費使用了



M2.7 已登錄 Ollama 云端,商業(yè)許可可用

# 與 OpenClaw 一起使用
ollama launch openclaw --model minimax-m2.7:cloud


# 直接聊天
ollama run minimax-m2.7:cloud
Ollama 支持 MiniMax M2.7

這里要注意,目前 Ollama 上的 M2.7 走的是云端推理(:cloud 標(biāo)簽),原因是 230B 參數(shù)的 MoE 模型本地跑起來需要的顯存實在太大

等后續(xù)量化版出來,應(yīng)該會有本地可跑的版本

vLLM

vLLM 提供了 Day-0 支持,是目前最成熟的部署方案之一

# 基礎(chǔ)部署(4 卡 H200/H100/A100)
vllm serve MiniMaxAI/MiniMax-M2.7 \
--tensor-parallel-size 4 \
--tool-call-parser minimax_m2 \
--reasoning-parser minimax_m2 \
--compilation-config '{"mode":3,"pass_config":{"fuse_minimax_qk_norm":true}}' \
--enable-auto-tool-choice \
--trust-remote-code


# 8 卡部署(DP+EP 模式)
vllm serve MiniMaxAI/MiniMax-M2.7 \
--data-parallel-size 8 \
--enable-expert-parallel \
--tool-call-parser minimax_m2 \
--reasoning-parser minimax_m2 \
--enable-auto-tool-choice

Docker 一鍵啟動

docker run --gpus all \
-p 8000:8000 \
--ipc=host \
-v ~/.cache/huggingface:/root/.cache/huggingface \
vllm/vllm-openai:minimax27 MiniMaxAI/MiniMax-M2.7 \
--tensor-parallel-size 4 \
--tool-call-parser minimax_m2 \
--reasoning-parser minimax_m2 \
--enable-auto-tool-choice \
--trust-remote-code

vLLM 支持 NVIDIA 和 AMD 兩大平臺:

  • NVIDIA :4×H200/H100/A100 張量并行,或 8 卡 DP+EP/TP+EP 模式

  • AMD :2× 或 4× MI300X/MI325X/MI350X/MI355X,支持 AITER 加速

系統(tǒng)需求:權(quán)重需要約 220GB 顯存,每 100 萬上下文 token 額外需要 240GB。

SGLang

SGLang 同樣提供了 Day-0 支持

sglang serve \
--model-path MiniMaxAI/MiniMax-M2.7 \
--tp 4 \
--tool-call-parser minimax-m2 \
--reasoning-parser minimax-append-think \
--trust-remote-code \
--mem-fraction-static 0.85

SGLang 的一個特點是支持 Thinking 模式,通過 minimax-append-think 解析器,可以把思考過程和最終內(nèi)容分開展示。

快速測試部署是否成功:

curl http://localhost:30000/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "MiniMaxAI/MiniMax-M2.7",
"messages": [
{"role": "system", "content": [{"type": "text", "text": "You are a helpful assistant."}]},
{"role": "user", "content": [{"type": "text", "text": "Who won the world series in 2020?"}]}
]
}'

M2.7 在 SGLang 上的推薦推理參數(shù):temperature=1.0,top_p=0.95,top_k=40

NVIDIA 加持

NVIDIA 這次給了 MiniMax 很大的支持力度


NVIDIA 支持 MiniMax M2.7

GPU 加速端點:在 build.nvidia.com/minimaxai/minimax-m2.7 可以免費試用 M2.7

推理優(yōu)化:NVIDIA 和開源社區(qū)合作,為 vLLM 和 SGLang 做了兩個關(guān)鍵優(yōu)化:

  1. QK RMS Norm Kernel :將計算和通信操作融合到單個內(nèi)核中,減少了內(nèi)核啟動和顯存讀寫開銷

  2. FP8 MoE :集成了 TensorRT-LLM 的 FP8 MoE 模塊化內(nèi)核,專門針對 MoE 模型優(yōu)化

結(jié)果非常驚人——在 NVIDIA Blackwell Ultra GPU 上:

  • vLLM 吞吐量提升 2.5 倍 (一個月內(nèi)實現(xiàn))

  • SGLang 吞吐量提升 2.7 倍 (一個月內(nèi)實現(xiàn))

NemoClaw:NVIDIA 提供了開源參考棧 NemoClaw,一鍵部署 OpenClaw 持續(xù)運行助手

微調(diào)支持:通過 NeMo AutoModel 庫進(jìn)行后訓(xùn)練,支持 EP + PP 訓(xùn)練方案。NeMo RL 庫還提供了 GRPO 強(qiáng)化學(xué)習(xí)的樣例配方(8K 和 16K 序列長度)

微調(diào)配方:

# NeMo AutoModel 微調(diào)配方
https://github.com/NVIDIA-NeMo/Automodel/blob/main/examples/llm_finetune/minimax_m2/minimax_m2.7_hellaswag_pp.yaml


# 分布式訓(xùn)練文檔
https://github.com/NVIDIA-NeMo/Automodel/discussions/1786
Transformers

也可以用 HuggingFace Transformers 直接加載模型,參考 Transformers 部署指南 (huggingface.co/MiniMaxAI/MiniMax-M2.7/blob/main/docs/transformers_deploy_guide.md)

ModelScope

國內(nèi)用戶也可以從 ModelScope(modelscope.cn/models/MiniMax/MiniMax-M2.7) 下載模型權(quán)重

Tool Calling 和 Thinking 模式

M2.7 同時支持工具調(diào)用和思考模式,這讓它在 Agent 場景下更加靈活。

工具調(diào)用示例(以 SGLang 為例):

from openai import OpenAI

client = OpenAI(
base_url="http://localhost:30000/v1",
api_key="EMPTY"
)

tools = [
{
"type": "function",
"function": {
"name": "get_weather",
"description": "Get the current weather for a location",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city name"
}
},
"required": ["location"]
}
}
}
]

response = client.chat.completions.create(
model="MiniMaxAI/MiniMax-M2.7",
messages=[
{"role": "user", "content": "What's the weather in Beijing?"}
],
tools=tools
)

message = response.choices[0].message
if message.tool_calls:
for tool_call in message.tool_calls:
print(f"Tool Call: {tool_call.function.name}")
print(f" Arguments: {tool_call.function.arguments}")

Thinking 模式:通過 ... 標(biāo)簽把思考過程包裹在內(nèi)容中。在流式輸出場景下,可以實時解析這些標(biāo)簽,把思考和最終回答分開展示。

快速上手

如果你想快速體驗 M2.7,最簡單的方式:

方式一:API 調(diào)用

訪問 platform.minimax.io 注冊開發(fā)者賬號,通過 API 調(diào)用。

方式二:MiniMax Agent

訪問 agent.minimax.io 直接在線對話。

方式三:Ollama 云端

ollama run minimax-m2.7:cloud

方式四:NVIDIA 免費端點

訪問 build.nvidia.com/minimaxai/minimax-m2.7 在瀏覽器中直接測試。

.7

制作不易,如果這篇文章覺得對你有用,可否點個關(guān)注。給我個三連擊:點贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
B席:我花了很長時間才做出離隊決定,我只想好好結(jié)束這旅程

B席:我花了很長時間才做出離隊決定,我只想好好結(jié)束這旅程

懂球帝
2026-04-20 04:39:46
我媽93歲,獨居自理,她的長壽秘訣就六個字:別老想著走動!

我媽93歲,獨居自理,她的長壽秘訣就六個字:別老想著走動!

蟬吟槐蕊
2026-04-19 06:23:45
7中7!火箭遮羞布!可能是今夏離隊第一人

7中7!火箭遮羞布!可能是今夏離隊第一人

籃球?qū)崙?zhàn)寶典
2026-04-19 15:47:41
特朗普第一任期的白宮律師突然爆猛料:特朗普已經(jīng)撐不下去了

特朗普第一任期的白宮律師突然爆猛料:特朗普已經(jīng)撐不下去了

西樓知趣雜談
2026-04-19 21:25:23
畸形審美?這4位男演員長相平平,卻總當(dāng)主角演帥哥,實在不理解

畸形審美?這4位男演員長相平平,卻總當(dāng)主角演帥哥,實在不理解

史鹷的生活科普
2026-04-19 22:51:14
一個卡扣要換13萬電池包!國產(chǎn)這種售后,到外國會罰到懷疑人生!

一個卡扣要換13萬電池包!國產(chǎn)這種售后,到外國會罰到懷疑人生!

沙雕小琳琳
2026-04-19 12:32:36
(深入分析)特朗普已被逼到了懸崖邊上,因為中國擊中了其要害

(深入分析)特朗普已被逼到了懸崖邊上,因為中國擊中了其要害

阿胡
2025-04-12 11:30:46
1949年,解放軍打開馬鴻逵的倉庫,全都愣?。豪锩媸?286公斤羊毛

1949年,解放軍打開馬鴻逵的倉庫,全都愣?。豪锩媸?286公斤羊毛

野史日記
2026-04-18 21:00:03
真子公主低調(diào)慶祝孩子1周歲生日,離開王室5年未回日本,比哈里狠

真子公主低調(diào)慶祝孩子1周歲生日,離開王室5年未回日本,比哈里狠

毒舌小紅帽
2026-04-19 21:42:56
14歲被送上導(dǎo)演的床,17歲拍全裸寫真,被操控半生,如今怎樣了?

14歲被送上導(dǎo)演的床,17歲拍全裸寫真,被操控半生,如今怎樣了?

不似少年游
2026-04-17 19:31:49
一夜成名!張雪的岳父登上熱搜,被麻陽當(dāng)?shù)仡I(lǐng)導(dǎo)邀請參加騎行活動

一夜成名!張雪的岳父登上熱搜,被麻陽當(dāng)?shù)仡I(lǐng)導(dǎo)邀請參加騎行活動

火山詩話
2026-04-19 17:46:25
鹵菜店使用“四姐”二字被索賠50萬元,店主:大家都叫我四姐,為什么告我侵權(quán)

鹵菜店使用“四姐”二字被索賠50萬元,店主:大家都叫我四姐,為什么告我侵權(quán)

環(huán)球網(wǎng)資訊
2026-04-11 21:50:22
張柏芝三胎生父被封,coco再曝猛料謝賢名譽受損

張柏芝三胎生父被封,coco再曝猛料謝賢名譽受損

阿紵美食
2026-04-20 04:11:18
警惕:上了年紀(jì)再過性生活,最怕這2點!保護(hù)男性精氣,做好4點

警惕:上了年紀(jì)再過性生活,最怕這2點!保護(hù)男性精氣,做好4點

周哥一影視
2026-04-08 12:20:15
哈里梅根的全球身份危機(jī):這場高仿王室出訪,正在拖垮整個君主制

哈里梅根的全球身份危機(jī):這場高仿王室出訪,正在拖垮整個君主制

李Dog嗨
2026-04-19 22:51:40
別只盯著特朗普!美國為何總在制造沖突,背后是喂養(yǎng)怪物的饑渴?

別只盯著特朗普!美國為何總在制造沖突,背后是喂養(yǎng)怪物的饑渴?

星落山間
2026-04-19 12:15:00
第一次對「鋁箔紙」產(chǎn)生了敬意!以為烘焙專用,沒想到是家居神器

第一次對「鋁箔紙」產(chǎn)生了敬意!以為烘焙專用,沒想到是家居神器

裝修秀
2026-04-18 11:55:03
《八千里路云和月》朱管家想不到,算計田家泰家業(yè),卻成全了萬福

《八千里路云和月》朱管家想不到,算計田家泰家業(yè),卻成全了萬福

白淺娛樂聊
2026-04-19 12:37:15
一個家庭最大的悲哀,是父母年過70了,還在做三件事

一個家庭最大的悲哀,是父母年過70了,還在做三件事

大熊歡樂坊
2026-04-02 14:23:28
演員何潤東回應(yīng)穿項羽鎧甲亮相蘇超:14年后受邀過來,內(nèi)心滿是感動,等下去逛項王故里

演員何潤東回應(yīng)穿項羽鎧甲亮相蘇超:14年后受邀過來,內(nèi)心滿是感動,等下去逛項王故里

極目新聞
2026-04-19 10:17:37
2026-04-20 05:36:49
Ai學(xué)習(xí)的老章 incentive-icons
Ai學(xué)習(xí)的老章
Ai學(xué)習(xí)的老章
3334文章數(shù) 11137關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類紀(jì)錄!300臺機(jī)器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

何潤東漲粉百萬!內(nèi)娛隔空掀桌第一人

財經(jīng)要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

房產(chǎn)
教育
游戲
藝術(shù)
公開課

房產(chǎn)要聞

官宣簽約最強(qiáng)城更!??跇鞘校蝗粴⑷肷衩胤科?!

教育要聞

655家單位、1.29萬個崗位,湖南用心幫大學(xué)生找工作

如何將ZH-1火力最大化?《戰(zhàn)艦世界》15.3版本造船廠加點攻略

藝術(shù)要聞

超模施特洛耶克寫真曝光,簡直美到窒息,別錯過!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版