国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Mac跑MiniMax-M2.7,2條路徑對(duì)比

0
分享至

今天聊一個(gè)很多 Mac 用戶關(guān)心的問(wèn)題:MiniMax-M2.7 怎么在 Mac 上跑起來(lái)?

MiniMax-M2.7 是什么來(lái)頭?

先簡(jiǎn)單回顧一下

M2.7 是 MiniMax 最新的開(kāi)源大模型,MoE 架構(gòu),總參數(shù) 228.7B,每 token 激活約 10B 參數(shù),192K 上下文

這貨最亮眼的幾個(gè)數(shù)據(jù):

  • **SWE-Pro 56.22%**,和 GPT-5.3-Codex 打平

  • MLE Bench Lite 66.6%獎(jiǎng)牌率,僅次于 Opus-4.6 和 GPT-5.4

  • 原生支持 Agent Teams,多智能體協(xié)作

  • Always-reasoning 模式,始終開(kāi)啟思考鏈

問(wèn)題是——228B 參數(shù),普通人怎么跑?答案是量化。但 MiniMax 的量化比一般模型坑多得多

為什么標(biāo)準(zhǔn)量化在 MiniMax 上翻車?

這是寫這篇文章最想說(shuō)的一件事:標(biāo)準(zhǔn) MLX 均勻量化在 MiniMax-M2.7 上完全失效——MMLU 直接降到 ~25%,基本等于隨機(jī)猜

原因在于 MoE 架構(gòu)的路由器(Router Gate)

均勻量化連路由器一起壓了,導(dǎo)致 token 被分配到錯(cuò)誤的專家上,整個(gè)模型就廢了

所以 Mac 用戶想跑 M2.7,目前只有兩條靠譜的路

路徑一:JANGTQ + MLX Studio(推薦?。?/p>

JANGTQ(JANG TurboQuant)是目前最小體積、最高質(zhì)量的 M2.7 Apple Silicon 量化方案,來(lái)自 JANGQ-AI 團(tuán)隊(duì)

核心思路:混合精度量化。路由專家 MLP(占 98% 參數(shù))用 2-bit codebook + Hadamard 旋轉(zhuǎn)壓縮,而 Attention、共享專家、Router Gate 保持 8-bit 或 fp16。


硬核數(shù)據(jù):

指標(biāo)

數(shù)值

磁盤占用

56.5 GB

GPU 顯存

56.5 GB

MMLU(200題)

91.5%

速度(M3 Ultra)

~44 tok/s

你沒(méi)看錯(cuò)——2-bit 量化,只要 56.5GB,MMLU 居然能打到 91.5%。對(duì)比標(biāo)準(zhǔn) MLX 量化的 ~25%,這差距簡(jiǎn)直是天壤之別

怎么跑:

最簡(jiǎn)單的方式是用 MLX Studio(內(nèi)置了 JANGTQ 運(yùn)行時(shí)和 Metal 內(nèi)核):

命令行方式也行:

pip install jang-tools

from huggingface_hub import snapshot_download
from jang_tools.load_jangtq import load_jangtq_model
from mlx_lm import generate

model_path = snapshot_download("JANGQ-AI/MiniMax-M2.7-JANGTQ")
model, tokenizer = load_jangtq_model(model_path)

messages = [{"role": "user", "content": "用5句話解釋光合作用"}]
prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True, tokenize=False)
out = generate(model, tokenizer, prompt, max_tokens=600, verbose=True)

# 剝離推理鏈獲取最終答案
if""in out:
out = out.split("")[-1].strip()
print(out)

硬件要求:

機(jī)器

最低內(nèi)存

預(yù)期速度

M3 Ultra / M2 Ultra

96 GB

~44 tok/s

M4 Max

96 GB

~35-40 tok/s

M4 Pro

64 GB

~25-30 tok/s(非常緊張)

64GB 的 M4 Pro 理論上能跑,但會(huì)很緊張

96GB 是比較舒服的起點(diǎn)

路徑二:LM Studio + GGUF(最省心)

如果你就想點(diǎn)幾下鼠標(biāo)就開(kāi)跑,LM Studio 是最簡(jiǎn)單的選擇。

LM Studio 已經(jīng)上線了 MiniMax-M2.7 的 GGUF 版本,基于 llama.cpp b8778 量化。

使用步驟:

  1. 下載安裝 LM Studio:https://lmstudio.ai/download

  2. 搜索minimax/minimax-m2.7

  3. 選擇量化版本下載

  4. 設(shè)置參數(shù):Temperature=1.0(必須?。op K=40、Top P=0.95

  5. 開(kāi)始對(duì)話

GGUF 來(lái)源是lmstudio-community/MiniMax-M2.7-GGUF。如果追求更好的量化質(zhì)量,Unsloth 提供了 22 個(gè) Dynamic 2.0 量化版本,逐層差異化量化,質(zhì)量全面優(yōu)于標(biāo)準(zhǔn) imatrix。

但有個(gè)大問(wèn)題:LM Studio 官方標(biāo)注最低系統(tǒng)內(nèi)存 138GB

兩條路徑,怎么選?
兩條路徑對(duì)比

維度

JANGTQ + MLX Studio

LM Studio / GGUF

最小磁盤

56.5 GB

~108 GB

最低內(nèi)存

64 GB

138 GB

MMLU 質(zhì)量

91.5%

~64-65%(4-bit)

速度(M3 Ultra)

~44 tok/s

待測(cè)

易用性

需安裝 jang-tools

開(kāi)箱即用

生態(tài)兼容

MLX 生態(tài)

OpenAI 兼容 API

我的建議:

  • 96GB 以下的 Mac→ 只能走 JANGTQ,別無(wú)選擇

  • 128GB+ 且需要 OpenAI 兼容 API→ LM Studio / GGUF 更方便

  • 追求最佳質(zhì)量→ JANGTQ 碾壓,2-bit 打 4-bit,這個(gè)結(jié)果說(shuō)實(shí)話我也很意外

?? 關(guān)鍵設(shè)置提醒

不管走哪條路,這幾個(gè)參數(shù)必須注意:

  1. Temperature 必須設(shè) 1.0—— temp=0 會(huì)導(dǎo)致思考鏈死循環(huán),模型會(huì)一直 下去停不了

  2. max_tokens ≥ 8192—— Always-reasoning 模型的思考過(guò)程需要足夠空間

  3. 內(nèi)存必須大于模型文件大小—— 否則回退到硬盤卸載,速度斷崖式下降

總結(jié)

MiniMax-M2.7 在 Mac 上的本地部署,JANGTQ 是目前當(dāng)之無(wú)愧的最優(yōu)解——體積最小、質(zhì)量最高。2-bit 量化能拿到 91.5% MMLU,這在我寫過(guò)的所有量化方案里都算炸裂級(jí)別的。

LM Studio 勝在省心和生態(tài)兼容,但內(nèi)存門檻太高。

如果你手上有一臺(tái) 96GB+ 的 Mac,強(qiáng)烈建議先試試 JANGTQ

56.5GB 下載完就能跑,44 tok/s 的速度日常使用完全夠了。

.7

制作不易,如果這篇文章覺(jué)得對(duì)你有用,可否點(diǎn)個(gè)關(guān)注。給我個(gè)三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個(gè),謝謝你看我的文章,我們下篇再見(jiàn)!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗宣布對(duì)所有商船開(kāi)放霍爾木茲海峽,美維持對(duì)伊海上封鎖,伊朗議長(zhǎng):特朗普7項(xiàng)聲明“均不屬實(shí)”

伊朗宣布對(duì)所有商船開(kāi)放霍爾木茲海峽,美維持對(duì)伊海上封鎖,伊朗議長(zhǎng):特朗普7項(xiàng)聲明“均不屬實(shí)”

縱相新聞
2026-04-18 12:36:03
突然“值錢了”!不少人家里都有,專家提醒:別賣!

突然“值錢了”!不少人家里都有,專家提醒:別賣!

劉哥談體育
2026-04-19 21:40:06
王偉中對(duì)俄羅斯后貝加爾邊疆區(qū)交通事故作出批示

王偉中對(duì)俄羅斯后貝加爾邊疆區(qū)交通事故作出批示

澎湃新聞
2026-04-19 13:55:05
不裝了賴清德、馬英九暴露真面目!國(guó)民黨發(fā)甲級(jí)動(dòng)員,想決一死戰(zhàn)

不裝了賴清德、馬英九暴露真面目!國(guó)民黨發(fā)甲級(jí)動(dòng)員,想決一死戰(zhàn)

青梅侃史啊
2026-04-19 19:17:48
中小學(xué)生上課時(shí)間大調(diào)整:9點(diǎn)上課或成新規(guī),周六上課引家長(zhǎng)熱議

中小學(xué)生上課時(shí)間大調(diào)整:9點(diǎn)上課或成新規(guī),周六上課引家長(zhǎng)熱議

復(fù)轉(zhuǎn)這些年
2026-04-18 12:47:43
美國(guó)全世界逛一圈才發(fā)現(xiàn),自己扶持所有小弟里,最能打的還是老蔣

美國(guó)全世界逛一圈才發(fā)現(xiàn),自己扶持所有小弟里,最能打的還是老蔣

呼呼體壇
2026-04-19 18:26:54
局勢(shì)生變,全球接到消息,美軍全部撤離,所有軍事基地被敘國(guó)接管

局勢(shì)生變,全球接到消息,美軍全部撤離,所有軍事基地被敘國(guó)接管

聞識(shí)
2026-04-19 21:08:29
美國(guó)證實(shí)!伊朗最高領(lǐng)袖“已受傷但仍活著”,伊朗方面此前稱穆杰塔巴·哈梅內(nèi)伊身體健康 ,但因戰(zhàn)爭(zhēng)推遲公開(kāi)露面

美國(guó)證實(shí)!伊朗最高領(lǐng)袖“已受傷但仍活著”,伊朗方面此前稱穆杰塔巴·哈梅內(nèi)伊身體健康 ,但因戰(zhàn)爭(zhēng)推遲公開(kāi)露面

每日經(jīng)濟(jì)新聞
2026-04-16 23:06:57
曼城羅德里傷病令人擔(dān)憂,瓜迪奧拉給出更新

曼城羅德里傷病令人擔(dān)憂,瓜迪奧拉給出更新

綠茵情報(bào)局
2026-04-20 04:22:15
研究表明,中學(xué)生的抑郁率已高達(dá)36%!

研究表明,中學(xué)生的抑郁率已高達(dá)36%!

黯泉
2026-04-18 18:06:01
《八千里路云和月》朱管家想不到,算計(jì)田家泰家業(yè),卻成全了萬(wàn)福

《八千里路云和月》朱管家想不到,算計(jì)田家泰家業(yè),卻成全了萬(wàn)福

白淺娛樂(lè)聊
2026-04-19 12:37:15
難怪能成為大明星,小時(shí)候居然這么漂亮!大家看出來(lái)她是誰(shuí)了嗎?

難怪能成為大明星,小時(shí)候居然這么漂亮!大家看出來(lái)她是誰(shuí)了嗎?

阿廢冷眼觀察所
2026-04-19 22:13:42
國(guó)產(chǎn)光纖全球“爆單”:部分產(chǎn)品價(jià)格暴漲650%

國(guó)產(chǎn)光纖全球“爆單”:部分產(chǎn)品價(jià)格暴漲650%

環(huán)球網(wǎng)資訊
2026-04-19 11:16:14
身材纖細(xì)、體態(tài)修長(zhǎng)的日本業(yè)界骨感美人·TOP10

身材纖細(xì)、體態(tài)修長(zhǎng)的日本業(yè)界骨感美人·TOP10

吃瓜黨二號(hào)頭目
2026-04-19 09:58:57
神替補(bǔ)!桑喬兩次送禮,鴨脖救主,維拉先被絕平又反絕殺,太刺激

神替補(bǔ)!桑喬兩次送禮,鴨脖救主,維拉先被絕平又反絕殺,太刺激

硬腿子聊個(gè)球
2026-04-19 22:58:51
真給力!5月1日起,65歲老人坐公交全省都免費(fèi) 福建老人幸福感拉滿

真給力!5月1日起,65歲老人坐公交全省都免費(fèi) 福建老人幸福感拉滿

今日搞笑分享
2026-04-19 16:37:15
第一次對(duì)「鋁箔紙」產(chǎn)生了敬意!以為烘焙專用,沒(méi)想到是家居神器

第一次對(duì)「鋁箔紙」產(chǎn)生了敬意!以為烘焙專用,沒(méi)想到是家居神器

裝修秀
2026-04-18 11:55:03
莫蘭特灰熊時(shí)代終章:從天之驕子到無(wú)人問(wèn)津的墜落

莫蘭特灰熊時(shí)代終章:從天之驕子到無(wú)人問(wèn)津的墜落

漫川舟船
2026-04-19 15:03:30
打蛇打七寸!中國(guó)全面斷供開(kāi)始,日本多行業(yè)停擺,高市真慌了

打蛇打七寸!中國(guó)全面斷供開(kāi)始,日本多行業(yè)停擺,高市真慌了

有你便是晴天呢
2026-04-19 09:27:13
吃相太難看!莫氏雞煲爆火后,惡心一幕出現(xiàn),終走上呆呆妹的老路

吃相太難看!莫氏雞煲爆火后,惡心一幕出現(xiàn),終走上呆呆妹的老路

以茶帶書(shū)
2026-04-15 17:30:12
2026-04-20 07:12:49
Ai學(xué)習(xí)的老章 incentive-icons
Ai學(xué)習(xí)的老章
Ai學(xué)習(xí)的老章
3334文章數(shù) 11137關(guān)注度
往期回顧 全部

數(shù)碼要聞

內(nèi)存供應(yīng)短缺迫使蘋果推遲新Mac Studio與觸控屏MacBook Pro發(fā)布

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒(méi)法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒(méi)法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂(lè)要聞

何潤(rùn)東漲粉百萬(wàn)!內(nèi)娛隔空掀桌第一人

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

科技要聞

50分26秒破人類紀(jì)錄!300臺(tái)機(jī)器人狂飆半馬

汽車要聞

29分鐘大定破萬(wàn) 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
親子
健康
教育

藝術(shù)要聞

蒲華寫水仙,清健嫵媚

房產(chǎn)要聞

官宣簽約最強(qiáng)城更!??跇鞘校蝗粴⑷肷衩胤科螅?/h3>

親子要聞

孩子總打噴嚏、起疹子,時(shí)過(guò)敏嗎?

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

教育要聞

中國(guó)為什么不禁網(wǎng)絡(luò)游戲?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版