国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

在 Mac 上微調(diào)一切大模型

0
分享至

聊個(gè)讓我非常興奮的項(xiàng)目——mlx-tune

一句話(huà)概括:在你的 Mac 上,用 Unsloth 的 API 微調(diào)一切

LLM、視覺(jué)模型、TTS、STT、OCR、Embedding,全都能在 Apple Silicon 上本地微調(diào)

Mac 用戶(hù)的微調(diào)困境

做大模型微調(diào)的同學(xué)應(yīng)該都有過(guò)這種體驗(yàn):想在本地跑個(gè)小實(shí)驗(yàn)驗(yàn)證下 idea,結(jié)果發(fā)現(xiàn) Unsloth 依賴(lài) Triton,而 Triton 不支持 Mac

于是你只剩兩條路:

  1. 1. 花錢(qián)開(kāi)云 GPU —— 就跑個(gè) 100 條數(shù)據(jù)的實(shí)驗(yàn),有必要嗎?

  2. 2. 用 mlx-lm 原生 API —— 但代碼和 完全不兼容,到了云上還得重寫(xiě)一遍

mlx-tune(github.com/ARahim3/mlx-tune)的作者也遇到了一模一樣的問(wèn)題

他的解決思路非常簡(jiǎn)單粗暴:把 MLX 包裝成 Unsloth 的 API

你在 Mac 上寫(xiě)的訓(xùn)練腳本,換個(gè) import 就能直接在 CUDA 集群跑

# Unsloth (CUDA)                        # MLX-Tune (Apple Silicon)
from unsloth import FastLanguageModel from mlx_tune import FastLanguageModel
from trl import SFTTrainer from mlx_tune import SFTTrainer


# 后面的代碼一模一樣!

這才是真正解決問(wèn)題的設(shè)計(jì)

下面這張圖清楚展示了 mlx-tune 的工作流——本地原型驗(yàn)證,改個(gè) import 就能上云訓(xùn)練:


功能有多全?看完嚇一跳

它支持的訓(xùn)練方法比很多正經(jīng)公司的內(nèi)部工具都全:

語(yǔ)言模型訓(xùn)練:

  • ? SFT :基礎(chǔ)指令微調(diào),這是最常用的

  • ? DPO / ORPO / KTO / SimPO :各種偏好學(xué)習(xí)方法全覆蓋

  • ? GRPO :DeepSeek R1 風(fēng)格的多生成 + 獎(jiǎng)勵(lì)訓(xùn)練

  • ? CPT :持續(xù)預(yù)訓(xùn)練,支持解耦學(xué)習(xí)率

多模態(tài)訓(xùn)練:

  • ? Vision :支持 Gemma 4、Qwen3.5、PaliGemma、LLaVA、Pixtral 等 VLM 微調(diào)

  • ? TTS :Orpheus、OuteTTS、Spark-TTS、Sesame/CSM、Qwen3-TTS 五個(gè) TTS 模型

  • ? STT :Whisper、Moonshine、Qwen3-ASR、NVIDIA Canary、Voxtral 五個(gè) STT 模型

  • ? Embedding :BERT、ModernBERT、Qwen3-Embedding、Harrier,支持對(duì)比學(xué)習(xí)

  • ? OCR :DeepSeek-OCR、GLM-OCR、olmOCR、Qwen-VL,內(nèi)置 CER/WER 指標(biāo)

進(jìn)階能力:

  • ? MoE 微調(diào) :支持 39+ 種 MoE 架構(gòu),包括 Qwen3.5-35B、Mixtral、DeepSeek 系列

  • ? Gemma 4 Audio :12 層 Conformer 音頻塔,原生處理 16kHz 音頻

  • ? LFM2 :Liquid AI 的混合卷積+GQA 架構(gòu)

說(shuō)真的,一個(gè)社區(qū)項(xiàng)目做到這個(gè)程度,相當(dāng)離譜

全景架構(gòu)一覽——從 API 到硬件的五層設(shè)計(jì):


快速上手

安裝很簡(jiǎn)單,推薦用 uv:

# 標(biāo)準(zhǔn)安裝
uv pip install mlx-tune


# 帶音頻支持
uv pip install 'mlx-tune[audio]'
brew install ffmpeg

來(lái)個(gè)最基礎(chǔ)的 SFT 微調(diào)示例:

from mlx_tune import FastLanguageModel, SFTTrainer, SFTConfig
from datasets import load_dataset

# 加載模型(4bit 量化,省顯存)
model, tokenizer = FastLanguageModel.from_pretrained(
model_name="mlx-community/Llama-3.2-1B-Instruct-4bit",
max_seq_length=2048,
load_in_4bit=True,
)

# 加 LoRA
model = FastLanguageModel.get_peft_model(
model,
r=16,
target_modules=["q_proj", "k_proj", "v_proj", "o_proj"],
lora_alpha=16,
)

# 加載數(shù)據(jù)集
dataset = load_dataset("yahma/alpaca-cleaned", split="train[:100]")

# 訓(xùn)練
trainer = SFTTrainer(
model=model,
train_dataset=dataset,
tokenizer=tokenizer,
args=SFTConfig(
output_dir="outputs",
per_device_train_batch_size=2,
learning_rate=2e-4,
max_steps=50,
),
)
trainer.train()

# 保存:三種格式隨你選
model.save_pretrained("lora_model") # LoRA 適配器
model.save_pretrained_merged("merged", tokenizer) # 合并后的完整模型
model.save_pretrained_gguf("model", tokenizer) # GGUF 格式,直接給 Ollama 用

如果你用過(guò) Unsloth,這代碼看著是不是特別眼熟?對(duì),就是同一套 API

視覺(jué)模型微調(diào)

VLM 微調(diào)也是同樣簡(jiǎn)潔的體驗(yàn):

from mlx_tune import FastVisionModel, UnslothVisionDataCollator, VLMSFTTrainer
from mlx_tune.vlm import VLMSFTConfig

model, processor = FastVisionModel.from_pretrained(
"mlx-community/Qwen3.5-0.8B-bf16",
)

model = FastVisionModel.get_peft_model(
model,
finetune_vision_layers=True, # 視覺(jué)層也微調(diào)
finetune_language_layers=True,
r=16, lora_alpha=16,
)

# 訓(xùn)練(數(shù)據(jù)集格式和 Unsloth 一致)
FastVisionModel.for_training(model)
trainer = VLMSFTTrainer(
model=model,
tokenizer=processor,
data_collator=UnslothVisionDataCollator(model, processor),
train_dataset=dataset,
args=VLMSFTConfig(max_steps=30, learning_rate=2e-4),
)
trainer.train()

Gemma 4、Qwen3.5、PaliGemma、LLaVA、Pixtral 都支持

你甚至可以用 Vision GRPO 來(lái)訓(xùn)練視覺(jué)推理能力

TTS 微調(diào):在 Mac 上克隆聲音

這個(gè)功能我覺(jué)得特別有意思——在 Mac 上本地微調(diào) TTS 模型:

from mlx_tune import FastTTSModel, TTSSFTTrainer, TTSSFTConfig, TTSDataCollator
from datasets import load_dataset, Audio

# 自動(dòng)檢測(cè)模型類(lèi)型、編碼器和 token 格式
model, tokenizer = FastTTSModel.from_pretrained(
"mlx-community/orpheus-3b-0.1-ft-bf16"
)
model = FastTTSModel.get_peft_model(model, r=16, lora_alpha=16)

dataset = load_dataset("MrDragonFox/Elise", split="train[:100]")
dataset = dataset.cast_column("audio", Audio(sampling_rate=24000))

trainer = TTSSFTTrainer(
model=model, tokenizer=tokenizer,
data_collator=TTSDataCollator(model, tokenizer),
train_dataset=dataset,
args=TTSSFTConfig(output_dir="./tts_output", max_steps=60),
)
trainer.train()

Orpheus、OuteTTS、Spark-TTS、Sesame/CSM、Qwen3-TTS 都支持

想做聲音克隆或者風(fēng)格化 TTS,再也不用租 GPU 了

工作流全景

mlx-tune 的定位非常清晰:本地原型 → 云端量產(chǎn)。

本地 Mac (mlx-tune)              云端 GPU (Unsloth)
├── 快速實(shí)驗(yàn) ├── 大規(guī)模訓(xùn)練
├── 小數(shù)據(jù)集驗(yàn)證 ├── 完整數(shù)據(jù)集
├── 秒級(jí)迭代 ├── 生產(chǎn)級(jí)優(yōu)化
└── 同一套代碼 ─────────────────── └── 同一套代碼

訓(xùn)練完還能直接導(dǎo)出:

  • ? HuggingFace 格式 :標(biāo)準(zhǔn)保存

  • ? GGUF :直接丟給 Ollama / llama.cpp

  • ? push_to_hub :一鍵推到 HuggingFace Hub

它適合誰(shuí)?

我覺(jué)得 mlx-tune 最適合這幾類(lèi)人:

  1. 1. Mac 用戶(hù) + 微調(diào)需求 :你有 M1/M2/M3/M4/M5,想在本地跑微調(diào)實(shí)驗(yàn),這是最佳選擇

  2. 2. 混合工作流用戶(hù) :本地調(diào)試、云端訓(xùn)練,代碼無(wú)縫遷移

  3. 3. 多模態(tài)探索者 :想同時(shí)玩 LLM、Vision、TTS、STT、OCR 微調(diào)的人

  4. 4. 學(xué)習(xí)者 :想理解微調(diào)原理,在本地快速迭代比去 Colab 排隊(duì)強(qiáng)太多

局限性也得說(shuō)清楚:

  • ? 訓(xùn)練速度肯定比不上 A100 + Unsloth,這是物理定律決定的

  • ? GGUF 導(dǎo)出對(duì)量化模型有限制,建議用非量化基座模型

  • ? 內(nèi)存受限于 Mac 的統(tǒng)一內(nèi)存(不過(guò) Mac Studio 最高 512GB,夠用了)

如果你是 Mac 用戶(hù),又對(duì)微調(diào)大模型感興趣,強(qiáng)烈建議試試

制作不易,如果這篇文章覺(jué)得對(duì)你有用,可否點(diǎn)個(gè)關(guān)注。給我個(gè)三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個(gè),謝謝你看我的文章,我們下篇再見(jiàn)!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗宣布對(duì)所有商船開(kāi)放霍爾木茲海峽,美維持對(duì)伊海上封鎖,伊朗議長(zhǎng):特朗普7項(xiàng)聲明“均不屬實(shí)”

伊朗宣布對(duì)所有商船開(kāi)放霍爾木茲海峽,美維持對(duì)伊海上封鎖,伊朗議長(zhǎng):特朗普7項(xiàng)聲明“均不屬實(shí)”

縱相新聞
2026-04-18 12:36:03
突然“值錢(qián)了”!不少人家里都有,專(zhuān)家提醒:別賣(mài)!

突然“值錢(qián)了”!不少人家里都有,專(zhuān)家提醒:別賣(mài)!

劉哥談體育
2026-04-19 21:40:06
王偉中對(duì)俄羅斯后貝加爾邊疆區(qū)交通事故作出批示

王偉中對(duì)俄羅斯后貝加爾邊疆區(qū)交通事故作出批示

澎湃新聞
2026-04-19 13:55:05
不裝了賴(lài)清德、馬英九暴露真面目!國(guó)民黨發(fā)甲級(jí)動(dòng)員,想決一死戰(zhàn)

不裝了賴(lài)清德、馬英九暴露真面目!國(guó)民黨發(fā)甲級(jí)動(dòng)員,想決一死戰(zhàn)

青梅侃史啊
2026-04-19 19:17:48
中小學(xué)生上課時(shí)間大調(diào)整:9點(diǎn)上課或成新規(guī),周六上課引家長(zhǎng)熱議

中小學(xué)生上課時(shí)間大調(diào)整:9點(diǎn)上課或成新規(guī),周六上課引家長(zhǎng)熱議

復(fù)轉(zhuǎn)這些年
2026-04-18 12:47:43
美國(guó)全世界逛一圈才發(fā)現(xiàn),自己扶持所有小弟里,最能打的還是老蔣

美國(guó)全世界逛一圈才發(fā)現(xiàn),自己扶持所有小弟里,最能打的還是老蔣

呼呼體壇
2026-04-19 18:26:54
局勢(shì)生變,全球接到消息,美軍全部撤離,所有軍事基地被敘國(guó)接管

局勢(shì)生變,全球接到消息,美軍全部撤離,所有軍事基地被敘國(guó)接管

聞識(shí)
2026-04-19 21:08:29
美國(guó)證實(shí)!伊朗最高領(lǐng)袖“已受傷但仍活著”,伊朗方面此前稱(chēng)穆杰塔巴·哈梅內(nèi)伊身體健康 ,但因戰(zhàn)爭(zhēng)推遲公開(kāi)露面

美國(guó)證實(shí)!伊朗最高領(lǐng)袖“已受傷但仍活著”,伊朗方面此前稱(chēng)穆杰塔巴·哈梅內(nèi)伊身體健康 ,但因戰(zhàn)爭(zhēng)推遲公開(kāi)露面

每日經(jīng)濟(jì)新聞
2026-04-16 23:06:57
曼城羅德里傷病令人擔(dān)憂(yōu),瓜迪奧拉給出更新

曼城羅德里傷病令人擔(dān)憂(yōu),瓜迪奧拉給出更新

綠茵情報(bào)局
2026-04-20 04:22:15
研究表明,中學(xué)生的抑郁率已高達(dá)36%!

研究表明,中學(xué)生的抑郁率已高達(dá)36%!

黯泉
2026-04-18 18:06:01
《八千里路云和月》朱管家想不到,算計(jì)田家泰家業(yè),卻成全了萬(wàn)福

《八千里路云和月》朱管家想不到,算計(jì)田家泰家業(yè),卻成全了萬(wàn)福

白淺娛樂(lè)聊
2026-04-19 12:37:15
難怪能成為大明星,小時(shí)候居然這么漂亮!大家看出來(lái)她是誰(shuí)了嗎?

難怪能成為大明星,小時(shí)候居然這么漂亮!大家看出來(lái)她是誰(shuí)了嗎?

阿廢冷眼觀察所
2026-04-19 22:13:42
國(guó)產(chǎn)光纖全球“爆單”:部分產(chǎn)品價(jià)格暴漲650%

國(guó)產(chǎn)光纖全球“爆單”:部分產(chǎn)品價(jià)格暴漲650%

環(huán)球網(wǎng)資訊
2026-04-19 11:16:14
身材纖細(xì)、體態(tài)修長(zhǎng)的日本業(yè)界骨感美人·TOP10

身材纖細(xì)、體態(tài)修長(zhǎng)的日本業(yè)界骨感美人·TOP10

吃瓜黨二號(hào)頭目
2026-04-19 09:58:57
神替補(bǔ)!桑喬兩次送禮,鴨脖救主,維拉先被絕平又反絕殺,太刺激

神替補(bǔ)!桑喬兩次送禮,鴨脖救主,維拉先被絕平又反絕殺,太刺激

硬腿子聊個(gè)球
2026-04-19 22:58:51
真給力!5月1日起,65歲老人坐公交全省都免費(fèi) 福建老人幸福感拉滿(mǎn)

真給力!5月1日起,65歲老人坐公交全省都免費(fèi) 福建老人幸福感拉滿(mǎn)

今日搞笑分享
2026-04-19 16:37:15
第一次對(duì)「鋁箔紙」產(chǎn)生了敬意!以為烘焙專(zhuān)用,沒(méi)想到是家居神器

第一次對(duì)「鋁箔紙」產(chǎn)生了敬意!以為烘焙專(zhuān)用,沒(méi)想到是家居神器

裝修秀
2026-04-18 11:55:03
莫蘭特灰熊時(shí)代終章:從天之驕子到無(wú)人問(wèn)津的墜落

莫蘭特灰熊時(shí)代終章:從天之驕子到無(wú)人問(wèn)津的墜落

漫川舟船
2026-04-19 15:03:30
打蛇打七寸!中國(guó)全面斷供開(kāi)始,日本多行業(yè)停擺,高市真慌了

打蛇打七寸!中國(guó)全面斷供開(kāi)始,日本多行業(yè)停擺,高市真慌了

有你便是晴天呢
2026-04-19 09:27:13
吃相太難看!莫氏雞煲爆火后,惡心一幕出現(xiàn),終走上呆呆妹的老路

吃相太難看!莫氏雞煲爆火后,惡心一幕出現(xiàn),終走上呆呆妹的老路

以茶帶書(shū)
2026-04-15 17:30:12
2026-04-20 07:12:49
Ai學(xué)習(xí)的老章 incentive-icons
Ai學(xué)習(xí)的老章
Ai學(xué)習(xí)的老章
3334文章數(shù) 11137關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類(lèi)紀(jì)錄!300臺(tái)機(jī)器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒(méi)法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒(méi)法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂(lè)要聞

何潤(rùn)東漲粉百萬(wàn)!內(nèi)娛隔空掀桌第一人

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車(chē)要聞

29分鐘大定破萬(wàn) 極氪8X為什么這么多人買(mǎi)?

態(tài)度原創(chuàng)

游戲
旅游
手機(jī)
公開(kāi)課
軍事航空

"二次元GTA"直播爆了:疑似貼臉嘲諷其他二游!

旅游要聞

小浪底庫(kù)區(qū)南北兩岸游線通航

手機(jī)要聞

8.8英寸小鋼炮!REDMI K Pad 2核心配置揭曉

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗逼退美掃雷艇:美方求給15分鐘撤退

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版