国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

實(shí)測 Claude-Opus-4.6蒸餾版Qwen3.5,9B 已能打,用LM-Studio本地跑,對接 Claude Code

0
分享至

Qwen3.5 系列繼續(xù):

上篇文章介紹了 Jackrong 和 TeichAI 兩個團(tuán)隊(duì)做的 Claude Opus 4.6 蒸餾版 Qwen3.5-27B,發(fā)完之后好多網(wǎng)友在評論區(qū)催我:光說不練假把式,能不能實(shí)際跑一下?

今天就拿 Jackrong 放出的GGUF 量化版,用 LM Studio 在本地實(shí)測一把,看看這個號稱"平替 Opus"的蒸餾模型到底幾斤幾兩。


我選擇 Jackrong 的版本,原因無他,開發(fā)者用腳投票,它曾經(jīng)登錄過 Huggingface 熱榜第一


熱榜第一.png

2B、9B、27B、35B 都有,豐儉由人了可以說

其中 2B 版本模型文件只有 2GB


https://modelscope.cn/models/Jackrong/Qwen3.5-2B-Claude-4.6-Opus-Reasoning-Distilled-GGUF

Q4_K_M 只有 1.2GB


這個大家別試了,很多任務(wù)都無法完成,給他現(xiàn)成的 Skills 也不行


接入到 Claude Code


它花了 8 分鐘才找全可用 skills,指定了也無法完全調(diào)用


一定要說優(yōu)點(diǎn):它是 256K 上下文,而且有 Vision 能力,生成速度 40+t/s


還有它翻譯還可以


也不精神錯亂


9B 版本 6GB

我是 16G 的 MacMini M4

所以本文只測試了 2B 和 9B

我建議大家能力尚可 從 27B 開始,我的機(jī)器其實(shí)也可以上 27B Q3,但是下載,測試,太耗時了,我?guī)缀醢胩於己脑跍y試了,時長氣的腦仁疼


35-A3B 36GB,這也是為何它干不過 27B 的原因之一


為什么選 GGUF + LM Studio?

GGUF是目前本地部署大模型最主流的格式,基于 llama.cpp 生態(tài),對 CPU 和消費(fèi)級 GPU 都非常友好。相比原始的 safetensors 權(quán)重動輒 50+GB,GGUF 量化后最低 10GB 就能跑 27B 模型,這才是我們普通玩家的菜。

LM Studio就不用多介紹了吧,之前專門寫過一篇

一句話概括:圖形界面一鍵下載運(yùn)行 + OpenAI/Anthropic 雙兼容 API + CLI 命令行 + 遠(yuǎn)程 LM Link,從小白到開發(fā)者全覆蓋。

用它來測模型,門檻最低、體驗(yàn)最好

模型概覽

Jackrong 在 HuggingFace 上放出了27B完整的 GGUF 量化家族:

量化版本

文件大小

顯存占用(估算)

推薦場景

Q2_K

10.1 GB

~12 GB

極致省內(nèi)存,精度有損

Q3_K_S

12.1 GB

~14 GB

內(nèi)存緊張時的折中選擇

Q3_K_M

13.3 GB

~15 GB

Q3 里精度最好的

Q4_K_S

15.6 GB

~17 GB

性價(jià)比之選

Q4_K_M

16.5 GB

~18 GB

精度與體積最佳平衡Q8_0

28.6 GB

~30 GB

追求精度,顯存充裕時用

社區(qū)大佬 @ 在單卡 RTX 3090(24GB 顯存)上實(shí)測 Q4_K_M 版本的數(shù)據(jù):

  • 顯存占用約 16.5 GB,3090/4090 毫無壓力

  • 生成速度 29–35 tok/s,日常使用足夠絲滑

  • 完整保留 262K 上下文窗口,沒有打折

  • 修復(fù)了官方模型 Jinja 模板不支持developerrole 的崩潰問題

我的建議:閉眼選 Q4_K_M。24GB 顯存的卡(3090/4090)輕松裝下,精度損失可以忽略。如果你是 Mac 用戶,統(tǒng)一內(nèi)存 32GB 以上也能跑。

本文測試 9B 實(shí)屬無奈

Jackrong 的蒸餾版有什么特別的?

回顧一下上篇文章講過的核心要點(diǎn)

這個模型的訓(xùn)練方法很"暴力":

  1. 數(shù)據(jù)來源:大約 3,280 條高質(zhì)量的 Claude Opus 4.6 推理數(shù)據(jù),外加 TeichAI 和 Jackrong 自己整理的補(bǔ)充數(shù)據(jù)集

  2. 訓(xùn)練策略train_on_responses_only——Loss 只在 思考過程和最終答案上計(jì)算,逼模型去模仿 Claude 那種深度結(jié)構(gòu)化思考

  3. 微調(diào)方式:Unsloth + LoRA(Rank=64),非常高效

蒸餾完的模型在推理時會主動展開思維鏈:

 

Let me analyze this request carefully:
1. Identify the core objective of the problem.
2. Break the task into clearly defined subcomponents.
3. Evaluate constraints and edge cases.
4. Formulate a step-by-step solution plan.
5. Execute the reasoning sequentially and verify consistency...


和原版 Qwen3.5-27B 容易在簡單問題上"繞圈子"不同,這個蒸餾版學(xué)到了 Claude 的風(fēng)格——先分析、再拆解、再執(zhí)行,推理效率明顯更高。

而且社區(qū)測試發(fā)現(xiàn),它在 AI 代碼智能體場景(Claude Code、OpenCode)中表現(xiàn)極其穩(wěn)定:連續(xù)自主運(yùn)行超過 9 分鐘不中斷,能自動讀報(bào)錯、改代碼、寫 README,中途不卡頓不死機(jī)。

這一點(diǎn)確實(shí)可以,2B/9B 版都能做到。

原版模型在這種場景下經(jīng)常半途卡住,差距很明顯。

LM Studio 部署步驟

用 LM Studio 跑這個模型,總共就三步:

第一步:下載模型

打開 LM Studio,在搜索欄直接搜索Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF,或者在 Discover 頁面找到它。


如果你更喜歡命令行,也可以用lmsCLI:

lms get Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF --file Qwen3.5-9B.Q4_K_M.gguf

或者用 huggingface-cli 手動下載到 LM Studio 的模型目錄:

huggingface-cli download Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF \
--include "Qwen3.5-9B.Q4_K_M.gguf" \
--local-dir ~/.cache/lm-studio/models/Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF

網(wǎng)絡(luò)不通可以使用 modelscope

pip install modelcope
modelscope download --model Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF Qwen3.5-9B.Q4_K_M.gguf --local_dir ~/.cache/lm-studio/models/Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF


第二步:加載模型

下載完成后,在 LM Studio 左側(cè)模型列表中找到它,點(diǎn)擊加載

加載時建議調(diào)整幾個參數(shù):

  • GPU Offload:拉滿(如果你有獨(dú)立 GPU)

  • Context Length:先設(shè) 8192 或 16384 試試,夠用再加,我上 262144

  • Max Concurrent Predictions:保持默認(rèn) 1 即可

第三步:開聊

加載完成后直接在 Chat 界面對話

模型會自動啟用思維鏈模式,你會看到 ... 標(biāo)簽包裹的推理過程。

我用看家測試題目,背影閱讀理解+svg 代碼生成+審美測試題測它

令我吃驚的是,它完全可以理解到


就是速度差點(diǎn)意思,13t/s

這是曾經(jīng)一種旗艦?zāi)P投伎赡芑F盧的


生成的 svg 也只能說能看吧


進(jìn)階:當(dāng) API 服務(wù)器用

LM Studio 加載模型后,點(diǎn)擊左側(cè)的Developer標(biāo)簽,開啟本地服務(wù)器(默認(rèn)端口 1234)。然后你就能用 OpenAI SDK 直接調(diào)用:

from openai import OpenAI

client = OpenAI(
base_url="http://localhost:1234/v1",
api_key="lmstudio"
)

response = client.chat.completions.create(
model="Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF",
messages=[
{"role": "user", "content": "用Python寫一個LRU緩存,要求線程安全"}
],
temperature=0.6,
top_p=0.95,
max_tokens=8192
)

print(response.choices[0].message.content)

甚至可以直接對接 Claude Code:

    "ANTHROPIC_AUTH_TOKEN": "lm-studio-local",
"ANTHROPIC_BASE_URL": "http://localhost:1234",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "qwen3.5-9b-claude-4.6-opus-reasoning-distilled",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "qwen3.5-9b-claude-4.6-opus-reasoning-distilled",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "qwen3.5-9b-claude-4.6-opus-reasoning-distilled",
"ANTHROPIC_MODEL": "qwen3.5-9b-claude-4.6-opus-reasoning-distilled"

本地蒸餾模型驅(qū)動 Claude Code,白嫖到底,就問你香不香。


工具調(diào)用能力

請?jiān)诋?dāng)前目錄下創(chuàng)建一個名為 debug_test.py 的 Python 腳本,代碼內(nèi)容是計(jì)算 1 到 10
的平均值,但請?jiān)诖a中故意留下一個邏輯錯誤(比如除以 或者變量名寫錯)。接著運(yùn)行這個腳本,捕獲錯誤日志,分析原因并自動修復(fù)它,最后再次運(yùn)行以確保輸出正確的平均值

結(jié)果write_file、run_shell_command、read_file、write_file、run_shell_command一路下來都是 ok 的


能不能干點(diǎn)稍微重點(diǎn)的活兒呢?

有點(diǎn)難,比如查找 skills 調(diào)用 skills

看起來是瞎編的


本地有的 他也要 web search


除非你特殊強(qiáng)調(diào)


它很慢,又特別能思考,我實(shí)在沒有精力等下去了,一下午荒廢了。。。

算是幫大家踩過了,看的腦仁疼

總結(jié)

可以玩玩,但是能力有限,需要勞心費(fèi)神

或許 27B 會好很多,至少評論區(qū)這么說

再挖個坑吧


-Opus .5

制作不易,如果這篇文章覺得對你有用,可否點(diǎn)個關(guān)注。給我個三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗宣布對所有商船開放霍爾木茲海峽,美維持對伊海上封鎖,伊朗議長:特朗普7項(xiàng)聲明“均不屬實(shí)”

伊朗宣布對所有商船開放霍爾木茲海峽,美維持對伊海上封鎖,伊朗議長:特朗普7項(xiàng)聲明“均不屬實(shí)”

縱相新聞
2026-04-18 12:36:03
突然“值錢了”!不少人家里都有,專家提醒:別賣!

突然“值錢了”!不少人家里都有,專家提醒:別賣!

劉哥談體育
2026-04-19 21:40:06
王偉中對俄羅斯后貝加爾邊疆區(qū)交通事故作出批示

王偉中對俄羅斯后貝加爾邊疆區(qū)交通事故作出批示

澎湃新聞
2026-04-19 13:55:05
不裝了賴清德、馬英九暴露真面目!國民黨發(fā)甲級動員,想決一死戰(zhàn)

不裝了賴清德、馬英九暴露真面目!國民黨發(fā)甲級動員,想決一死戰(zhàn)

青梅侃史啊
2026-04-19 19:17:48
中小學(xué)生上課時間大調(diào)整:9點(diǎn)上課或成新規(guī),周六上課引家長熱議

中小學(xué)生上課時間大調(diào)整:9點(diǎn)上課或成新規(guī),周六上課引家長熱議

復(fù)轉(zhuǎn)這些年
2026-04-18 12:47:43
美國全世界逛一圈才發(fā)現(xiàn),自己扶持所有小弟里,最能打的還是老蔣

美國全世界逛一圈才發(fā)現(xiàn),自己扶持所有小弟里,最能打的還是老蔣

呼呼體壇
2026-04-19 18:26:54
局勢生變,全球接到消息,美軍全部撤離,所有軍事基地被敘國接管

局勢生變,全球接到消息,美軍全部撤離,所有軍事基地被敘國接管

聞識
2026-04-19 21:08:29
美國證實(shí)!伊朗最高領(lǐng)袖“已受傷但仍活著”,伊朗方面此前稱穆杰塔巴·哈梅內(nèi)伊身體健康 ,但因戰(zhàn)爭推遲公開露面

美國證實(shí)!伊朗最高領(lǐng)袖“已受傷但仍活著”,伊朗方面此前稱穆杰塔巴·哈梅內(nèi)伊身體健康 ,但因戰(zhàn)爭推遲公開露面

每日經(jīng)濟(jì)新聞
2026-04-16 23:06:57
曼城羅德里傷病令人擔(dān)憂,瓜迪奧拉給出更新

曼城羅德里傷病令人擔(dān)憂,瓜迪奧拉給出更新

綠茵情報(bào)局
2026-04-20 04:22:15
研究表明,中學(xué)生的抑郁率已高達(dá)36%!

研究表明,中學(xué)生的抑郁率已高達(dá)36%!

黯泉
2026-04-18 18:06:01
《八千里路云和月》朱管家想不到,算計(jì)田家泰家業(yè),卻成全了萬福

《八千里路云和月》朱管家想不到,算計(jì)田家泰家業(yè),卻成全了萬福

白淺娛樂聊
2026-04-19 12:37:15
難怪能成為大明星,小時候居然這么漂亮!大家看出來她是誰了嗎?

難怪能成為大明星,小時候居然這么漂亮!大家看出來她是誰了嗎?

阿廢冷眼觀察所
2026-04-19 22:13:42
國產(chǎn)光纖全球“爆單”:部分產(chǎn)品價(jià)格暴漲650%

國產(chǎn)光纖全球“爆單”:部分產(chǎn)品價(jià)格暴漲650%

環(huán)球網(wǎng)資訊
2026-04-19 11:16:14
身材纖細(xì)、體態(tài)修長的日本業(yè)界骨感美人·TOP10

身材纖細(xì)、體態(tài)修長的日本業(yè)界骨感美人·TOP10

吃瓜黨二號頭目
2026-04-19 09:58:57
神替補(bǔ)!桑喬兩次送禮,鴨脖救主,維拉先被絕平又反絕殺,太刺激

神替補(bǔ)!桑喬兩次送禮,鴨脖救主,維拉先被絕平又反絕殺,太刺激

硬腿子聊個球
2026-04-19 22:58:51
真給力!5月1日起,65歲老人坐公交全省都免費(fèi) 福建老人幸福感拉滿

真給力!5月1日起,65歲老人坐公交全省都免費(fèi) 福建老人幸福感拉滿

今日搞笑分享
2026-04-19 16:37:15
第一次對「鋁箔紙」產(chǎn)生了敬意!以為烘焙專用,沒想到是家居神器

第一次對「鋁箔紙」產(chǎn)生了敬意!以為烘焙專用,沒想到是家居神器

裝修秀
2026-04-18 11:55:03
莫蘭特灰熊時代終章:從天之驕子到無人問津的墜落

莫蘭特灰熊時代終章:從天之驕子到無人問津的墜落

漫川舟船
2026-04-19 15:03:30
打蛇打七寸!中國全面斷供開始,日本多行業(yè)停擺,高市真慌了

打蛇打七寸!中國全面斷供開始,日本多行業(yè)停擺,高市真慌了

有你便是晴天呢
2026-04-19 09:27:13
吃相太難看!莫氏雞煲爆火后,惡心一幕出現(xiàn),終走上呆呆妹的老路

吃相太難看!莫氏雞煲爆火后,惡心一幕出現(xiàn),終走上呆呆妹的老路

以茶帶書
2026-04-15 17:30:12
2026-04-20 07:12:49
Ai學(xué)習(xí)的老章 incentive-icons
Ai學(xué)習(xí)的老章
Ai學(xué)習(xí)的老章
3334文章數(shù) 11137關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類紀(jì)錄!300臺機(jī)器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

何潤東漲粉百萬!內(nèi)娛隔空掀桌第一人

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

數(shù)碼
時尚
旅游
房產(chǎn)
軍事航空

數(shù)碼要聞

華為新機(jī)發(fā)布前瞻:闊折疊X Max+影像旗艦Pura 90,都沒懸念了

裝修“精神角落”,就是這么上癮

旅游要聞

小浪底庫區(qū)南北兩岸游線通航

房產(chǎn)要聞

官宣簽約最強(qiáng)城更!??跇鞘?,突然殺入神秘房企!

軍事要聞

伊朗逼退美掃雷艇:美方求給15分鐘撤退

無障礙瀏覽 進(jìn)入關(guān)懷版