国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

實(shí)測(cè) Claude-Opus-4.6蒸餾版Qwen3.5,9B 已能打,用LM-Studio本地跑,對(duì)接 Claude Code

0
分享至

Qwen3.5 系列繼續(xù):

上篇文章介紹了 Jackrong 和 TeichAI 兩個(gè)團(tuán)隊(duì)做的 Claude Opus 4.6 蒸餾版 Qwen3.5-27B,發(fā)完之后好多網(wǎng)友在評(píng)論區(qū)催我:光說不練假把式,能不能實(shí)際跑一下?

今天就拿 Jackrong 放出的GGUF 量化版,用 LM Studio 在本地實(shí)測(cè)一把,看看這個(gè)號(hào)稱"平替 Opus"的蒸餾模型到底幾斤幾兩。


我選擇 Jackrong 的版本,原因無他,開發(fā)者用腳投票,它曾經(jīng)登錄過 Huggingface 熱榜第一


熱榜第一.png

2B、9B、27B、35B 都有,豐儉由人了可以說

其中 2B 版本模型文件只有 2GB


https://modelscope.cn/models/Jackrong/Qwen3.5-2B-Claude-4.6-Opus-Reasoning-Distilled-GGUF

Q4_K_M 只有 1.2GB


這個(gè)大家別試了,很多任務(wù)都無法完成,給他現(xiàn)成的 Skills 也不行


接入到 Claude Code


它花了 8 分鐘才找全可用 skills,指定了也無法完全調(diào)用


一定要說優(yōu)點(diǎn):它是 256K 上下文,而且有 Vision 能力,生成速度 40+t/s


還有它翻譯還可以


也不精神錯(cuò)亂


9B 版本 6GB

我是 16G 的 MacMini M4

所以本文只測(cè)試了 2B 和 9B

我建議大家能力尚可 從 27B 開始,我的機(jī)器其實(shí)也可以上 27B Q3,但是下載,測(cè)試,太耗時(shí)了,我?guī)缀醢胩於己脑跍y(cè)試了,時(shí)長氣的腦仁疼


35-A3B 36GB,這也是為何它干不過 27B 的原因之一


為什么選 GGUF + LM Studio?

GGUF是目前本地部署大模型最主流的格式,基于 llama.cpp 生態(tài),對(duì) CPU 和消費(fèi)級(jí) GPU 都非常友好。相比原始的 safetensors 權(quán)重動(dòng)輒 50+GB,GGUF 量化后最低 10GB 就能跑 27B 模型,這才是我們普通玩家的菜。

LM Studio就不用多介紹了吧,之前專門寫過一篇

一句話概括:圖形界面一鍵下載運(yùn)行 + OpenAI/Anthropic 雙兼容 API + CLI 命令行 + 遠(yuǎn)程 LM Link,從小白到開發(fā)者全覆蓋。

用它來測(cè)模型,門檻最低、體驗(yàn)最好

模型概覽

Jackrong 在 HuggingFace 上放出了27B完整的 GGUF 量化家族:

量化版本

文件大小

顯存占用(估算)

推薦場(chǎng)景

Q2_K

10.1 GB

~12 GB

極致省內(nèi)存,精度有損

Q3_K_S

12.1 GB

~14 GB

內(nèi)存緊張時(shí)的折中選擇

Q3_K_M

13.3 GB

~15 GB

Q3 里精度最好的

Q4_K_S

15.6 GB

~17 GB

性價(jià)比之選

Q4_K_M

16.5 GB

~18 GB

精度與體積最佳平衡Q8_0

28.6 GB

~30 GB

追求精度,顯存充裕時(shí)用

社區(qū)大佬 @ 在單卡 RTX 3090(24GB 顯存)上實(shí)測(cè) Q4_K_M 版本的數(shù)據(jù):

  • 顯存占用約 16.5 GB,3090/4090 毫無壓力

  • 生成速度 29–35 tok/s,日常使用足夠絲滑

  • 完整保留 262K 上下文窗口,沒有打折

  • 修復(fù)了官方模型 Jinja 模板不支持developerrole 的崩潰問題

我的建議:閉眼選 Q4_K_M。24GB 顯存的卡(3090/4090)輕松裝下,精度損失可以忽略。如果你是 Mac 用戶,統(tǒng)一內(nèi)存 32GB 以上也能跑。

本文測(cè)試 9B 實(shí)屬無奈

Jackrong 的蒸餾版有什么特別的?

回顧一下上篇文章講過的核心要點(diǎn)

這個(gè)模型的訓(xùn)練方法很"暴力":

  1. 數(shù)據(jù)來源:大約 3,280 條高質(zhì)量的 Claude Opus 4.6 推理數(shù)據(jù),外加 TeichAI 和 Jackrong 自己整理的補(bǔ)充數(shù)據(jù)集

  2. 訓(xùn)練策略train_on_responses_only——Loss 只在 思考過程和最終答案上計(jì)算,逼模型去模仿 Claude 那種深度結(jié)構(gòu)化思考

  3. 微調(diào)方式:Unsloth + LoRA(Rank=64),非常高效

蒸餾完的模型在推理時(shí)會(huì)主動(dòng)展開思維鏈:

 

Let me analyze this request carefully:
1. Identify the core objective of the problem.
2. Break the task into clearly defined subcomponents.
3. Evaluate constraints and edge cases.
4. Formulate a step-by-step solution plan.
5. Execute the reasoning sequentially and verify consistency...


和原版 Qwen3.5-27B 容易在簡單問題上"繞圈子"不同,這個(gè)蒸餾版學(xué)到了 Claude 的風(fēng)格——先分析、再拆解、再執(zhí)行,推理效率明顯更高。

而且社區(qū)測(cè)試發(fā)現(xiàn),它在 AI 代碼智能體場(chǎng)景(Claude Code、OpenCode)中表現(xiàn)極其穩(wěn)定:連續(xù)自主運(yùn)行超過 9 分鐘不中斷,能自動(dòng)讀報(bào)錯(cuò)、改代碼、寫 README,中途不卡頓不死機(jī)。

這一點(diǎn)確實(shí)可以,2B/9B 版都能做到。

原版模型在這種場(chǎng)景下經(jīng)常半途卡住,差距很明顯。

LM Studio 部署步驟

用 LM Studio 跑這個(gè)模型,總共就三步:

第一步:下載模型

打開 LM Studio,在搜索欄直接搜索Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF,或者在 Discover 頁面找到它。


如果你更喜歡命令行,也可以用lmsCLI:

lms get Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF --file Qwen3.5-9B.Q4_K_M.gguf

或者用 huggingface-cli 手動(dòng)下載到 LM Studio 的模型目錄:

huggingface-cli download Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF \
--include "Qwen3.5-9B.Q4_K_M.gguf" \
--local-dir ~/.cache/lm-studio/models/Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF

網(wǎng)絡(luò)不通可以使用 modelscope

pip install modelcope
modelscope download --model Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF Qwen3.5-9B.Q4_K_M.gguf --local_dir ~/.cache/lm-studio/models/Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF


第二步:加載模型

下載完成后,在 LM Studio 左側(cè)模型列表中找到它,點(diǎn)擊加載

加載時(shí)建議調(diào)整幾個(gè)參數(shù):

  • GPU Offload:拉滿(如果你有獨(dú)立 GPU)

  • Context Length:先設(shè) 8192 或 16384 試試,夠用再加,我上 262144

  • Max Concurrent Predictions:保持默認(rèn) 1 即可

第三步:開聊

加載完成后直接在 Chat 界面對(duì)話

模型會(huì)自動(dòng)啟用思維鏈模式,你會(huì)看到 ... 標(biāo)簽包裹的推理過程。

我用看家測(cè)試題目,背影閱讀理解+svg 代碼生成+審美測(cè)試題測(cè)它

令我吃驚的是,它完全可以理解到


就是速度差點(diǎn)意思,13t/s

這是曾經(jīng)一種旗艦?zāi)P投伎赡芑F盧的


生成的 svg 也只能說能看吧


進(jìn)階:當(dāng) API 服務(wù)器用

LM Studio 加載模型后,點(diǎn)擊左側(cè)的Developer標(biāo)簽,開啟本地服務(wù)器(默認(rèn)端口 1234)。然后你就能用 OpenAI SDK 直接調(diào)用:

from openai import OpenAI

client = OpenAI(
base_url="http://localhost:1234/v1",
api_key="lmstudio"
)

response = client.chat.completions.create(
model="Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF",
messages=[
{"role": "user", "content": "用Python寫一個(gè)LRU緩存,要求線程安全"}
],
temperature=0.6,
top_p=0.95,
max_tokens=8192
)

print(response.choices[0].message.content)

甚至可以直接對(duì)接 Claude Code:

    "ANTHROPIC_AUTH_TOKEN": "lm-studio-local",
"ANTHROPIC_BASE_URL": "http://localhost:1234",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "qwen3.5-9b-claude-4.6-opus-reasoning-distilled",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "qwen3.5-9b-claude-4.6-opus-reasoning-distilled",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "qwen3.5-9b-claude-4.6-opus-reasoning-distilled",
"ANTHROPIC_MODEL": "qwen3.5-9b-claude-4.6-opus-reasoning-distilled"

本地蒸餾模型驅(qū)動(dòng) Claude Code,白嫖到底,就問你香不香。


工具調(diào)用能力

請(qǐng)?jiān)诋?dāng)前目錄下創(chuàng)建一個(gè)名為 debug_test.py 的 Python 腳本,代碼內(nèi)容是計(jì)算 1 到 10
的平均值,但請(qǐng)?jiān)诖a中故意留下一個(gè)邏輯錯(cuò)誤(比如除以 或者變量名寫錯(cuò))。接著運(yùn)行這個(gè)腳本,捕獲錯(cuò)誤日志,分析原因并自動(dòng)修復(fù)它,最后再次運(yùn)行以確保輸出正確的平均值

結(jié)果write_file、run_shell_command、read_file、write_file、run_shell_command一路下來都是 ok 的


能不能干點(diǎn)稍微重點(diǎn)的活兒呢?

有點(diǎn)難,比如查找 skills 調(diào)用 skills

看起來是瞎編的


本地有的 他也要 web search


除非你特殊強(qiáng)調(diào)


它很慢,又特別能思考,我實(shí)在沒有精力等下去了,一下午荒廢了。。。

算是幫大家踩過了,看的腦仁疼

總結(jié)

可以玩玩,但是能力有限,需要?jiǎng)谛馁M(fèi)神

或許 27B 會(huì)好很多,至少評(píng)論區(qū)這么說

再挖個(gè)坑吧


-Opus .5

制作不易,如果這篇文章覺得對(duì)你有用,可否點(diǎn)個(gè)關(guān)注。給我個(gè)三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個(gè),謝謝你看我的文章,我們下篇再見!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
張雪峰付幸多張合影被扒,每次團(tuán)建她都偷瞄張雪峰,眼神滿是崇拜

張雪峰付幸多張合影被扒,每次團(tuán)建她都偷瞄張雪峰,眼神滿是崇拜

古希臘掌管松餅的神
2026-03-26 16:52:30
一天蒸發(fā)6200億!谷歌算法黑科技擊潰存儲(chǔ)股,華爾街痛批市場(chǎng)“不懂技術(shù)”

一天蒸發(fā)6200億!谷歌算法黑科技擊潰存儲(chǔ)股,華爾街痛批市場(chǎng)“不懂技術(shù)”

每日經(jīng)濟(jì)新聞
2026-03-26 19:00:13
原油飆漲!黃金、白銀下跌,美股突變!特朗普威脅!霍爾木茲海峽,最新消息!

原油飆漲!黃金、白銀下跌,美股突變!特朗普威脅!霍爾木茲海峽,最新消息!

證券時(shí)報(bào)e公司
2026-03-26 22:23:23
伊朗掛斷王毅電話后發(fā)全球照會(huì),薩勒曼震怒

伊朗掛斷王毅電話后發(fā)全球照會(huì),薩勒曼震怒

空間展示知識(shí)
2026-03-26 07:06:58
為什么一定要多接高中孩子放學(xué)?這5個(gè)答案點(diǎn)醒無數(shù)家長

為什么一定要多接高中孩子放學(xué)?這5個(gè)答案點(diǎn)醒無數(shù)家長

戶外阿毽
2026-03-26 12:33:16
3-1奪冠!中國女乒29歲王牌復(fù)蘇:組最強(qiáng)豪陣劍指世乒賽

3-1奪冠!中國女乒29歲王牌復(fù)蘇:組最強(qiáng)豪陣劍指世乒賽

李喜林籃球絕殺
2026-03-26 20:29:48
我國癌癥高發(fā),電飯煲是“幫兇”?醫(yī)生:7種省錢行為要不得

我國癌癥高發(fā),電飯煲是“幫兇”?醫(yī)生:7種省錢行為要不得

大象新聞
2026-03-24 13:53:11
巴蒂:馬拉多納離世時(shí)身邊沒有人,最后走得像條狗一樣

巴蒂:馬拉多納離世時(shí)身邊沒有人,最后走得像條狗一樣

懂球帝
2026-03-26 06:43:02
白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

特約前排觀眾
2025-12-22 00:20:06
伊朗議長和外長被移出美以清除名單,“時(shí)限4到5天”!專家:若達(dá)成協(xié)議最慌的是以色列!特朗普:油價(jià)漲、股市跌,我無所謂

伊朗議長和外長被移出美以清除名單,“時(shí)限4到5天”!專家:若達(dá)成協(xié)議最慌的是以色列!特朗普:油價(jià)漲、股市跌,我無所謂

每日經(jīng)濟(jì)新聞
2026-03-26 12:20:14
iPhone4回收價(jià)暴漲80倍?借著二手手機(jī)漲價(jià)熱點(diǎn)的又一波瘋狂收割

iPhone4回收價(jià)暴漲80倍?借著二手手機(jī)漲價(jià)熱點(diǎn)的又一波瘋狂收割

柴狗夫斯基
2026-03-26 21:15:05
美容院老板娘大實(shí)話:脫了衣服,女人的差距根本不在臉上!

美容院老板娘大實(shí)話:脫了衣服,女人的差距根本不在臉上!

夜深愛雜談
2026-03-08 21:28:24
諾利托:盡管我曾效力于巴薩,但為了生活我也愿意效力于皇馬

諾利托:盡管我曾效力于巴薩,但為了生活我也愿意效力于皇馬

懂球帝
2026-03-26 22:42:03
惡毒詆毀張雪峰離世:千萬粉絲“留幾手”被罰!網(wǎng)友:應(yīng)永久封殺

惡毒詆毀張雪峰離世:千萬粉絲“留幾手”被罰!網(wǎng)友:應(yīng)永久封殺

影像溫度
2026-03-26 11:25:05
因禍得福!燒129年的地下火被滅,新疆憑空多了個(gè)“金飯碗”

因禍得福!燒129年的地下火被滅,新疆憑空多了個(gè)“金飯碗”

劉蕳愛下廚
2026-03-24 17:29:01
美股三大期指短線走低,納指期貨、標(biāo)普500指數(shù)期貨均跌超1%

美股三大期指短線走低,納指期貨、標(biāo)普500指數(shù)期貨均跌超1%

每日經(jīng)濟(jì)新聞
2026-03-26 20:18:05
中方警戒艦?zāi)壳罢幱诨魻柲酒澓{附近?國防部:假消息

中方警戒艦?zāi)壳罢幱诨魻柲酒澓{附近?國防部:假消息

環(huán)球網(wǎng)資訊
2026-03-26 16:20:07
Manus兩名高管禁止離境? 外交部回應(yīng)

Manus兩名高管禁止離境? 外交部回應(yīng)

每日經(jīng)濟(jì)新聞
2026-03-26 16:36:02
歐股、美股期貨全線下挫,美股芯片股、中概股盤前普跌,阿里巴巴跌超3%,原油拉升漲超3%

歐股、美股期貨全線下挫,美股芯片股、中概股盤前普跌,阿里巴巴跌超3%,原油拉升漲超3%

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-03-26 19:46:02
五枚導(dǎo)彈,攔下四枚,就那漏網(wǎng)的一枚,不偏不倚,正好砸中…

五枚導(dǎo)彈,攔下四枚,就那漏網(wǎng)的一枚,不偏不倚,正好砸中…

福建平子
2026-03-25 10:14:49
2026-03-27 03:39:00
Ai學(xué)習(xí)的老章 incentive-icons
Ai學(xué)習(xí)的老章
Ai學(xué)習(xí)的老章
3291文章數(shù) 11116關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

房產(chǎn)
數(shù)碼
健康
旅游
時(shí)尚

房產(chǎn)要聞

突發(fā),三亞又有大批征遷補(bǔ)償方案出爐!

數(shù)碼要聞

英特爾發(fā)Q1.26版Arc Pro專業(yè)顯卡驅(qū)動(dòng),支持B70 / B65顯卡

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

旅游要聞

河南開封萬歲山武俠城,游客買300元門票:給妻子拍照被保安阻攔

400萬人愛過的女孩,被黃謠網(wǎng)暴180天后

無障礙瀏覽 進(jìn)入關(guān)懷版