国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

神操作再現(xiàn),單卡3090 起跑!Claude-4.6-Opus蒸餾Qwen3.5-27B

0
分享至

,介紹了 TeichAI 將 Claude 的高階推理能力蒸餾進(jìn)大模型的操作。今天再來介紹兩個(gè)最新的硬核蒸餾模型,這次的主角換成了Qwen3.5-27B加上地表最強(qiáng)邏輯王之一的 Claude Opus 4.6

核心就是用 Claude Opus 4.6 的“思維鏈”(Chain-of-Thought, CoT)高質(zhì)量數(shù)據(jù),去重新訓(xùn)練(蒸餾) Qwen3.5-27B 這個(gè) 270 億參數(shù)的中等體量開源模型。不僅推理能力有了質(zhì)的飛躍,最關(guān)鍵的是:單張 RTX 3090 或 4090 就能輕松跑起來!

1. Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled

首先是 HuggingFace 用戶 Jackrong 做的開源版本,短短幾天已經(jīng)在社區(qū)狂攬數(shù)萬次下載量。

它的訓(xùn)練理念極其純粹:利用 Unsloth 框架,配合 LoRA(Rank=64),使用大概 3,280 條極高質(zhì)量的 Claude Opus 4.6 推理數(shù)據(jù)進(jìn)行監(jiān)督微調(diào)(SFT)。有趣的是,作者使用了train_on_responses_only策略——強(qiáng)迫模型的 Loss 函數(shù)只在 思考過程和最終答案上計(jì)算,完全屏蔽了中間的任務(wù)要求。借此逼著模型去死磕和模仿 Claude 那種深度結(jié)構(gòu)化思考模式。


https://huggingface.co/Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled

模型在推理時(shí),會(huì)主動(dòng)開啟思維鏈:

 

Let me analyze this request carefully:
1. Identify the core objective of the problem.
2. Break the task into clearly defined subcomponents.
3. Evaluate constraints and edge cases.
4. Formulate a step-by-step solution plan.
5. Execute the reasoning sequentially and verify consistency...


實(shí)測怎么跑最省錢?社區(qū)大佬分享,使用Q4_K_M量化版本:

  • 顯存占用只有約 16.5 GB,手捏 24G 顯存的 3090 老玩家毫無壓力!

  • 生成速度 29–35 tok/s,足夠絲滑。

  • 保留完整長上下文,沒有像早前一些劣質(zhì)微調(diào)那樣把注意力窗口閹割到 8k,它宣稱跑滿 262K 上下文沒有打折。

  • 修復(fù)了官方模型在 Jinja 模板里不支持developerrole 導(dǎo)致的崩潰

而且這模型跟 AI 代碼智能體框架(如 Claude Code、OpenCode)天生一對,支持原生developer角色。實(shí)測中,它可以全自動(dòng)在后臺(tái)跑上 9 分鐘,看報(bào)錯(cuò)、修代碼、寫 README 一氣呵成,連中途死機(jī)卡頓的幾率都大幅降低。

2. TeichAI/Qwen3.5-27B-Claude-Opus-4.6-Distill

上次我們提過的“模型煉丹師” TeichAI 也沒有閑著,幾乎同時(shí)發(fā)布了同系列的高質(zhì)量底模。他們同樣基于unsloth/Qwen3.5-27B為基座,配合自己的過濾版數(shù)據(jù)集進(jìn)行調(diào)教。


https://huggingface.co/TeichAI/Qwen3.5-27B-Claude-Opus-4.6-Distill

相比其他的傻瓜包,TeichAI 非常貼心地給出了實(shí)戰(zhàn)跑模型的超參保姆級指南

  • 普通任務(wù)(思考模式):溫度調(diào)滿 1.0,Top_P 0.95,Min_P 0.0,可以極大限度激發(fā) AI 創(chuàng)意推理。

  • 寫代碼/Web 開發(fā)(高精度防胡說模式):溫度降到 0.6,同時(shí)存在懲罰(presence_penalty)設(shè)為 0.0,讓它死死咬住你的邏輯不跑偏。

  • 輸出長度建議:普通對話放開到 32,768 tokens,如果是高難度編程競賽題,直接拉滿到 81,920 tokens,給思維鏈留下足夠揮灑的空間。

下圖就是模型卡里的對比圖:


TeichAI Benchmark

從模型卡里的表格看,TeichAI/Qwen3.5-27B-Claude-Opus-4.6-Distill相比unsloth/Qwen3.5-27B,至少在下面這些指標(biāo)上是有提升的:


蒸餾的得與失

所以你會(huì)發(fā)現(xiàn),這條線其實(shí)已經(jīng)不是單點(diǎn)開花了,而是在慢慢形成一個(gè)“Claude reasoning distill 數(shù)據(jù)集 + Qwen 底座 + Unsloth 微調(diào)”的公開玩法。

萬事皆有代價(jià),享受了極強(qiáng)的單體思維能力,也要承受某些缺失。原版 Qwen3.5-27B 的多模態(tài)技能在這些微調(diào)版上蕩然無存,這類蒸餾版目前專攻純代碼、純數(shù)學(xué)計(jì)算和重度邏輯推理場景。再加上由于是早期發(fā)布,相關(guān)的 prompt 模板生態(tài)還不算完美,偶爾可能會(huì)有些排版錯(cuò)位的外殼 bug。

感興趣可以去弄個(gè) GGUF 跑跑,看它是不是真的能平替掉某些時(shí)候昂貴的云端 API。

-Opus

制作不易,如果這篇文章覺得對你有用,可否點(diǎn)個(gè)關(guān)注。給我個(gè)三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個(gè),謝謝你看我的文章,我們下篇再見!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
被盜國保琉璃在閑魚被公開售賣,標(biāo)價(jià)3.6萬,閑魚回應(yīng):積極主動(dòng)配合警方;涉事店鋪的商品均已下架

被盜國保琉璃在閑魚被公開售賣,標(biāo)價(jià)3.6萬,閑魚回應(yīng):積極主動(dòng)配合警方;涉事店鋪的商品均已下架

瀟湘晨報(bào)
2026-03-13 16:23:25
你見過哪些婚前作死行為?網(wǎng)友:新娘不出聲,視為默認(rèn)、贊同

你見過哪些婚前作死行為?網(wǎng)友:新娘不出聲,視為默認(rèn)、贊同

解讀熱點(diǎn)事件
2026-03-13 00:05:08
這一次的伊朗戰(zhàn)爭,是軍事史上的里程碑!

這一次的伊朗戰(zhàn)爭,是軍事史上的里程碑!

從前這些事
2026-03-11 07:32:06
75歲有8個(gè)男朋友?凌晨在北京去世?劉曉慶身上的標(biāo)簽太離譜了

75歲有8個(gè)男朋友?凌晨在北京去世?劉曉慶身上的標(biāo)簽太離譜了

可樂談情感
2026-03-13 00:08:39
事關(guān)供暖!鄭州熱力最新發(fā)布

事關(guān)供暖!鄭州熱力最新發(fā)布

大象新聞
2026-03-13 16:25:04
紀(jì)念孫中山逝世101周年,鄭麗文:臺(tái)灣不應(yīng)成被動(dòng)接受命運(yùn)的擺布

紀(jì)念孫中山逝世101周年,鄭麗文:臺(tái)灣不應(yīng)成被動(dòng)接受命運(yùn)的擺布

海峽導(dǎo)報(bào)社
2026-03-12 17:22:15
伊朗新任最高領(lǐng)袖感謝伊朗人民

伊朗新任最高領(lǐng)袖感謝伊朗人民

界面新聞
2026-03-12 22:00:00
鄭薇淘汰的人,被宮魯鳴重用當(dāng)隊(duì)長,半場0分,球迷:又菜又裝!

鄭薇淘汰的人,被宮魯鳴重用當(dāng)隊(duì)長,半場0分,球迷:又菜又裝!

我就是一個(gè)說球的
2026-03-12 22:18:36
1978年以來日本首次!高市早苗宣布:將單獨(dú)釋放石油儲(chǔ)備

1978年以來日本首次!高市早苗宣布:將單獨(dú)釋放石油儲(chǔ)備

白淺娛樂聊
2026-03-13 00:01:27
廣西突發(fā)重刑案4死1傷:51歲兇手被扒,全過程披露,真實(shí)原因曝光

廣西突發(fā)重刑案4死1傷:51歲兇手被扒,全過程披露,真實(shí)原因曝光

博士觀察
2026-03-13 00:09:00
武大誣告學(xué)弟的楊某某考上公務(wù)員!竟是自導(dǎo)自演的鬧劇,引發(fā)眾怒

武大誣告學(xué)弟的楊某某考上公務(wù)員!竟是自導(dǎo)自演的鬧劇,引發(fā)眾怒

火山詩話
2026-03-13 07:09:55
煙再次被關(guān)注!醫(yī)生研究發(fā)現(xiàn):吸得越多,壽命或越長?告訴你真相

煙再次被關(guān)注!醫(yī)生研究發(fā)現(xiàn):吸得越多,壽命或越長?告訴你真相

今日養(yǎng)生之道
2026-03-13 15:28:38
最后一小時(shí),為何突然大跳水?

最后一小時(shí),為何突然大跳水?

萌生財(cái)經(jīng)
2026-03-13 16:56:02
伊朗革命衛(wèi)隊(duì)稱對美第五艦隊(duì)基地發(fā)動(dòng)襲擊

伊朗革命衛(wèi)隊(duì)稱對美第五艦隊(duì)基地發(fā)動(dòng)襲擊

中國網(wǎng)
2026-03-13 07:25:02
美國走進(jìn)伊朗戰(zhàn)爭死胡同,全球新4強(qiáng)鼎立局面或?qū)⑿纬?>
    </a>
        <h3>
      <a href=史政先鋒
2026-03-13 17:13:19
刷爆紀(jì)錄!約基奇31+20+12連續(xù)3場三雙 190次三雙歷史第二人

刷爆紀(jì)錄!約基奇31+20+12連續(xù)3場三雙 190次三雙歷史第二人

醉臥浮生
2026-03-13 11:36:44
美以對伊朗狂轟濫炸第10天,特朗普居然主動(dòng)把電話打到了莫斯科

美以對伊朗狂轟濫炸第10天,特朗普居然主動(dòng)把電話打到了莫斯科

阿七說史
2026-03-12 16:19:07
韓先楚做營長時(shí),他就是已軍長,但三十年后,他卻成了韓的下級

韓先楚做營長時(shí),他就是已軍長,但三十年后,他卻成了韓的下級

史之銘
2026-03-13 16:56:25
揚(yáng)州女司機(jī)挨打后續(xù)!交警已跟進(jìn),一巴掌賠了3W,女方底細(xì)被扒光

揚(yáng)州女司機(jī)挨打后續(xù)!交警已跟進(jìn),一巴掌賠了3W,女方底細(xì)被扒光

社會(huì)日日鮮
2026-03-13 03:26:44
生死時(shí)速72小時(shí),營救伊朗女球員

生死時(shí)速72小時(shí),營救伊朗女球員

家傳編輯部
2026-03-12 11:07:56
2026-03-13 19:27:00
Ai學(xué)習(xí)的老章 incentive-icons
Ai學(xué)習(xí)的老章
Ai學(xué)習(xí)的老章
3269文章數(shù) 11093關(guān)注度
往期回顧 全部

科技要聞

龍蝦熱卷到AI硬件 “無腦”硬件或被淘汰

頭條要聞

47歲男子娶82歲老太 還硬塞1000元和20個(gè)雞蛋當(dāng)彩禮

頭條要聞

47歲男子娶82歲老太 還硬塞1000元和20個(gè)雞蛋當(dāng)彩禮

體育要聞

叕戰(zhàn)奧運(yùn),張雨霏要做回“小將”

娛樂要聞

小S復(fù)工錄制 感謝賈永婕陪大S走到最后

財(cái)經(jīng)要聞

2月M2同增9% 前兩個(gè)月存款增加9.26萬億

汽車要聞

大眾汽車與小鵬首款聯(lián)合開發(fā)車型與眾08正式量產(chǎn)

態(tài)度原創(chuàng)

教育
游戲
時(shí)尚
本地
軍事航空

教育要聞

軍校報(bào)考核心真相:別只看分?jǐn)?shù)!軍種選對,人生少走 10 年彎路!#軍校##志愿填報(bào)##新學(xué)期超給力#...

決非故意!團(tuán)隊(duì)回應(yīng)漫威爭鋒女性皮膚過分性感問題

直播|| 最近超愛的兩只包,好用到天天背

本地新聞

坐標(biāo)北京,過敏季反向遷徒

軍事要聞

伊朗稱襲擊"林肯"號航母致其撤走

無障礙瀏覽 進(jìn)入關(guān)懷版