国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Qwen3-Next 實測,有點失望

0
分享至

大家好,我是 Ai 學(xué)習(xí)的老章

前文:,Qwen3-Next 的思考和指令兩個模型官方性能測試結(jié)果十分誘人。僅用 3B 活躍參數(shù)即可達(dá)到 DeepSeek V3.1 級別的智能水平


Qwen3 Next 80B(推理版)在 Qwen3 模型家族中智能程度排名第二,介于 Qwen3 235B 2507(推理版)與剛發(fā)布的 Qwen3-Max(預(yù)覽版,不使用推理)之間


我早就下好了完整模型文件 -160GB+


但是后來出了 FP8 量化版,模型文件大小減半,可裝入單張 H200 GPU

但是我用 0.10.2 版本的 vLLM 無論怎么改參數(shù)都部署失敗

無奈就還跑原版,2xH200 開跑

腳本如下:

docker run --rm -d --runtime nvidia  --name qwen3-next-tk-server  --ipc=host --gpus '"device=4,5"'  -p 8001:8000  -v /data/ai:/models vllm/vllm-openai:v0.10.2  --model /models/Qwen3-Next-80B-A3B-Thinking  --served-model-name qwen3-next-tk-fp8 --port 8000   --max-num-seqs 50 --max-model-len  131072  --tensor-parallel-size 2
[! 注意] 默認(rèn)上下文長度為 256K。如果遇到內(nèi)存不足(OOM)問題,可以考慮將上下文長度減少到更小的值。但是,由于模型可能需要更長的 token 序列進(jìn)行推理,我們強烈建議盡可能使用大于 131,072 的上下文長度。

ps:上下文上限跑起需要使用 4 張 H200/H20 或 4 張 A100/A800 GPU 來啟動,這里我減半到官方建議的 131072

每卡上模型加載 75GB,耗時 44 秒,KV Cache 49.5GB,峰值激活內(nèi)存 0.62GB,非 Torch 顯存占用 1.38GB,合計 126GB 的樣子

運行成功后接入 OpenWebUI,簡單測試了一下,略失望,原因有幾:

1 是首 token 響應(yīng)延遲,大幾秒的樣子才開始回復(fù)

2 是 think 標(biāo)簽缺失,導(dǎo)致整個思考過程無法被識別,直接被打印,而非可隱藏

原因阿里也有解釋:

[! 注意] Qwen3-Next-80B-A3B-Thinking 僅支持思考模式。為了強制模型進(jìn)行思考,默認(rèn)聊天模板自動包含 \ 。因此,模型的輸出只包含 \<\/think\> 而沒有顯式的 \ 標(biāo)簽是正常的。

我看魔塔社區(qū)也有網(wǎng)友在抱怨,不知道為啥 Qwen 要這么搞,與之前模型保持一致不好嗎?無故增加下游應(yīng)用適配成本


3 是思考過程非常、非常、非常長,長到時常會無限思考

原因阿里還是有解釋:

[! 注意] Qwen3-Next-80B-A3B-Thinking 可能會生成比其前身更長的思考內(nèi)容。我們強烈建議將其用于高度復(fù)雜的推理任務(wù)。

4 是并發(fā)太低了

啟動腳本設(shè)置了--max-num-seqs 50,但是我用測試工具跑了一下,由于前面三個問題,并發(fā)幾乎跑不起來,全是 error


5Qwen3-Next 也支持多詞元預(yù)測(簡稱 MTP),它既提升了預(yù)訓(xùn)練效率,也加快了推理速度。我試了一下,單請求快了點,但是上面四個問題都存在。

docker run --rm -d --runtime nvidia  --name qwen3-next-tk-server  --ipc=host --gpus '"device=4,5"'  -p 8001:8000  -v /data/ai:/models vllm/vllm-openai:v0.10.2  --model /models/Qwen3-Next-80B-A3B-Thinking  --served-model-name qwen3-next-tk-fp8 --port 8000   --max-num-seqs 50 --max-model-len  131072  --tensor-parallel-size 2 --speculative-config '{"method": "qwen3_next_mtp", "num_speculative_tokens": 2}'  --no-enable-chunked-prefill

哪位兄弟本地部署過Qwen3-Next-80B-A3B-Thinking,感受如何?

如有發(fā)現(xiàn)我的腳本有問題,歡迎提出,我還是有點不敢相信它會這么不堪。

或許它真就只適合高度復(fù)雜的推理任務(wù)?


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
為干掉越軍狙擊手,一戰(zhàn)士趴水坑40小時,忽見一塊石頭移動一下

為干掉越軍狙擊手,一戰(zhàn)士趴水坑40小時,忽見一塊石頭移動一下

云端小院
2025-12-25 09:12:15
徐開騁被曝新戀情牽手素人,舊賬未清遭全網(wǎng)質(zhì)疑,事業(yè)翻紅夢碎?

徐開騁被曝新戀情牽手素人,舊賬未清遭全網(wǎng)質(zhì)疑,事業(yè)翻紅夢碎?

娛樂領(lǐng)航家
2025-12-25 16:31:48
暴雨我開車送老局長去機場,處長譏諷:馬屁精,一年后我成一把手

暴雨我開車送老局長去機場,處長譏諷:馬屁精,一年后我成一把手

紅豆講堂
2025-12-22 13:35:09
登貝萊不滿出場時間過少,與巴黎圣日耳曼關(guān)系緊張

登貝萊不滿出場時間過少,與巴黎圣日耳曼關(guān)系緊張

星耀國際足壇
2025-12-24 23:37:56
高開低走,中國隊圍棋棋仙戰(zhàn)首輪4人晉級2人輸慘,16強對陣出爐

高開低走,中國隊圍棋棋仙戰(zhàn)首輪4人晉級2人輸慘,16強對陣出爐

真理是我親戚
2025-12-25 16:09:50
疑與城管隊員起爭執(zhí),福安一老人被推倒后離世?城管局工作人員:涉事隊員已停職,警方已介入

疑與城管隊員起爭執(zhí),福安一老人被推倒后離世?城管局工作人員:涉事隊員已停職,警方已介入

極目新聞
2025-12-25 19:02:44
越扒越心驚!南博黑幕只是冰山一角,聽泉不敢鑒寶才是真的膽寒了

越扒越心驚!南博黑幕只是冰山一角,聽泉不敢鑒寶才是真的膽寒了

鋭娛之樂
2025-12-23 13:34:23
養(yǎng)老院65歲大媽半夜哭喊下身疼,被送往急診,醫(yī)生檢查后:報警!

養(yǎng)老院65歲大媽半夜哭喊下身疼,被送往急診,醫(yī)生檢查后:報警!

第四思維
2025-09-02 09:31:36
京東001號快遞員已退休,勤懇工作16年,劉強東承諾的房給了嗎?

京東001號快遞員已退休,勤懇工作16年,劉強東承諾的房給了嗎?

阿纂看事
2025-12-10 15:38:14
笑不活!為什么男生秋褲前面有開口,內(nèi)褲卻沒有?評論區(qū)好熱鬧

笑不活!為什么男生秋褲前面有開口,內(nèi)褲卻沒有?評論區(qū)好熱鬧

有趣的火烈鳥
2025-12-19 12:46:11
以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

伴史緣
2025-12-25 15:01:34
期待!邵佳一國足有望召入4名歸化:羅慕洛2個月后即可入籍!

期待!邵佳一國足有望召入4名歸化:羅慕洛2個月后即可入籍!

邱澤云
2025-12-24 22:36:57
雷軍急推YU9被質(zhì)疑,網(wǎng)友:中年人怎敢把全家托付給小米!

雷軍急推YU9被質(zhì)疑,網(wǎng)友:中年人怎敢把全家托付給小米!

熱點菌本君
2025-12-23 19:06:18
棉衣批量塌房!月薪3千和月薪3萬都穿聚酯纖維,內(nèi)行人揭秘貓膩

棉衣批量塌房!月薪3千和月薪3萬都穿聚酯纖維,內(nèi)行人揭秘貓膩

法老不說教
2025-12-24 20:04:54
暴漲 229%,碾壓英偉達(dá)!

暴漲 229%,碾壓英偉達(dá)!

EETOP半導(dǎo)體社區(qū)
2025-12-25 12:38:08
正式確定!CBA名帥下課,浙江男籃更換教練

正式確定!CBA名帥下課,浙江男籃更換教練

體壇瞎白話
2025-12-25 11:22:34
上海多家教培機構(gòu)突然關(guān)停,家長課時費“打水漂”?警方揪出“職業(yè)閉店人”

上海多家教培機構(gòu)突然關(guān)停,家長課時費“打水漂”?警方揪出“職業(yè)閉店人”

上觀新聞
2025-12-25 11:28:07
美國人的斬殺線,將成為新的互聯(lián)網(wǎng)圣經(jīng)

美國人的斬殺線,將成為新的互聯(lián)網(wǎng)圣經(jīng)

楓冷慕詩
2025-12-25 14:39:02
性能力與壽命關(guān)系被發(fā)現(xiàn)!男性40歲后,睪酮越高,死亡風(fēng)險越低

性能力與壽命關(guān)系被發(fā)現(xiàn)!男性40歲后,睪酮越高,死亡風(fēng)險越低

藥師說健康
2025-12-05 09:47:10
江蘇古墓挖出一陶罐,打開后震驚了:竟然是2500年前的雞蛋!

江蘇古墓挖出一陶罐,打開后震驚了:竟然是2500年前的雞蛋!

沈言論
2025-12-24 20:20:03
2025-12-25 21:19:00
機器學(xué)習(xí)與Python社區(qū) incentive-icons
機器學(xué)習(xí)與Python社區(qū)
機器學(xué)習(xí)算法與Python
3233文章數(shù) 11081關(guān)注度
往期回顧 全部

科技要聞

屠龍少年被"招安"!英偉達(dá)平安夜豪擲200億

頭條要聞

美司法部發(fā)現(xiàn)上百萬份愛潑斯坦新文件 涂黑操作翻車

頭條要聞

美司法部發(fā)現(xiàn)上百萬份愛潑斯坦新文件 涂黑操作翻車

體育要聞

單賽季11冠,羽壇“安洗瑩時代”真的來了

娛樂要聞

朱孝天把阿信好意當(dāng)球踢!

財經(jīng)要聞

時隔15月,人民幣升破7,三大推手曝光

汽車要聞

速來!智界在上海西岸準(zhǔn)備了年末潮流盛典

態(tài)度原創(chuàng)

本地
家居
房產(chǎn)
游戲
公開課

本地新聞

這輩子要積多少德,下輩子才能投胎到德國當(dāng)狗

家居要聞

經(jīng)典彌新 品味浪漫居所

房產(chǎn)要聞

太猛了!單月新增企業(yè)4.1萬家,又一波巨頭涌向海南!

德瑪西亞杯:輕松拿下勝利,IG三局戰(zhàn)勝NIP,晉級八強

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版