国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Qwen3-代碼能力非常強(qiáng)悍,0.6B模型竟然比Gemma4B模型還要強(qiáng)

0
分享至

你沒(méi)看錯(cuò),千問(wèn)3(Qwen3)的這次更新不是一個(gè)模型,而是一堆模型,Dense模型一共6款,大小從0.6B到32B不等;MoE混合專(zhuān)家模型有兩個(gè),30B和235B。

我上手就先用235B這個(gè)旗艦版測(cè)試了一下代碼性能,用的是這個(gè)Prompt:

Write a p5.js script that simulates 25 particles in a vacuum space of a cylindrical container, bouncing within its boundaries. Use different colors for each ball and ensure they leave a trail showing their movement. Add a slow rotation of the container to give better view of what's going on in the scene. Make sure to create proper collision detection and physic rules to ensure particles remain in the container. Add an external spherical container. Add a slow zoom in and zoom out effect to the whole scene.

目的是生成25個(gè)粒子在圓柱形的真空環(huán)境里彈跳,小球每個(gè)使用不同顏色,顯示軌跡,同時(shí)還要附加一個(gè)外部的球形容器,以及緩慢的運(yùn)動(dòng)和視角變化,是一個(gè)很復(fù)雜的Prompt,因?yàn)樗婕暗搅撕芏喾矫娴闹R(shí)需求。

這是我用Qwen3-235B-A22B的實(shí)現(xiàn)效果,可以說(shuō)非常好,跟在編程領(lǐng)域的隱形王者Claude3.5不相上下。

同時(shí)我也用30B的MoE模型又測(cè)試了一下,效果也出乎意料的不錯(cuò),雖然不如235B,但是仔細(xì)看的話,基本上也滿足了Prompt的要求。

從Github上公布的模型性能也可見(jiàn)一斑,尤其是 235B-MoE,已經(jīng)在數(shù)學(xué)推理和算法競(jìng)賽級(jí)別的編程任務(wù)中領(lǐng)先優(yōu)勢(shì)很明顯。

現(xiàn)在Qwen Chat已經(jīng)可以免費(fèi)使用了,我建議你也可以試試看,可以用30B和235B的MoE模型和32B的Dense模型。

更多的資源也可以從這里面,比如Github,Huggingface等。

Qwen Chat: https://chat.qwen.ai/

Github: https://github.com/QwenLM/Qwen3

HuggingFace:https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f

魔搭:https://modelscope.cn/collections/Qwen3-9743180bdc6b48

Kaggle: https://www.kaggle.com/models/qwen-lm/qwen-3

我這次分別嘗試了本地部署和云端 Qwen Chat兩種方式來(lái)用千問(wèn)3,本地部署主要是針對(duì)與小于等于30B的模型,對(duì)于旗艦版235B就只能用云端了。

這次的一大亮點(diǎn)就是混合推理模型,也就是說(shuō)推理模式是可以手動(dòng)開(kāi)啟和關(guān)閉的,千問(wèn)3的所有模型都原生支持這個(gè)特性,最小的0.6B模型也不例外,部署起來(lái)非常的簡(jiǎn)單,這是用huggingface提供的transformers庫(kù)部署的千問(wèn)3。

這是我用的0.6B小模型做的測(cè)試,問(wèn)題是:請(qǐng)簡(jiǎn)要的描述下大語(yǔ)言模型。

第一個(gè)是開(kāi)啟了推理的回答,可以看到enable_thinking=Ture(第一個(gè)紅框),第二個(gè)紅框內(nèi)的內(nèi)容包含了兩部分內(nèi)容,分別是thinking content和content,代表了推理思考內(nèi)容和最終的輸出內(nèi)容。

你仔細(xì)看的話,即使是這個(gè)最小的模型,推理邏輯也很完整,輸出的答案也非常不錯(cuò)。

下面這個(gè)就是手動(dòng)關(guān)閉推理模式后的回答,可以看到thinking content那里是空的,答案也不差。

這種模式的好處非常大,因?yàn)閷?duì)于一些非推理型的問(wèn)題,比如簡(jiǎn)單的數(shù)學(xué)題1+1=?,開(kāi)啟推理模式后反而有可能會(huì)失敗。

這個(gè)時(shí)候,只需要對(duì)于題目加一層篩選模式,然后自動(dòng)的開(kāi)啟或者關(guān)閉推理模型,不僅可以加速輸出,同時(shí)還能省不少的token,真降本增效!這個(gè)特性暫時(shí)我只在閉源的Claude-3.7上看到過(guò),在開(kāi)源模型中還是頭一號(hào)!

這次大版本更新把它大模型源神的稱(chēng)號(hào)坐實(shí)了,畢竟一次性放8個(gè)模型可謂是空前絕后,特別是這次的更新幾乎把所有的大模型要素都集齊了。

1全尺寸開(kāi)源且同級(jí)別領(lǐng)先:從0.6B 到235B,涵蓋了端側(cè)超小模型到B端友好的模型尺寸。

0.6B的推理模型,還是可以任意切換是否開(kāi)啟推理的模型,包括手機(jī)在內(nèi)的很多端側(cè)模型估計(jì)迎來(lái)一大波更新。

對(duì)第一個(gè)測(cè)試,我用DeepSeek R1也試了下,671B的模型效果比起235B的千問(wèn)3差點(diǎn)意思,不過(guò)現(xiàn)在才R1,提升空間也很大,畢竟是中國(guó)的開(kāi)源大模型雙子星。

小型MoE模型,總大小30B激活參數(shù)3B。32B的Dense模型非常的符合直覺(jué),畢竟Qwen家族的32B模型在業(yè)內(nèi)的威望有目共睹,不管是QwQ的32B模型在Marketing和Finance領(lǐng)域力壓Google,OpenAI和Anthropic的一眾大模型。

還是DeepSeek嚴(yán)選的蒸餾模型,千問(wèn)系列的32B跟Llama的70B性能不相上下,但是模型足足小了一倍還多,可以看得出Dense模型在“智能密度”這個(gè)維度上的得分高的嚇人。

而這次的30B的MoE模型更是有講究的,可以說(shuō)是目前最強(qiáng)的可以在消費(fèi)級(jí)顯卡上部署的MoE大模型,因?yàn)榫湍胵wq這個(gè)模型來(lái)舉例,32b的模型在經(jīng)過(guò)4bit量化后,顯存占用20GB,而英偉達(dá)的90系顯卡正好有24GB顯存,一塊顯卡就能正好讓模型跑起來(lái),再加上性能足夠,基本上可以讓很多想要本地部署的個(gè)人和小型企業(yè)都滿足需求。

千問(wèn)3的性能可以說(shuō)是全尺寸都很強(qiáng),我看到@劉聰NLP測(cè)試了這么一個(gè)問(wèn)題:生蠔煮熟了叫什么?

30B以上的大模型都能答得對(duì),對(duì)他們沒(méi)什么難度,我試了下本地部署的0.6B模型,照樣也可以做對(duì)。

而最小尺寸的deepseek r1 1.5b蒸餾版,答案不太對(duì)。

而同樣是開(kāi)源的Gemma 4B,給出的回答更是讓人哭笑不得。

可以說(shuō),不管是百B以上的大模型,還是可以部署在端側(cè)的超小模型,千問(wèn)3表現(xiàn)出來(lái)的效果都非常的好。

并且從官方介紹可以看到,千問(wèn)3還同時(shí)對(duì)于Agent和MCP能力做了優(yōu)化,再加上其可以本地部署的最大優(yōu)勢(shì),可以說(shuō)是現(xiàn)在大模型市場(chǎng)最稀缺的能力。

性能好,型號(hào)多,所以我宣布,千問(wèn)3才是真正的源神!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
釘在恥辱柱上!國(guó)家文物局出手,這三個(gè)跳梁小丑,真的徹底涼涼了

釘在恥辱柱上!國(guó)家文物局出手,這三個(gè)跳梁小丑,真的徹底涼涼了

戶外阿嶄
2025-12-28 17:07:24
女卡車(chē)司機(jī)“半掛西施”去世后,網(wǎng)友分析網(wǎng)名,4個(gè)字竟字字應(yīng)驗(yàn)

女卡車(chē)司機(jī)“半掛西施”去世后,網(wǎng)友分析網(wǎng)名,4個(gè)字竟字字應(yīng)驗(yàn)

千言?shī)蕵?lè)記
2025-12-28 20:02:42
苦等5年,蒙古熟鴨子還是飛了,中俄誰(shuí)也不讓步,坐視大項(xiàng)目泡湯

苦等5年,蒙古熟鴨子還是飛了,中俄誰(shuí)也不讓步,坐視大項(xiàng)目泡湯

科普100克克
2025-12-07 18:20:34
美國(guó)國(guó)務(wù)院發(fā)火,要求中國(guó)大陸“必須停止”,島內(nèi)一個(gè)時(shí)代或終結(jié)

美國(guó)國(guó)務(wù)院發(fā)火,要求中國(guó)大陸“必須停止”,島內(nèi)一個(gè)時(shí)代或終結(jié)

三石記
2025-12-27 15:03:24
米蘭20天首勝!暫登頂意甲,10戰(zhàn)維羅納全勝,連刷4大紀(jì)錄

米蘭20天首勝!暫登頂意甲,10戰(zhàn)維羅納全勝,連刷4大紀(jì)錄

奧拜爾
2025-12-28 21:33:44
杭州姑娘“兔子警官”主動(dòng)回應(yīng)“哄孩子式執(zhí)法”:“他們需要外力推一下……”

杭州姑娘“兔子警官”主動(dòng)回應(yīng)“哄孩子式執(zhí)法”:“他們需要外力推一下……”

都市快報(bào)橙柿互動(dòng)
2025-12-28 14:07:18
保定大量商戶突然關(guān)閉,整個(gè)街道冷冷清清

保定大量商戶突然關(guān)閉,整個(gè)街道冷冷清清

映射生活的身影
2025-12-27 18:09:05
統(tǒng)治澳洲!韓旭26分鐘12中9高效22+5 加盟6戰(zhàn)全勝狂勝138分

統(tǒng)治澳洲!韓旭26分鐘12中9高效22+5 加盟6戰(zhàn)全勝狂勝138分

醉臥浮生
2025-12-28 18:09:56
瓜子二手車(chē)發(fā)布榜單,保值排名出乎意料

瓜子二手車(chē)發(fā)布榜單,保值排名出乎意料

ZAKER新聞
2025-12-26 15:23:34
1960年春節(jié),周總理請(qǐng)溥儀吃飯,酒桌上溥儀講了個(gè)慈禧的“笑話”,總理聽(tīng)完,當(dāng)場(chǎng)陷入了沉思

1960年春節(jié),周總理請(qǐng)溥儀吃飯,酒桌上溥儀講了個(gè)慈禧的“笑話”,總理聽(tīng)完,當(dāng)場(chǎng)陷入了沉思

歷史回憶室
2025-12-24 10:29:12
香港男子命喪天水圍橋底,嫌疑人在深圳灣口岸落網(wǎng)!押回現(xiàn)場(chǎng)

香港男子命喪天水圍橋底,嫌疑人在深圳灣口岸落網(wǎng)!押回現(xiàn)場(chǎng)

南方都市報(bào)
2025-12-28 12:18:04
直擊:日本發(fā)生重大交通事故,67輛車(chē)連環(huán)撞,幸存者顫抖回憶慘烈現(xiàn)場(chǎng)……

直擊:日本發(fā)生重大交通事故,67輛車(chē)連環(huán)撞,幸存者顫抖回憶慘烈現(xiàn)場(chǎng)……

日本物語(yǔ)
2025-12-27 20:32:22
閃評(píng)丨澤連斯基訪美之際 普京再就俄烏沖突局勢(shì)表態(tài)

閃評(píng)丨澤連斯基訪美之際 普京再就俄烏沖突局勢(shì)表態(tài)

國(guó)際在線
2025-12-28 15:07:02
畸形兒風(fēng)波反轉(zhuǎn)!醫(yī)院回應(yīng)透露2個(gè)關(guān)鍵信息 闞清子的沉默早有預(yù)兆

畸形兒風(fēng)波反轉(zhuǎn)!醫(yī)院回應(yīng)透露2個(gè)關(guān)鍵信息 闞清子的沉默早有預(yù)兆

觀察鑒娛
2025-12-28 10:26:06
201米!40億!騰訊西南總部,世界“第一扭”摩天樓

201米!40億!騰訊西南總部,世界“第一扭”摩天樓

GA環(huán)球建筑
2025-12-25 23:00:32
羽球天王杯:銅牌誕生!世界第8復(fù)仇喬納坦,石宇奇首局7-11落后

羽球天王杯:銅牌誕生!世界第8復(fù)仇喬納坦,石宇奇首局7-11落后

劉姚堯的文字城堡
2025-12-28 20:01:00
61歲奧巴馬夫人暴瘦后“逆生長(zhǎng)”,與前總統(tǒng)丈夫合照笑開(kāi)了花

61歲奧巴馬夫人暴瘦后“逆生長(zhǎng)”,與前總統(tǒng)丈夫合照笑開(kāi)了花

艷兒說(shuō)電影
2025-12-27 21:11:14
甚至來(lái)不及準(zhǔn)備,湘超冠軍永州隊(duì)巡游花車(chē)為臨時(shí)切割公交車(chē)改造而成

甚至來(lái)不及準(zhǔn)備,湘超冠軍永州隊(duì)巡游花車(chē)為臨時(shí)切割公交車(chē)改造而成

懂球帝
2025-12-28 16:35:07
廣東一小伙,因入住毛坯房而走紅,花費(fèi)僅1萬(wàn),卻無(wú)一絲窮酸氣!

廣東一小伙,因入住毛坯房而走紅,花費(fèi)僅1萬(wàn),卻無(wú)一絲窮酸氣!

阿離家居
2025-12-28 10:19:49
沖上熱搜!黃子韜因腦淤血接受開(kāi)顱手術(shù)縫了43針,本人回應(yīng)

沖上熱搜!黃子韜因腦淤血接受開(kāi)顱手術(shù)縫了43針,本人回應(yīng)

半島晨報(bào)
2025-12-28 18:04:45
2025-12-28 21:52:49
平凡AI incentive-icons
平凡AI
高校AI從業(yè)者
54文章數(shù) 23關(guān)注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動(dòng)駕駛?記者求證→

頭條要聞

新華社發(fā)文:積蓄統(tǒng)一大勢(shì)

頭條要聞

新華社發(fā)文:積蓄統(tǒng)一大勢(shì)

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂(lè)要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車(chē)了

財(cái)經(jīng)要聞

英偉達(dá)的收購(gòu)史

汽車(chē)要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

房產(chǎn)
教育
手機(jī)
數(shù)碼
軍事航空

房產(chǎn)要聞

降維打擊!三亞CBD驚現(xiàn)“豪宅新王”,高端局要變天了!

教育要聞

從2026年北京選調(diào)擬錄用名單看升學(xué):這些大學(xué)最受青睞

手機(jī)要聞

1486.41萬(wàn)臺(tái)!iPhone17系列中國(guó)市場(chǎng)銷(xiāo)量刷新紀(jì)錄,力壓國(guó)產(chǎn)機(jī)!

數(shù)碼要聞

LG電子2026款OLED電視獲英偉達(dá)G-SYNC認(rèn)證,至高165Hz

軍事要聞

與特朗普會(huì)晤前 澤連斯基亮明“紅線”

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版