国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

阿里深夜開源80B編程模型!專攻智能體,周靖人、林俊旸最新成果發(fā)布

0
分享至


智東西
作者 李水青
編輯 心緣

智東西2月4日?qǐng)?bào)道,今日凌晨,阿里開源了一款小型混合專家模型Qwen3-Coder-Next,專為編程智能體(Agent)本地開發(fā)打造。

該模型總參數(shù)80B,激活參數(shù)僅3B,在權(quán)威基準(zhǔn)SWE-Bench Verified上實(shí)現(xiàn)了超70%的問(wèn)題解決率,性能媲美激活參數(shù)規(guī)模大10-20倍的稠密模型。

Qwen3-Coder-Next的主要增強(qiáng)功能如下:

1、高效MoE架構(gòu):僅需激活3B參數(shù),可達(dá)到與激活參數(shù)數(shù)量高出10-20倍的模型相當(dāng)?shù)男阅?,包?7B激活參數(shù)的DeepSeek-V3.2、32B激活參數(shù)的Kimi K2.5等,降低顯存與算力需求。

2、更強(qiáng)智能體能力:擅長(zhǎng)長(zhǎng)段推理、復(fù)雜工具使用以及從執(zhí)行失敗中恢復(fù),在動(dòng)態(tài)編程任務(wù)中性能強(qiáng)大。

3、與真實(shí)世界的IDE多樣化集成:其256k的上下文長(zhǎng)度,加上對(duì)各種腳手架模板的適應(yīng)性,使其能夠與OpenClaw、Qwen Code、Claude Code、Web Dev、Browser use、Cline等不同的CLI/IDE平臺(tái)無(wú)縫集成,支持多樣化的開發(fā)環(huán)境。

Qwen3-Coder-Next在實(shí)際開發(fā)中能理解需求、編寫代碼,還能與環(huán)境交互、完成任務(wù),可以在沒有人工干預(yù)的情況下生成可玩的網(wǎng)頁(yè)游戲,部署服務(wù)并自動(dòng)測(cè)試。

阿里在編程智能體上進(jìn)展不斷。就在昨日,阿里云CTO周靖人、阿里千問(wèn)大模型技術(shù)負(fù)責(zé)人林俊旸署名的論文在Arxiv平臺(tái)上發(fā)表,為推進(jìn)下一代編程Agent的發(fā)展提供了新資源和可靠方法。

簡(jiǎn)單來(lái)說(shuō),他們提出了一個(gè)可擴(kuò)展的高效框架SWE-Universe,用于從GitHub拉取請(qǐng)求自動(dòng)構(gòu)建真實(shí)世界的軟件工程(SWE)可驗(yàn)證環(huán)境。利用一個(gè)構(gòu)建Agent,團(tuán)隊(duì)將真實(shí)世界的多語(yǔ)言SWE環(huán)境的數(shù)量擴(kuò)展到接近百萬(wàn)級(jí)(807693 個(gè))。最后,團(tuán)隊(duì)將該技術(shù)應(yīng)用于Qwen3-Max-Thinking,并在SWE-Bench Verified測(cè)試中取得了75.3%的高分。


▲論文截圖

論文地址:

https://www.arxiv.org/abs/2602.02361

回到本次面向產(chǎn)業(yè)推出的新模型來(lái)看,團(tuán)隊(duì)已正式開源Qwen3-Coder-Next(Base)與Qwen3-Coder-Next(Instruct)兩個(gè)版本,支持研究、評(píng)測(cè)及商業(yè)應(yīng)用多種場(chǎng)景。

Qwen3-Coder-Next一經(jīng)發(fā)布引起了廣泛關(guān)注,有網(wǎng)友在社交平臺(tái)X上稱這一模型“尺寸完美”,也有網(wǎng)友表示自己等便攜版的Qwen3-Coder已經(jīng)很久了。


▲社交平臺(tái)X網(wǎng)友對(duì)Qwen3-Coder-Next模型的部分評(píng)論

魔搭社區(qū)地址:
https://www.modelscope.cn/collections/Qwen/Qwen3-Coder-Next
Hugging Face地址:
https://huggingface.co/collections/Qwen/qwen3-coder-next
GitHub地址:
https://github.com/QwenLM/Qwen3-Coder
技術(shù)報(bào)告地址:
https://qwen.ai/blog?id=qwen3-coder-next

一、實(shí)測(cè)媲美10-20倍激活參數(shù)稠密模型,趕超DeepSeek

盡管激活參數(shù)規(guī)模很小,Qwen3-Coder-Next在多項(xiàng)智能體評(píng)測(cè)上仍能匹敵或超過(guò)若干更大的開源模型。

該模型在SWE-Bench、TerminalBench 2.0和Aider等多個(gè)主流編程智能體基準(zhǔn)上的表現(xiàn)如下。


▲Qwen3-Coder-Next實(shí)測(cè)表現(xiàn)

使用SWE-Agent框架時(shí),Qwen3-Coder-Next在SWE-Bench Verified上達(dá)到70%以上,超過(guò)了DeepSeek-V3.2,接近GLM-4.7、MiniMax M2.1。

在多語(yǔ)言設(shè)置以及更具挑戰(zhàn)的SWE-Bench-Pro基準(zhǔn)上,Qwen3-Coder-Next同樣超過(guò)了DeepSeek-V3.2,還較大幅度領(lǐng)先于GLM-4.7、MiniMax M2.1。

在效率方面,Qwen3-Coder-Next與同類模型在SWE-Bench-Pro基準(zhǔn)上進(jìn)行對(duì)比分析,每次推理僅激活3B參數(shù),卻能達(dá)到與激活參數(shù)量達(dá)其10-20倍的模型相當(dāng)?shù)幕鶞?zhǔn)性能,包括37B激活參數(shù)的DeepSeek-V3.2、32B激活參數(shù)的GLM-4.7、32B激活參數(shù)的Kimi K2.5等。

雖然專有的全注意力模型在絕對(duì)性能上仍保持領(lǐng)先優(yōu)勢(shì),但Qwen3-Coder-Next在面向低成本智能體部署的應(yīng)用場(chǎng)景中,仍能在效率與性能之間取得更優(yōu)的帕累托權(quán)衡。


▲Qwen3-Coder-Next實(shí)測(cè)表現(xiàn)

二、創(chuàng)新智能體訓(xùn)練配方:強(qiáng)化智能體訓(xùn)練的信號(hào)

Qwen3-Coder-Next模型基于Qwen3-Next-80B-A3B-Base構(gòu)建,采用混合注意力與MoE的新架構(gòu);通過(guò)大規(guī)??蓤?zhí)行任務(wù)合成、環(huán)境交互與強(qiáng)化學(xué)習(xí)進(jìn)行智能體訓(xùn)練,在降低推理成本的同時(shí),提升編程與智能體能力。

Qwen3-Coder-Next并不只依賴參數(shù)規(guī)模擴(kuò)張,而是將重點(diǎn)放在擴(kuò)展智能體訓(xùn)練信號(hào)(agentic training signals)上。團(tuán)隊(duì)使用大規(guī)模的可驗(yàn)證編程任務(wù)與可執(zhí)行環(huán)境進(jìn)行訓(xùn)練,讓模型能夠直接從環(huán)境反饋中學(xué)習(xí),而非僅依賴靜態(tài)文本。

訓(xùn)練過(guò)程主要包括:

1、持續(xù)預(yù)訓(xùn)練:在以代碼與智能體為中心的大規(guī)模數(shù)據(jù)上進(jìn)行。

2、監(jiān)督微調(diào):基于高質(zhì)量的智能體交互軌跡,優(yōu)化模型的行為。

3、領(lǐng)域?qū)<矣?xùn)練:針對(duì)軟件工程、問(wèn)答、Web/UX 等特定領(lǐng)域,精細(xì)化專家能力。

4、專家知識(shí)蒸餾:最終將27個(gè)專家的能力融合至一個(gè)輕量的、可部署的單一模型。

這套“配方”的核心目標(biāo),是教會(huì)模型長(zhǎng)時(shí)程推理、熟練使用工具,以及從執(zhí)行錯(cuò)誤中有效恢復(fù)——這些正是實(shí)用編程智能體所需的核心能力。

三、多樣化集成下游應(yīng)用,游戲生成測(cè)試無(wú)需人工干預(yù)

Qwen3-Coder-Next的價(jià)值還體現(xiàn)在于其低部署門檻與應(yīng)用體驗(yàn)。

得益于僅3B的激活參數(shù),開發(fā)者可靈活將其集成至多種場(chǎng)景:作為本地IDE插件,實(shí)現(xiàn)自動(dòng)修復(fù)與代碼生成;構(gòu)建命令行智能體(CLI Agent),通過(guò)自然語(yǔ)言操作終端、管理項(xiàng)目;部署于企業(yè)內(nèi)網(wǎng)環(huán)境,打造私有化、高響應(yīng)的編程輔助系統(tǒng)?!靶〖せ?、快響應(yīng)、強(qiáng)能力”為編程智能體的規(guī)?;涞靥峁┝烁呖尚行缘穆窂?。

該模型可集成到多種下游應(yīng)用中,覆蓋OpenClaw、Qwen Code、Claude Code、Web Dev、Browser use、Cline等多種開發(fā)環(huán)境。

結(jié)語(yǔ):研發(fā)落地雙投入,阿里加碼編程智能體

編程智能體正成為阿里通義千問(wèn)團(tuán)隊(duì)的強(qiáng)攻領(lǐng)域。Qwen3-Coder-Next在編程智能體基準(zhǔn)上表現(xiàn)強(qiáng)勁,展現(xiàn)了技術(shù)在實(shí)用場(chǎng)景中的應(yīng)用價(jià)值。而周靖人、林俊旸署名的新論文則代表了其編程智能體新的前沿進(jìn)展,形成了研發(fā)和落地兩條路快步走的趨勢(shì)。

展望未來(lái),團(tuán)隊(duì)認(rèn)為強(qiáng)大的智能體能力,如自主使用工具、應(yīng)對(duì)難題、管理復(fù)雜任務(wù),是更好編程智能體的關(guān)鍵。接下來(lái)團(tuán)隊(duì)計(jì)劃提升模型的推理與決策能力、支持更多任務(wù),并根據(jù)使用反饋快速迭代更新。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
60度電池、油箱50L,“哪哪都大”的新能源車,是不是工業(yè)雞肋?

60度電池、油箱50L,“哪哪都大”的新能源車,是不是工業(yè)雞肋?

少數(shù)派報(bào)告Report
2026-02-25 07:49:41
別再同情她了!被教練性侵27次,卻在奧運(yùn)賽場(chǎng)上把隊(duì)友撞出賽道

別再同情她了!被教練性侵27次,卻在奧運(yùn)賽場(chǎng)上把隊(duì)友撞出賽道

徐醇老表哥
2026-02-24 15:53:18
輕傷二級(jí)有多嚴(yán)重?平頂山打人夫妻或?qū)⒚媾R3-7年刑期

輕傷二級(jí)有多嚴(yán)重?平頂山打人夫妻或?qū)⒚媾R3-7年刑期

民言民語(yǔ)
2026-02-25 09:07:07
科技盡頭是放貸,哈啰“無(wú)證狂奔”400億的盡頭是什么?

科技盡頭是放貸,哈啰“無(wú)證狂奔”400億的盡頭是什么?

侃故事的阿慶
2026-02-24 11:47:01
沙超最新積分:再爆大冷1-1!本澤馬帶隊(duì)從第1跌第3,C羅坐收漁利

沙超最新積分:再爆大冷1-1!本澤馬帶隊(duì)從第1跌第3,C羅坐收漁利

球場(chǎng)沒跑道
2026-02-25 10:11:56
現(xiàn)貨黃金日內(nèi)漲幅擴(kuò)大至1%,報(bào)5192.64美元/盎司

現(xiàn)貨黃金日內(nèi)漲幅擴(kuò)大至1%,報(bào)5192.64美元/盎司

每日經(jīng)濟(jì)新聞
2026-02-25 10:22:14
航天科研人員趙學(xué)軍留學(xué)被策反,回國(guó)后大量搜集核心要害情報(bào)提供給境外間諜,央視披露細(xì)節(jié):才到國(guó)外就被盯上,請(qǐng)吃燒烤增進(jìn)感情

航天科研人員趙學(xué)軍留學(xué)被策反,回國(guó)后大量搜集核心要害情報(bào)提供給境外間諜,央視披露細(xì)節(jié):才到國(guó)外就被盯上,請(qǐng)吃燒烤增進(jìn)感情

極目新聞
2026-02-23 15:04:52
平頂山夫妻打女孩新通報(bào):先打錯(cuò)3人,再打小女孩的,還有個(gè)喜訊

平頂山夫妻打女孩新通報(bào):先打錯(cuò)3人,再打小女孩的,還有個(gè)喜訊

江山揮筆
2026-02-25 10:20:53
開學(xué)通知!2026中小學(xué)生開學(xué)時(shí)間確定了,家長(zhǎng)卻表示難以接受!

開學(xué)通知!2026中小學(xué)生開學(xué)時(shí)間確定了,家長(zhǎng)卻表示難以接受!

凱旋學(xué)長(zhǎng)
2026-02-24 22:41:06
拒絕百萬(wàn)年薪,入職25萬(wàn)事業(yè)編,效力遼籃18年的韓德君賺到多少錢

拒絕百萬(wàn)年薪,入職25萬(wàn)事業(yè)編,效力遼籃18年的韓德君賺到多少錢

攬星河的筆記
2026-01-25 20:19:21
巨虧233億背后!美團(tuán)已顯力不從心,京東還未全力以赴

巨虧233億背后!美團(tuán)已顯力不從心,京東還未全力以赴

一地基毛
2026-02-22 23:30:02
不可錯(cuò)過(guò)!2月25日早上09:00比賽!中央5套CCTV5、CCTV5+直播表

不可錯(cuò)過(guò)!2月25日早上09:00比賽!中央5套CCTV5、CCTV5+直播表

皮皮觀天下
2026-02-25 08:49:22
女特工臥底京都頂級(jí)夜場(chǎng),致總設(shè)計(jì)師淪陷,東風(fēng)導(dǎo)彈機(jī)密技術(shù)外泄

女特工臥底京都頂級(jí)夜場(chǎng),致總設(shè)計(jì)師淪陷,東風(fēng)導(dǎo)彈機(jī)密技術(shù)外泄

干史人
2026-02-24 09:48:19
許仰天罕見亮相,宣布在廣東追加投資超100億元

許仰天罕見亮相,宣布在廣東追加投資超100億元

每日經(jīng)濟(jì)新聞
2026-02-25 00:41:04
節(jié)后首日機(jī)票價(jià)格回落,多條航線單程票價(jià)低至200元

節(jié)后首日機(jī)票價(jià)格回落,多條航線單程票價(jià)低至200元

界面新聞
2026-02-25 07:10:02
1950年滇軍起義將領(lǐng)楊朝綸叛變,被捕后陳賡急問(wèn)潘朔端:該怎么辦

1950年滇軍起義將領(lǐng)楊朝綸叛變,被捕后陳賡急問(wèn)潘朔端:該怎么辦

談古論今歷史有道
2026-02-25 08:15:03
被我國(guó)設(shè)為機(jī)密的小藥丸,傳承300年無(wú)人問(wèn),日本卻靠他年入上億

被我國(guó)設(shè)為機(jī)密的小藥丸,傳承300年無(wú)人問(wèn),日本卻靠他年入上億

現(xiàn)代小青青慕慕
2026-01-24 19:26:16
1985年,19歲的蘇菲·瑪索在東京街頭,英氣十足

1985年,19歲的蘇菲·瑪索在東京街頭,英氣十足

娛你同歡
2026-02-15 10:12:04
巴拿馬政府強(qiáng)行接管李嘉誠(chéng)旗下港口,香港特區(qū)政府嚴(yán)正抗議:罔顧事實(shí)、背信棄義!相關(guān)公司多年來(lái)在當(dāng)?shù)赝度刖揞~投資和創(chuàng)造大量職位

巴拿馬政府強(qiáng)行接管李嘉誠(chéng)旗下港口,香港特區(qū)政府嚴(yán)正抗議:罔顧事實(shí)、背信棄義!相關(guān)公司多年來(lái)在當(dāng)?shù)赝度刖揞~投資和創(chuàng)造大量職位

每日經(jīng)濟(jì)新聞
2026-02-24 14:53:04
三星Galaxy S26 Ultra真機(jī)已流出,這五大升級(jí)讓整個(gè)手機(jī)圈炸了!

三星Galaxy S26 Ultra真機(jī)已流出,這五大升級(jí)讓整個(gè)手機(jī)圈炸了!

明美無(wú)限
2026-02-24 23:33:19
2026-02-25 11:08:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
11250文章數(shù) 116979關(guān)注度
往期回顧 全部

科技要聞

蘋果MacBook Pro要加觸摸屏了,還帶靈動(dòng)島

頭條要聞

媒體:中國(guó)開年對(duì)日本出"重拳" 反制手段根本性質(zhì)變

頭條要聞

媒體:中國(guó)開年對(duì)日本出"重拳" 反制手段根本性質(zhì)變

體育要聞

曝雄鹿計(jì)劃今夏追小卡 字母哥渴望與其并肩作戰(zhàn)

娛樂要聞

撒貝寧到沈陽(yáng)跑親戚 老婆李白模特身材

財(cái)經(jīng)要聞

春節(jié)檔"開門黑" 電影票少賣了7000萬(wàn)張

汽車要聞

方程豹首款轎車實(shí)車圖曝光 就等價(jià)格了?

態(tài)度原創(chuàng)

健康
旅游
藝術(shù)
手機(jī)
家居

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

旅游要聞

有限空間釋放無(wú)限價(jià)值

藝術(shù)要聞

如果吳清源重生,他會(huì)如何與柯潔較量?

手機(jī)要聞

三星闊折疊Galaxy Z Fold Wide手機(jī)外觀圖曝光

家居要聞

本真棲居 愛暖伴流年

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版