国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

實(shí)測阿里Qwen3.6-Plus:8分鐘做了個(gè)官網(wǎng),被北京地鐵繞暈

0
分享至

  
智東西
作者 陳駿達(dá)
編輯 心緣

  智東西4月2日報(bào)道,今天,阿里推出了新一代大語言模型Qwen3.6-Plus,這也是Qwen3.6系列的首個(gè)模型。與上一代模型相比,Qwen3.6-Plus重點(diǎn)提升了編程Coding能力、智能體Agent能力和工具調(diào)用能力,默認(rèn)支持100萬上下文窗口。

  這一模型還適配了主流Agent框架,也就是各種“龍蝦”和編程工具。官方提到的包括OpenClaw、Qwen Code、ClaudeCode、KiloCode、Cline和OpenCode。

  在大模型調(diào)用平臺OpenRouter上,免費(fèi)體驗(yàn)的Qwen3.6-Plus預(yù)覽版調(diào)用量排名日榜第二。值得一提的是,前五名的模型中有四個(gè)都是國產(chǎn)模型。

  

  在SWE-bench Verified、Terminal-Bench 2、NL2Repo等編程基準(zhǔn)測試中,Qwen3.6-Plus取得了超過GLM-5、Kimi K2.5的成績,不過在部分基準(zhǔn)測試中的得分仍低于Claude Opus 4.5。

  在Claw-Eval、QwenClawBench等真實(shí)世界Agent能力評測中,Qwen3.6-Plus的表現(xiàn)同樣超過了多款國產(chǎn)模型,與Claude Opus 4.5同處一個(gè)梯隊(duì)。

  

  ▲Qwen3.6-Plus基準(zhǔn)測試對比(圖源:阿里)

  不過,需要注意的是,這張基準(zhǔn)測試圖的圖表縱軸刻度間隔并不一致,在SWE-bench Verified、MMMU、RealWorldQA、QwenClawBench等測試中,幾個(gè)對比模型的實(shí)際得分差距并沒有特別明顯。

  智東西立刻上手體驗(yàn)了Qwen3.6-Plus的編程能力,讓它在Claude官方的前端設(shè)計(jì)Skill指導(dǎo)下,打造了一個(gè)AI眼鏡獨(dú)立站,歷經(jīng)三輪對話,耗時(shí)8分鐘左右,消耗2.5萬個(gè)token(約等于0.15元)。

  可以看到在提示詞的要求下它打造的網(wǎng)頁完成度不錯(cuò),根據(jù)Skill的要求避免了一些老掉牙的AI味設(shè)計(jì)風(fēng)格,不過在字體選擇上依然是較為常見的類型。

  

  實(shí)測結(jié)果:

  https://mcp.edgeone.site/share/57IuyACJqUk1GjKHY9I4c

  與上一代模型類似,Qwen3.6-Plus也是一個(gè)原生多模態(tài)模型。Qwen3.6-Plus這次重點(diǎn)提升了多模態(tài)推理和指令模式實(shí)用性。

  官方Demo中用北京地鐵路徑規(guī)劃的題目考了考Qwen3.6-Plus,我們同樣試了一下,讓模型規(guī)劃出從北京大興機(jī)場到北京首都機(jī)場的最快路線,它的方案與高德上的最快路徑一致。

  

  將編程能力與多模態(tài)能力結(jié)合后,Qwen3.6-Plus還解鎖了視覺智能體編程能力,可基于界面截圖、設(shè)計(jì)稿或自然圖文描述,完成前端頁面生成、代碼補(bǔ)全、交互修改等任務(wù)。

  目前,Qwen3.6-Plus的API已經(jīng)開放調(diào)用,用戶可在Qwen Chat中體驗(yàn)到這一模型。這次阿里還為API引入了一項(xiàng)新功能“preserve_thinking”,可保留消息中所有前序輪次的思維內(nèi)容,該功能推薦用于智能體任務(wù)。其API的原價(jià)為4元/百萬輸入tokens,12元/百萬輸出tokens,目前有限時(shí)5折的優(yōu)惠。

  

  值得一提的是,阿里在企業(yè)級市場的AI應(yīng)用“悟空”第一時(shí)間接入了Qwen3.6-Plus。

  

  Qwen Chat:

  https://chat.qwen.ai/

  阿里云百煉:

  https://bailian.console.aliyun.com/cn-beijing?tab=model#/model-market/detail/qwen3.6-plus一、可完成長鏈路任務(wù)與多輪工具調(diào)用,token效率有提升空間

  在自然語言能力方面,Qwen3.6-Plus通過融合推理、記憶與執(zhí)行能力,在編程智能體、通用智能體和工具調(diào)用上實(shí)現(xiàn)提升。

  具體來看,在編程智能體維度其表現(xiàn)較Qwen3.5實(shí)現(xiàn)較大幅度的提升,得分略微高于GLM-5和Kimi-K2.5,略低于Claude Opus 4.5。

  在通用智能體方面,其得分在部分基準(zhǔn)測試中優(yōu)于Claude Opus 4.5。在通用能力中,其得分和Qwen3.5基本一致。

  

  在實(shí)測中,我們的這一案例融合考察了編程與工具調(diào)用能力,要求Qwen3.6-Plus統(tǒng)計(jì)A股目前股價(jià)最高的10家公司,并生成完整統(tǒng)計(jì)網(wǎng)頁,帶有每家公司的跳轉(zhuǎn)鏈接。

  在任務(wù)執(zhí)行過程中,Qwen3.6-Plus調(diào)用了7輪搜索工具,統(tǒng)計(jì)了數(shù)十個(gè)網(wǎng)站的數(shù)據(jù),最終交付了如下的結(jié)果,耗時(shí)大概7分鐘左右。

  

  ▲Qwen3.6-Plus生成的排名

  Qwen3.6-Plus選擇了權(quán)威的數(shù)據(jù)來源,右側(cè)查看詳情鏈接的跳轉(zhuǎn)正常,排名正確,數(shù)據(jù)則取的是近似值。在思維鏈中可以看到它多次在同一個(gè)問題上反復(fù)思考,搜索多次但獲得的內(nèi)容差不多,在任務(wù)執(zhí)行速度和token效率上仍有一定提升空間。

  

  ▲右側(cè)是Qwen3.6-Plus的思維鏈摘要

  接下來,我們又要求Qwen3.6-Plus生成一個(gè)《潛水員戴夫》的同款游戲,不過,Qwen3.6-Plus先是拒絕了這一要求,稱它無法直接生成可執(zhí)行的游戲文件,但可以為我生成核心概念美術(shù)圖,并提供一套完整的《潛水員戴夫》風(fēng)格游戲設(shè)計(jì)藍(lán)圖+開發(fā)指南+基礎(chǔ)代碼框架,作為開發(fā)起點(diǎn)。

  

  再次要求后,Qwen3.6-Plus開始了開發(fā),但是在寫到200多行代碼時(shí)出現(xiàn)了問題,于是停止了開發(fā)。

  

  之后我們嘗試了通過API調(diào)用這一模型,完成同一任務(wù)。模型認(rèn)為,打造《潛水員戴夫》同款獨(dú)立游戲的核心在于復(fù)刻其“白天探索采集+夜晚模擬經(jīng)營+輕敘事驅(qū)動(dòng)+循環(huán)成長”的節(jié)奏,而非照搬題材或代碼。它決定打造一個(gè)白天深入動(dòng)態(tài)霧林采集食材與古物,夜晚經(jīng)營一家能“烹飪記憶”的森林酒館的游戲。

  最終Qwen3.6-Plus交付的MVP版本(最小可用版本)如下,不過我們試玩了一下,這一游戲在可玩性上仍然需要持續(xù)迭代。

  

  試玩鏈接:

  https://mcp.edgeone.site/share/hkGsoqs3OCUQyXtxsYCal

  二、實(shí)測高難度路徑規(guī)劃,被北京地鐵轉(zhuǎn)暈

  在視覺語言能力方面,Qwen3.6-Plus的主要圍繞著多模態(tài)推理、指令模式實(shí)用性進(jìn)行改進(jìn),其在復(fù)雜文檔理解、物理世界視覺理解、視頻推理和視覺編程等任務(wù)上的得分有所提升。

  

  為考察其視覺推理能力,我們在之前的地鐵路徑規(guī)劃任務(wù)上加了點(diǎn)難度,假設(shè)某一線路遇到了極端天氣停運(yùn)了,看看模型還能不能反應(yīng)過來。

  

  Qwen3.6-Plus通過較長時(shí)間的思考后,得出了兩個(gè)結(jié)論,第一個(gè)結(jié)論其實(shí)是正確的,但是它判斷這條路線有點(diǎn)復(fù)雜,于是認(rèn)為可以在“牡丹園站換乘昌平線”,這樣更直接。Qwen3.6-Plus的最終結(jié)論有個(gè)bug,昌平線可能至少要等到2029年才能和19號線在牡丹園換乘。

  

  在其他多模態(tài)能力方面,阿里官方還展示了多個(gè)demo。比如,Qwen3.6-Plus可以對視頻進(jìn)行分析,并生成圖文并茂的講義。

  

  或是根據(jù)界面截圖、產(chǎn)品原型、設(shè)計(jì)稿或自然圖文描述,完成前端頁面生成、代碼補(bǔ)全、交互修改等任務(wù)。

  

  結(jié)語:阿里全面押注原生多模態(tài)

  隨著Qwen3.6-Plus的發(fā)布,千問團(tuán)隊(duì)稱,他們近期的工作重心將全面轉(zhuǎn)向Qwen3.6系列的整體發(fā)布。在未來不久,千問還將開源更小規(guī)模的模型版本。同時(shí),性能更強(qiáng)的旗艦?zāi)P蚎wen3.6-Max也將很快亮相。

  值得注意的是,自Qwen3.5發(fā)布后,千問已經(jīng)全面將其主力模型Qwen轉(zhuǎn)向了原生多模態(tài)。該團(tuán)隊(duì)稱,他們希望模型逐步演進(jìn)為一個(gè)能夠在真實(shí)環(huán)境中持續(xù)感知、推理和行動(dòng)的原生多模態(tài)智能體。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
只踢半場 國安18歲小將難踢主力 上張稀哲防守少1人 雙中鋒是陷阱

只踢半場 國安18歲小將難踢主力 上張稀哲防守少1人 雙中鋒是陷阱

替補(bǔ)席看球
2026-04-04 17:48:19
突發(fā)!OpenClaw被封殺了

突發(fā)!OpenClaw被封殺了

技術(shù)領(lǐng)導(dǎo)力
2026-04-04 11:08:33
劉強(qiáng)東就是因?yàn)檫@幾張照片淪陷的吧

劉強(qiáng)東就是因?yàn)檫@幾張照片淪陷的吧

小椰的奶奶
2026-04-04 17:49:57
美國現(xiàn)在已經(jīng)知道,自己上了俄羅斯的當(dāng),可惜已經(jīng)來不及了

美國現(xiàn)在已經(jīng)知道,自己上了俄羅斯的當(dāng),可惜已經(jīng)來不及了

無悔的燦爛人生
2026-04-04 22:12:16
“顧客嫌棄放在地上不能吃了……”敲門無人應(yīng),騎手將外賣放門口地上后離開,被投訴,扣了37元和10分服務(wù)費(fèi)

“顧客嫌棄放在地上不能吃了……”敲門無人應(yīng),騎手將外賣放門口地上后離開,被投訴,扣了37元和10分服務(wù)費(fèi)

都市快報(bào)橙柿互動(dòng)
2026-04-04 20:36:04
女子參加喪禮被砸死,遺體已停放半年多

女子參加喪禮被砸死,遺體已停放半年多

中國新聞周刊
2026-04-03 18:57:36
這跟不穿有啥區(qū)別?內(nèi)褲外露、開叉開到腰,有錢人的時(shí)尚真看不懂

這跟不穿有啥區(qū)別?內(nèi)褲外露、開叉開到腰,有錢人的時(shí)尚真看不懂

潮鹿逐夢
2026-03-02 17:19:02
澳門世界杯:四強(qiáng)賽對陣出爐,申裕斌強(qiáng)勢橫掃,陳幸同對手確定

澳門世界杯:四強(qiáng)賽對陣出爐,申裕斌強(qiáng)勢橫掃,陳幸同對手確定

秋姐居
2026-04-04 10:29:27
李純才是純女天花板!清純動(dòng)人,美哭了

李純才是純女天花板!清純動(dòng)人,美哭了

東方不敗然多多
2026-04-04 08:27:30
淺野拓磨:日本隊(duì)雖然贏球,但場面表現(xiàn)和強(qiáng)隊(duì)差距還是很明顯

淺野拓磨:日本隊(duì)雖然贏球,但場面表現(xiàn)和強(qiáng)隊(duì)差距還是很明顯

懂球帝
2026-04-04 01:59:07
舅舅是蔣介石,1936年他踩了警察局長小老婆腳,局長打他三耳光

舅舅是蔣介石,1936年他踩了警察局長小老婆腳,局長打他三耳光

宅家伍菇?jīng)?/span>
2025-08-20 15:52:52
3輪0勝距蓉城11分!國安球迷怒斥:5人不配上場,裁判收錢應(yīng)上訴

3輪0勝距蓉城11分!國安球迷怒斥:5人不配上場,裁判收錢應(yīng)上訴

我愛英超
2026-04-04 18:22:08
歐洲人在性方面有多開放?德國再創(chuàng)歷史!女廁所、女浴室隨便進(jìn)了

歐洲人在性方面有多開放?德國再創(chuàng)歷史!女廁所、女浴室隨便進(jìn)了

西樓知趣雜談
2026-03-24 14:38:30
降壓藥再現(xiàn)致癌物質(zhì)?3款降壓藥被召回!國內(nèi)患者需要停藥嗎?

降壓藥再現(xiàn)致癌物質(zhì)?3款降壓藥被召回!國內(nèi)患者需要停藥嗎?

路醫(yī)生健康科普
2026-04-04 09:25:03
鄭麗文徹底撕破臉:罵民進(jìn)黨是“豪豬”,直言解放軍是臺灣后盾!

鄭麗文徹底撕破臉:罵民進(jìn)黨是“豪豬”,直言解放軍是臺灣后盾!

達(dá)文西看世界
2026-04-04 21:33:48
吻住春風(fēng):在花開之前,先吻自己

吻住春風(fēng):在花開之前,先吻自己

疾跑的小蝸牛
2026-04-04 23:54:02
李小萌王雷豪華住宅被曝光,誰能想到王雷的煙成了最大亮點(diǎn)!

李小萌王雷豪華住宅被曝光,誰能想到王雷的煙成了最大亮點(diǎn)!

動(dòng)物奇奇怪怪
2026-04-04 02:24:52
48小時(shí)紅線!中國提前全球通告:敢給戰(zhàn)爭開綠燈,直接一票否決

48小時(shí)紅線!中國提前全球通告:敢給戰(zhàn)爭開綠燈,直接一票否決

策前論
2026-04-04 17:12:15
DDR5崩盤!黃牛囤了一屋子內(nèi)存!

DDR5崩盤!黃牛囤了一屋子內(nèi)存!

中國半導(dǎo)體論壇
2026-04-03 10:23:10
內(nèi)馬爾啊內(nèi)馬爾,你非要親手關(guān)上通往世界杯的大門嗎

內(nèi)馬爾啊內(nèi)馬爾,你非要親手關(guān)上通往世界杯的大門嗎

足壇劉脂導(dǎo)
2026-04-04 11:29:54
2026-04-05 00:39:00
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
11516文章數(shù) 117023關(guān)注度
往期回顧 全部

科技要聞

內(nèi)存一年漲四倍!國產(chǎn)手機(jī)廠商集體漲價(jià)

頭條要聞

特朗普發(fā)文:距離一切災(zāi)難降臨在伊朗頭上僅剩48小時(shí)

頭條要聞

特朗普發(fā)文:距離一切災(zāi)難降臨在伊朗頭上僅剩48小時(shí)

體育要聞

剎不住的泰格·伍茲,口袋里的兩粒藥丸

娛樂要聞

Q女士反擊,否認(rèn)逼宋寧峰張婉婷離婚

財(cái)經(jīng)要聞

中微董事長,給半導(dǎo)體潑點(diǎn)冷水

汽車要聞

17萬級海豹07EV 不僅續(xù)航長還有9分鐘滿電的快樂

態(tài)度原創(chuàng)

游戲
健康
家居
旅游
房產(chǎn)

LPL第二賽段:NIP橫掃WE!坦率的說,真沒有什么看頭

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

家居要聞

溫馨多元 愛的具象化

旅游要聞

櫻郵聯(lián)動(dòng)!郵輪游客赴顧村公園賞櫻,解鎖“一票雙享”新玩法

房產(chǎn)要聞

小陽春全面啟動(dòng)!現(xiàn)房,才是這波行情里最穩(wěn)的上車票

無障礙瀏覽 進(jìn)入關(guān)懷版