国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

阿里春節(jié)突襲,用千問3.5把頂尖模型干成了白菜價

0
分享至



自 AI 概念火熱之后,要說每年過年最熱鬧的地方在哪里?知危覺得答案得是各個大廠的 AI 實驗室和各個媒體編輯部了。

昨晚剛過完年,馬年的第一天,AI 界的 “ 源神 ” Qwen3.5( 千問 3.5 )就突然發(fā)布,雖說之前已經(jīng)有 Qwen3.5 的信息傳出,心里已經(jīng)做好了預(yù)期準(zhǔn)備,但是仔細(xì)看了看這次的新模型特性,還是得感嘆一句,不愧是源神啊!

作為開源界的扛把子,這次新發(fā)的 Qwen3.5-Plus 不僅在推理、編程、Agent 智能體等全方位基準(zhǔn)評估中均表現(xiàn)優(yōu)異,還在視覺理解能力的權(quán)威評測中斬獲數(shù)項性能最佳,性能媲美 Gemini3-Pro 等一線閉源模型。

如果說性能提升是預(yù)期內(nèi)的,那這次更新最令人吃驚的是其同等參數(shù)下的性能表現(xiàn)提升十分驚人。之前萬億參數(shù)的 Qwen3-max,在如今,被只有 4000 億參數(shù)的 Qwen3.5-Plus 所超越。只用不到一半的參數(shù),就能帶來更強的性能,直接的影響就是大眾在算力上的花費更低了。同等性能,Qwen3.5-Plus每百萬 token 現(xiàn)在最低只要 8 毛錢。這比以性價比著稱的 DeepSeek 還要便宜數(shù)倍。在杭州,一公斤白菜也就賣這價。





一般來說,大語言模型界向來奉行 Scaling Law,即誰的參數(shù)大,誰的性能就可能更好,那么這次的千問 3.5 怎么就反其道而行之,參數(shù)變小了,性能反而提升了呢?

這就不得不提到千問大模型團隊在語言模型架構(gòu)上的不斷精進(jìn)。

我們思考一下過去幾年 AI 界的情況,正是因為大家太過于遵守 Scaling Law,導(dǎo)致那些做模型的沒怎么賺到錢。反而是老黃這個賣顯卡的,市值一飛沖天,一度登頂全球市值第一。

參數(shù)暴漲帶來的直接影響就是:我能訓(xùn)練得起,但是用不起了。這在應(yīng)用落地上可不是啥好消息。所以,千問 3.5 就換了個思路,既然現(xiàn)在參數(shù)的邊際效應(yīng)逐漸遞減,那么我們就想辦法提升每個參數(shù)的性價比。

總的來說,千問 3.5 之所以能縮小參數(shù),主要是這幾方面的技術(shù)突破,涉及到技術(shù)方面的事情稍微有點枯燥,咱們就盡量短著點說。

首先是混合注意力機制。這個大家應(yīng)該都聽爛了,不管是訓(xùn)練還是推理,注意力機制所占據(jù)的計算量都是最大的,原因就是它需要讓每個詞和每個詞之間都做( 點積 )計算,來算出詞與詞之間的關(guān)聯(lián)度。所以,這種算法就有個大問題,當(dāng)文本量越來越長之后,每多一個詞,需要的計算量都是遞增的,比如只有十個詞的時候,你多一個詞可能只要多算 10 次,但是當(dāng)達(dá)到 10 萬上下文時,你再加一個詞,就得多算十萬次了,這也是為什么語言模型這么難解決上下文長度的原因。而混合注意力機制,就是在標(biāo)準(zhǔn)注意力機制的基礎(chǔ)上,引入了一種 “ 按需計算 ” 的動態(tài)策略,能根據(jù)語義的重要程度進(jìn)行 “ 差異化處理 ”,如果我發(fā)現(xiàn)某個詞不重要,比如 “ 我養(yǎng)了一只狗 ” 里面的 “ 只 ”,你把 “ 只 ” 說成 “ 條 ”、“ 個 ” 大家也能看懂,那我就不去和每個前文做計算,只計算它身邊的少部分詞,而重要的詞,比如這句話里的 “ 狗 ”,你換成其它的 “ 貓 ”、“ 豬 ” 就完全變意思了,這就會去做全局計算,這樣就能讓效率和精度同時提升。

第二點就是比傳統(tǒng)混合專家( MOE )更極致的稀疏架構(gòu),MOE 架構(gòu)在 DeepSeek V3 那會就火過一陣,簡單理解一下,這就好像把龐大的參數(shù)量,按照知識分類,分成不同的專家,這樣就能通過減少激活的參數(shù),加快推理速度。而千問 3.5 通過更加極致的專家分類,讓整個 397B 參數(shù)的模型,最小只需要激活 17B,這計算量就一下減少了 20 多倍。

剩下的還有原生多 Token 預(yù)測,通過多同時生成幾個詞,加快推理的速度,以及 25 年剛拿了最佳論文獎的用于精確控制輸出結(jié)果的門控機制之類的技術(shù),這四項技術(shù)相輔相成,當(dāng)它們同時作用于一個模型時,帶來的效率躍遷是顛覆性的。想想,每次推理僅激活 17B,卻可以實現(xiàn)與 GPT-5.2、Gemini-3-pro 同級的性能表現(xiàn)。與上一代超萬億 的Qwen3-Max 相比,Qwen3.5-Plus 還以 4000 億參數(shù)實現(xiàn)了性能上的超越,部署顯存占用更是降低 60% 。同時,推理吞吐量最高提升至 19 倍,推理效率大幅提升。



總之,千問3.5通過這些技術(shù)突破,讓模型盡量減少無用的計算,這樣不僅能使用小參數(shù)獲得更好的性能,還能大大減少部署模型對硬件的苛刻要求。

這些技術(shù)非常前沿,但對普通人來說,想要感知技術(shù)那實在是太難了。

那巧了不是,這次的千問 3.5 還有個非常 “ 好用 ” 的更新,除了這些架構(gòu)上的新技術(shù),這次的千問 3.5 在自身能力上,也是展現(xiàn)了團隊對于未來趨勢的判斷,那就是“ 原生多模態(tài) ”。

和一般的語言模型通過文字標(biāo)簽來理解圖片不同,原生多模態(tài),是能直接看懂圖像、視頻、音頻的。它們之間的差別猶如盲人摸象,一個只能看到局部,而原生多模態(tài),則是能完完整整的繞著大象看。

之所以說它 “ 好用 ”,是因為有了原生多模態(tài),你就不只能通過文字和 AI 聊天,你還能通過圖像,更準(zhǔn)確的讓 AI 知道你的意思。

說得多不如上手一試,我們在第一時間拿到千問3.5的使用資格后也是快速的上手試了試,一上手我就給新模型來了個下馬威,直接給它來一個洗車難題。



結(jié)果,回答還沒出,這跳 Token 的速度就把我震驚到了。



這思考鏈 chua~chua~ 的,一行接一行的蹦出來,不愧是加持了四項架構(gòu)黑科技的千問 3.5,而且,它不僅回答得快,這答的也好,在思考完畢后,簡單直接的給出它最終的答案 ——開車過去。

你看,這第一題就把其它某些模型給比下去了,這給了我極大的信心,秉承測不死就往死里測的精神,接下來的測試會直接上一個臺階。

首先,測試一下編程能力,我讓千問 3.5 直接幫我寫一個貪吃蛇的小游戲,問題一提出來,千問 3.5 就開始對任務(wù)進(jìn)行快速拆解。



等思路捋清之后,這代碼和之前一樣,寫得飛快,超長的上下文也是一次就讓整個代碼輸出完成。



等它結(jié)束后,拿千問 3.5 給的代碼去測試,果不其然,一次性成功,中間我沒有給過任何的其它提示,代碼編寫出來的貪吃蛇游戲完整度也非常的高,這個任務(wù)從功能上來說,處理得非常完美。



但只有功能還不夠,于是我又給它提出要求,讓它做好看點,加上特效試試。



程序太長,這里就不展示所有代碼,對于果,夸獎的話我不想多說,大家直接看動圖。



之后我又測試了讓它去做一個創(chuàng)新類的游戲,我告訴它,做一個坦克大戰(zhàn),但是肉鴿版!



千問 3.5 依舊是先思考思路,拆分任務(wù)。





然后chua~chua~的用超長的token,把代碼一口氣寫出來。



這是它完成的第一版游戲,可以說相當(dāng)完善,而且非常好玩,坦克不僅有等級,而且每升一級都能選一個威能提升,要知道,這些都是我只說了一句話讓它做到的。



而這,是我讓它改進(jìn)視覺后的效果。。。



中間我也僅僅只是說了八個字:讓這個游戲好看點。



到這里,編程已經(jīng)沒什么好挑剔的了,但是,讓它僅僅是編程可沒用到任何多模態(tài)的能力,所以第二項,就是要試試它對圖像的理解到底有多深!

首先,我讓它根據(jù)這個圖片來幫我找找茬。



在它短暫的思考過后,直接給出了 6 處不同的結(jié)論,其中有一處女孩的泳衣顏色居然還在思考后,自己給否定掉了,這真的有點像人在對比圖像,然后再思考是不是了。





不過最后從答案上來看,它還是有兩處錯誤的,一個是男人的頭發(fā),一個是那女孩的蝴蝶結(jié)沒找到,但是大家要注意,我給的是一張圖片而不是兩張,它并不能直接去對比兩幅圖的像素,它是需要理解這個圖是分上下的,然后理解上下還有很多相似的圖像,然后再從相似的圖像中找到不對的畫面,這對于一個語言模型來說,這個結(jié)果已經(jīng)夠驚人了。



之后我又給了它一張圖片,這次它不僅能知道圖片里是什么,甚至還能理解反光,最離譜的是,它居然從細(xì)節(jié)信息中,讀出了這張圖片可能是 AI 生成的,而事實也確實如此,只能說它的圖片識別能力,至少在識別 AI 上,已經(jīng)超越大部分人類了!



圖像,編碼似乎都不能難到它,接下來,我得給它一個終極考驗,讓它看視頻??匆曨l和圖片的難度可是天差地別,圖片只有一張,視頻可是一連串的,而且視頻還有分鏡、角度等因素,千問 3.5 想要讀懂視頻,必須對每個鏡頭都能理解到位才行。

首先來個簡單的,我讓它看看這個視頻中,這個帥氣的男人打球技術(shù)如何。

結(jié)果讓我吃驚,它先從整體概況給出答案,然后再分析技術(shù)細(xì)節(jié)分析了戰(zhàn)術(shù)策略,還知道最后扣籃了。甚至還給出了面對這種對手要怎么改進(jìn),這完全就像一個籃球教練在看著你的動作一步步的給你分析,最后給你指導(dǎo)。











看它完成的這么棒,我只能繼續(xù)加大力度,這次我給它來了個畫中畫!這是一個小貓在追電腦屏幕里的元素的視頻,千問 3.5 要理解它,首先得分辨屏幕和現(xiàn)實。







結(jié)果只能說完全難不倒它?。?/strong>

它不僅知道小貓在屏幕前,它甚至還知道里面的游戲名字叫什么,然后分析畫面,為什么小貓會抓屏幕??梢哉f它完全知道怎么回事。

視頻完全拿捏,那如果讓千問 3.5 去根據(jù)視頻要求來編程呢?

我錄制了一段訪問某品牌網(wǎng)站的視頻。



我告訴它,讓它先看視頻,分析一下視頻的內(nèi)容是什么,然后,直接讓它根據(jù)視頻內(nèi)容,編寫出類似的網(wǎng)頁。

中間只是提醒它一次,把沒有的圖片,用色塊表示。







它的編程速度是這樣的。



而這,就是它給的結(jié)果。



不能說一模一樣吧,也至少能說從功能上,幾乎沒有差別。

隨后我又測試了一些其它的視頻畫面。

比如奇怪的搖滾貓。









到現(xiàn)在我其實已經(jīng)對它的能力折服了,不過最后,我還得再測試一下工作場景,所以我給了它一段動畫軟件的視頻。讓它告訴我這里的是什么內(nèi)容。









結(jié)果也在意料之中,經(jīng)過之前的洗禮,我已經(jīng)見怪不怪了,千問 3.5 很好的看出了這是什么軟件,視頻在做什么內(nèi)容,也基本把畫面中所有的文字都讀懂了,可以說,它完全的理解了這個視頻。

那么,這次的測試到這里就結(jié)束了,不知道大家意識到?jīng)]有,在前文的多模態(tài)那部分,我就提到了一點,多模態(tài)的部分代表著千問他們對未來趨勢的判斷。

所以這就有個問題。

拋開價格戰(zhàn)的喧囂,為什么,阿里要死磕 “ 以小勝大 ” 和 “ 原生多模態(tài) ”?

答案很可能就是:智能體。

前段時間,一直改名一直火的 AI Agent OpenClaw,相信關(guān)注 AI 行業(yè)的人應(yīng)該都知道。它是一個通過大語言模型自動幫你辦公的助手,只需要告訴它你要干什么,它直接就能在后臺操作電腦把你想做的事情做完,而要實現(xiàn)它,那么多模態(tài)的能力是必不可少的, 它必須得從畫面中理解現(xiàn)在的電腦在干什么,然后才能指導(dǎo)自己去做。

但這就導(dǎo)致了非常重要的痛點難題:一個是如果我考慮隱私想自己部署,能力強的模型我用不起,能力弱的又沒有用,而如果直接調(diào)用API,假如任務(wù)卡住的話,干一個活,一晚上幾百美元就沒了。。。

在國內(nèi),吐槽它太耗 Token 的人也不少。

而千問 3.5 可能是這些問題目前的最優(yōu)解,既開源,API 也便宜,想自己搭也行,給了大家自由的空間。

在 AI 亟需應(yīng)用落地的時代,盲目的追求“大”語言模型可能越來越不是一個明智的選擇,而像千問 3.5 這樣,不僅針對真實的需求做出對應(yīng)的改進(jìn),而且還堅持開源,說實話,就算是我想找茬,我也找不出要說它不好的點在哪。

可能唯一要吐槽的點就在于,這么好的模型,為什么我今年才用到!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
尷尬,杜蘭特自2023年以來就沒贏過一場季后賽比賽,能贏湖人隊嗎

尷尬,杜蘭特自2023年以來就沒贏過一場季后賽比賽,能贏湖人隊嗎

好火子
2026-04-18 05:00:49
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
浙江寧波市委書記帶隊赴安徽合肥考察:認(rèn)真學(xué)習(xí)借鑒好經(jīng)驗好做法

浙江寧波市委書記帶隊赴安徽合肥考察:認(rèn)真學(xué)習(xí)借鑒好經(jīng)驗好做法

澎湃新聞
2026-04-18 04:18:50
極大反差:中國人暴跌55%,日本外國游客又創(chuàng)新高,俄羅斯人增26%

極大反差:中國人暴跌55%,日本外國游客又創(chuàng)新高,俄羅斯人增26%

壹只灰鴿子
2026-04-15 22:41:48
特朗普:美國將獲得伊朗所有核“塵埃”

界面新聞
2026-04-17 22:16:29

后悔莫及!火箭不要的新秀,徹底完成蛻變,21歲有望成為聯(lián)盟超巨

后悔莫及!火箭不要的新秀,徹底完成蛻變,21歲有望成為聯(lián)盟超巨

體育大朋說
2026-04-18 05:05:03
真自宣?沙特主帥:我已被沙特足協(xié)解雇,很遺憾但這就是足球

真自宣?沙特主帥:我已被沙特足協(xié)解雇,很遺憾但這就是足球

懂球帝
2026-04-18 00:42:08
北京電影節(jié)開幕式紅毯:高圓圓舒淇好美,高葉造型亮眼,尹正瘦了

北京電影節(jié)開幕式紅毯:高圓圓舒淇好美,高葉造型亮眼,尹正瘦了

八卦先生
2026-04-16 23:19:54
深大一口氣停招26個專業(yè),這些“坑”你還在踩嗎?

深大一口氣停招26個專業(yè),這些“坑”你還在踩嗎?

牛鍋巴小釩
2026-04-17 13:18:03
太細(xì)!《街霸》電影提到大腿梗 網(wǎng)友:這腿也敢叫春麗?

太細(xì)!《街霸》電影提到大腿梗 網(wǎng)友:這腿也敢叫春麗?

游民星空
2026-04-17 20:56:30
71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

月滿大江流
2026-04-16 13:54:38
中超積分榜:西南三隊依舊領(lǐng)跑,國安清零負(fù)分,三隊未轉(zhuǎn)正

中超積分榜:西南三隊依舊領(lǐng)跑,國安清零負(fù)分,三隊未轉(zhuǎn)正

懂球帝
2026-04-17 22:24:00
廣東“莫氏雞煲大公主”爆火前后反差大,晚上干到凌晨2點才收工,發(fā)文吐槽:這個雞你們是非吃不可嗎

廣東“莫氏雞煲大公主”爆火前后反差大,晚上干到凌晨2點才收工,發(fā)文吐槽:這個雞你們是非吃不可嗎

大象新聞
2026-04-15 12:57:04
330克純金打造邁巴赫車標(biāo),出自深圳水貝!網(wǎng)友:好好保管

330克純金打造邁巴赫車標(biāo),出自深圳水貝!網(wǎng)友:好好保管

極目新聞
2026-04-17 11:05:47
請保姆11年,我想說句真心話:別把保姆當(dāng)家人,那樣會害了她們

請保姆11年,我想說句真心話:別把保姆當(dāng)家人,那樣會害了她們

小馬達(dá)情感故事
2026-04-17 19:25:03
央視直言荷蘭站或遭無積分,張雪洞察規(guī)則并非怯懦,歐美老廠聯(lián)合暗戰(zhàn)令人厭惡

央視直言荷蘭站或遭無積分,張雪洞察規(guī)則并非怯懦,歐美老廠聯(lián)合暗戰(zhàn)令人厭惡

小影的娛樂
2026-04-18 05:36:44
重磅新規(guī)!5月1日起反腐全面收緊,在職退休均終身追責(zé)

重磅新規(guī)!5月1日起反腐全面收緊,在職退休均終身追責(zé)

開心美食白科
2026-04-17 20:32:09
14歲被送上導(dǎo)演的床,17歲拍全裸寫真,被操控半生,如今怎樣了?

14歲被送上導(dǎo)演的床,17歲拍全裸寫真,被操控半生,如今怎樣了?

東方不敗然多多
2026-04-17 13:38:06
我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

草莓解說體育
2026-04-12 17:05:01
剛剛,史詩級利好!全球沸騰,原油崩盤!霍爾木茲,開放了!

剛剛,史詩級利好!全球沸騰,原油崩盤!霍爾木茲,開放了!

中國基金報
2026-04-17 22:06:35
2026-04-18 09:12:49
知危 incentive-icons
知危
投資不立危墻之下
561文章數(shù) 1836關(guān)注度
往期回顧 全部

科技要聞

7家頭部平臺被罰沒35.97億元

頭條要聞

“張雪機車”奪超級桿位賽第二名

頭條要聞

“張雪機車”奪超級桿位賽第二名

體育要聞

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態(tài)度原創(chuàng)

教育
旅游
藝術(shù)
游戲
軍事航空

教育要聞

五育融合,到底“融”在哪里?

旅游要聞

90個品種萬余盆杜鵑花亮相,醉白池公園邀你共賞春色

藝術(shù)要聞

鄭麗文深藍(lán)西裝亮相,洪秀柱書法作品引關(guān)注!

魔獸世界:時光服突然變臉,先斬后奏上線時光徽章,意欲何為?

軍事要聞

美宣布黎以?;?0天 以方稱不會撤軍

無障礙瀏覽 進(jìn)入關(guān)懷版