国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Qwen3 發(fā)布,阿里也要靠多模態(tài)和性價(jià)比打天下了

0
分享至

今天凌晨,阿里云正式發(fā)布了Qwen3系列,一口氣開源了從0.6B到235B共8款模型:2個(gè)MoE大模型和6個(gè)Dense大模型,構(gòu)成了阿里完整的模型矩陣。

這次Qwen3的開源重塑了大模型標(biāo)準(zhǔn),可以說在“后DeepSeek R1”時(shí)代,以阿里為代表的國(guó)內(nèi)大廠,正在借助產(chǎn)品化思維,以性價(jià)比和多模態(tài)能力全方位搶奪DeepSeek的市場(chǎng)影響力。

01

Qwen3再一次拉高了世界開源標(biāo)準(zhǔn)

這回阿里云開源的Qwen3,在架構(gòu)、性能、推理速度和應(yīng)用方向上均有較大創(chuàng)新和提升。Qwen3系列在模型架構(gòu)上采用了MoE(混合專家)架構(gòu)。

旗艦?zāi)P?Qwen3-235B-A22B 擁有約2350億的總參數(shù)量,在每次推理時(shí)僅僅激活約220億參數(shù),性能極其耐打,在綜合能力、代碼與數(shù)學(xué)、多語言能力、知識(shí)與推理等多項(xiàng)基準(zhǔn)測(cè)試中,都能與DeepSeek R1、OpenAI o1、o3-mini、Grok 3和谷歌Gemini 2.5 Pro等目前市場(chǎng)上的主流大模型相抗衡。

一個(gè)亮點(diǎn)是:Qwen3-4B模型憑借極低的參數(shù)量,在一系列基準(zhǔn)測(cè)試中與GPT-4o(2024-11-20版本)打了個(gè)有來有回。這體現(xiàn)了阿里在推理效率上的提升并非以犧牲能力為代價(jià)。

其輕量化模型Qwen3-30B-A3B和32B,在許多任務(wù)上的表現(xiàn)也足夠令人滿意。

除了基準(zhǔn)測(cè)試上亮眼的表現(xiàn)外,Qwen3系列這回的一個(gè)主要?jiǎng)?chuàng)新特點(diǎn)是:混合思考模式。這種設(shè)計(jì)讓用戶能根據(jù)任務(wù)難度控制模型的推理量:思考模式下,模型能夠逐步推理,適合復(fù)雜問題,強(qiáng)調(diào)深度思考。無思考模式:模型快速響應(yīng),適合簡(jiǎn)單問題,優(yōu)先速度。難問題用更多推理,簡(jiǎn)單問題快速解答。

并且,Qwen3為了在國(guó)際應(yīng)用端擴(kuò)展影響力,已經(jīng)能夠支持119種語言和方言。外網(wǎng)的各國(guó)網(wǎng)友對(duì)其的評(píng)價(jià)都很不錯(cuò),橫向?qū)Ρ鹊脑?,Qwen3已經(jīng)追上或者超越了OpenAI o1、谷歌Gemini 2.5 Pro。

Qwen3還針對(duì)最近半年爆火的“AI智能體”概念做出了優(yōu)化,強(qiáng)調(diào)了“智能體”能力。比如它們強(qiáng)化了Qwen3 模型的編碼和代理能力,并增強(qiáng)了對(duì) MCP 的支持,讓Qwen3 學(xué)會(huì)如何思考以及如何與環(huán)境交互。

在預(yù)訓(xùn)練方面,Qwen3 的數(shù)據(jù)集相比 Qwen2.5 幾乎翻了一倍,達(dá)到了3.6萬億個(gè)token,覆蓋了更廣泛的領(lǐng)域知識(shí)和語境,再度提升了在復(fù)雜任務(wù)處理和多語言場(chǎng)景中的表現(xiàn)。

這回Qwen3系列的開源,統(tǒng)一采用Apache 2.0開源協(xié)議開放權(quán)重。通過“小杯-中杯-大杯-超大杯”的產(chǎn)品邏輯構(gòu)建了一個(gè)完整的“Qwen宇宙”。

綜合來看,Qwen3 在單純的技術(shù)性能、成本價(jià)格、工具調(diào)用和MCP調(diào)用等所有方面獲得了全面的提升,其已經(jīng)將開源世界的標(biāo)準(zhǔn)提升了一個(gè)層次。

02

DeepSeek光環(huán)下的大廠百態(tài)

4月25日的2025百度AI開發(fā)者大會(huì)上,百度創(chuàng)始人李彥宏點(diǎn)名批評(píng)DeepSeek“不是萬能的,它只能處理單一的文本,不能理解聲音、圖片、視頻等多模態(tài)內(nèi)容。更大的問題是慢和貴,中國(guó)市場(chǎng)上絕大多數(shù)大模型API的價(jià)格都更低,而且反應(yīng)速度更快?!?/p>

他點(diǎn)出了DeepSeek龐大光環(huán)下,中國(guó)的大廠正在走向用性價(jià)比抗衡DeepSeek的現(xiàn)狀:用更小參數(shù),更低成本的方式,實(shí)現(xiàn)更快的響應(yīng),完成不屬于DeepSeek的多模態(tài)效果。

阿里的Qwen3迅速引入MoE架構(gòu)和雙模式推理設(shè)計(jì),將龐大模型在實(shí)際使用中的成本大幅降低。憑借DeepSeek R1三分之一的參數(shù)量,性能全面超越R1。

首先,Qwen3的MoE架構(gòu)使得推理過程中僅激活部分專家,從而降低了實(shí)際計(jì)算開銷。例如,Qwen3-235B-A22B雖然總參數(shù)達(dá)235B,但每個(gè)token只需計(jì)算其中約9%(22B)的參數(shù)。這意味著在相近硬件條件下,其推理延遲并不像參數(shù)規(guī)??瓷先ツ菢痈卟豢膳?。

其次,Qwen3的雙模式推理設(shè)計(jì)高效地分配算力。在“非思考模式”下,模型可直接生成答案,實(shí)現(xiàn)接近即時(shí)的響應(yīng);而在需要“思考模式”時(shí),才投入額外計(jì)算資源進(jìn)行多步推理。這種按需分配計(jì)算的策略,使模型在大部分簡(jiǎn)單交互中保持了快速性,又能在關(guān)鍵時(shí)刻發(fā)揮深度推理能力。

這其實(shí)與騰訊的雙軌思路相似。2025年2月13日,騰訊元寶接入DeepSeek R1滿血版,幾天之后就上線了 “強(qiáng)推理深度思考模型”混元T1模型,隨即混元團(tuán)隊(duì)官宣Turbo S模型上線測(cè)試,號(hào)稱在響應(yīng)速度上比DeepSeek R1更快。Turbo模型針對(duì)日常對(duì)話進(jìn)行優(yōu)化,弱化長(zhǎng)鏈推理而追求即時(shí)回答能力。騰訊內(nèi)部的AI助手“元寶”應(yīng)用中,就集成了Turbo快思考和T1深思考兩種模型,允許用戶在需要詳細(xì)推理時(shí)調(diào)用T1,平時(shí)默認(rèn)用Turbo即時(shí)回答。

這種雙軌策略,與阿里Qwen3單模型雙模式有異曲同工之妙,都是為不同復(fù)雜度的問題提供差異化模型,既保證效果又保證速度。

DeepSeek R1自從正式上線以來,其幻覺現(xiàn)象頻發(fā)就成為了各大廠商瞄準(zhǔn)的攻堅(jiān)對(duì)象。

百度就是其中的代表。百度在國(guó)內(nèi)大模型競(jìng)爭(zhēng)中經(jīng)歷了一個(gè)明顯的策略轉(zhuǎn)折:從最初堅(jiān)持閉源、尋求商業(yè)變現(xiàn),到在DeepSeek等沖擊下宣布開源、全面免費(fèi)的重大轉(zhuǎn)向。

2025年3月16日,百度如期發(fā)布了文心大模型4.5。文心4.5被定義為百度首個(gè)“原生多模態(tài)”大模型,具備圖像、文本、音頻等多模態(tài)聯(lián)合理解與生成能力。它引入了深度思考能力,能夠進(jìn)行復(fù)雜問題的逐步推理,并集成了百度自研的iRAG檢索增強(qiáng)技術(shù)。

通過“深度搜索”功能,文心4.5可以自動(dòng)檢索外部知識(shí)以回答用戶問題,顯著降低了幻覺率,這也是百度迎戰(zhàn)DeepSeek的底氣所在。

在價(jià)格方面,百度也正在開始加碼。前幾天的百度AI開發(fā)者大會(huì)上發(fā)布的文心4.5Turbo,相比于文心4.5價(jià)格下降80%,每百萬token的輸入輸出價(jià)格僅為DeepSeek V3的40%。DeepSeek的成本優(yōu)勢(shì)正在大廠們的面前蕩然無存。

字節(jié)跳動(dòng)為了應(yīng)對(duì)DeepSeek的競(jìng)爭(zhēng),則將自身的產(chǎn)品重心放在了多模態(tài)上。從旗下火山引擎團(tuán)隊(duì)于2024年5月首次對(duì)外全面介紹了代號(hào)“豆包”的大模型家族,一口氣亮相了9個(gè)模型開始,豆包就著重多模態(tài)模型上的發(fā)展。

與其他廠商喜歡強(qiáng)調(diào)模型參數(shù)和基準(zhǔn)測(cè)試成績(jī)不同,字節(jié)刻意淡化參數(shù)規(guī)模與榜單,轉(zhuǎn)而突出實(shí)際落地效果和低使用門檻,力求讓大模型真正融入多樣化的實(shí)際場(chǎng)景。

本月中旬,豆包1.5深度思考模型上線,除了在數(shù)學(xué)推理、編程競(jìng)賽、科學(xué)推理等專業(yè)領(lǐng)域上表現(xiàn)超越DeepSeek R1之外,最大的亮點(diǎn)是Doubao-1.5-thinking-pro-vision具備了視覺推理理解能力,同時(shí)豆包文生圖模型3.0版本發(fā)布,進(jìn)一步豐富了多模態(tài)生態(tài)。

字節(jié)跳動(dòng)的多模態(tài)戰(zhàn)略背后,是敏銳感知到了大模型從技術(shù)概念轉(zhuǎn)向產(chǎn)品概念的路徑。后DeepSeek R1時(shí)代里,單純追求參數(shù)規(guī)模和技術(shù)指標(biāo)的提升已不足以構(gòu)建產(chǎn)品護(hù)城河了。

字節(jié)跳動(dòng)帶著這家宇宙大廠的“互聯(lián)網(wǎng)基因”,加入了大模型競(jìng)爭(zhēng)。多模型并進(jìn)確保了其在文本、語音、圖像各方面全面開花;極低價(jià)格和廣泛產(chǎn)品植入為其贏得了規(guī)模和數(shù)據(jù)。

總的來看,除了單純的專業(yè)領(lǐng)域的基準(zhǔn)測(cè)試刷分之外,價(jià)格、響應(yīng)、多模態(tài)都已經(jīng)成了各大廠商應(yīng)對(duì)DeepSeek競(jìng)爭(zhēng)的有力武器。當(dāng)基礎(chǔ)語言對(duì)話能力很難拉開差距時(shí),各大廠用產(chǎn)品思維找到了迅速突圍DeepSeek的差異化功能。

03

開源生態(tài)的長(zhǎng)短期利益結(jié)合

隨著DeepSeek、Llama、Qwen、智譜在開源生態(tài)構(gòu)建上付出了越來越多的努力,開源已經(jīng)成為主流路線之一。過去大廠傾向于閉源謀利,而如今開源被證明是贏得生態(tài)和快速迭代的有效途徑。DeepSeek進(jìn)一步刺激了大廠擁抱開源生態(tài)的決心,阿里全面開源千問證明了 “模型開源是AI時(shí)代的主題”。

不難看出,國(guó)內(nèi)大模型正走向一個(gè)比拼綜合實(shí)力和效率的時(shí)代,而不再僅以參數(shù)和單點(diǎn)性能論英雄。

Qwen3、DeepSeek以及騰訊、百度、字節(jié)的各種“模型”迭代實(shí)踐,折射出了一種轉(zhuǎn)變:大家都在追求更高的性價(jià)比——既要性能足夠好,又要成本足夠低、應(yīng)用足夠廣。

可以說,我們正在進(jìn)入AI的下半場(chǎng)。

OpenAI的研究員姚順雨前段時(shí)間曾發(fā)長(zhǎng)文,探討AI的下半場(chǎng)該專注于哪里:“從現(xiàn)在開始,AI將從解決問題轉(zhuǎn)向定義問題。為了在‘下半場(chǎng)’蓬勃發(fā)展,人們需要及時(shí)轉(zhuǎn)變思維方式和技能,更接近產(chǎn)品經(jīng)理的水平?!?/p>

根據(jù)晚點(diǎn)訪談,阿里云CTO、通義實(shí)驗(yàn)室負(fù)責(zé)人周靖人對(duì)于開源大模型的戰(zhàn)略意義:首先,模型作為核心生產(chǎn)要素,開源能加速其普及,推動(dòng)產(chǎn)業(yè)快速發(fā)展;其次,開源已成為大模型創(chuàng)新的重要驅(qū)動(dòng)力。

可以預(yù)見的是:國(guó)內(nèi)大模型的落地方向?qū)⒏淤N近實(shí)際應(yīng)用,不再只是實(shí)驗(yàn)室里的模型比拼。這也給開源大模型的參數(shù)效率、推理成本提供了一個(gè)更加激烈的競(jìng)爭(zhēng)區(qū)域。

歡迎在評(píng)論區(qū)留言~
如需開白請(qǐng)加小編微信:dongfangmark

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
婚外情睡過之后,基本就廢了

婚外情睡過之后,基本就廢了

加油丁小文
2025-11-23 07:00:06
特朗普通告全球,不許3國(guó)買俄油,話音剛落,中方第一個(gè)宣布不服

特朗普通告全球,不許3國(guó)買俄油,話音剛落,中方第一個(gè)宣布不服

愛下廚的阿釃
2026-01-09 10:43:43
林俊杰們用行動(dòng)證明:男人的終極審美,真的很一致

林俊杰們用行動(dòng)證明:男人的終極審美,真的很一致

橙星文娛
2026-01-03 21:41:06
張紀(jì)中狂吃補(bǔ)品應(yīng)付X需求!向涵之無縫銜接!

張紀(jì)中狂吃補(bǔ)品應(yīng)付X需求!向涵之無縫銜接!

八卦瘋叔
2026-01-08 12:00:11
新年第一瓜,老王的小嬌妻留不住了!

新年第一瓜,老王的小嬌妻留不住了!

仕道
2026-01-07 10:29:10
1月翻身轉(zhuǎn)運(yùn):這三大生肖貴人相助,財(cái)運(yùn)順?biāo)焐蠐P(yáng)

1月翻身轉(zhuǎn)運(yùn):這三大生肖貴人相助,財(cái)運(yùn)順?biāo)焐蠐P(yáng)

人閒情事
2026-01-07 13:44:15
宗馥莉突發(fā)重大調(diào)整,有戲看了

宗馥莉突發(fā)重大調(diào)整,有戲看了

新浪財(cái)經(jīng)
2026-01-08 20:16:51
楊少俠提干了

楊少俠提干了

靜易墨
2026-01-08 21:28:56
女性的私處哪種形態(tài)更好?女性陰部的形狀類型有哪些?不妨來了解

女性的私處哪種形態(tài)更好?女性陰部的形狀類型有哪些?不妨來了解

醫(yī)者榮耀
2025-12-25 12:05:06
君塚日向,32歲才開始展露頭角,絕佳氣質(zhì)真絕了

君塚日向,32歲才開始展露頭角,絕佳氣質(zhì)真絕了

TVB的四小花
2026-01-09 01:35:43
特朗普稱委內(nèi)瑞拉已同意將其石油銷售所得收入僅用于購買美國(guó)制造的商品

特朗普稱委內(nèi)瑞拉已同意將其石油銷售所得收入僅用于購買美國(guó)制造的商品

極目新聞
2026-01-08 14:16:23
我媽90歲還能生活自理,她的長(zhǎng)壽秘訣就一句:“別老想著走動(dòng)”

我媽90歲還能生活自理,她的長(zhǎng)壽秘訣就一句:“別老想著走動(dòng)”

蟬吟槐蕊
2025-12-28 14:32:30
做最壞打算!中國(guó)055大驅(qū)第二批加速,美媒:還有被美軍扣船隱憂

做最壞打算!中國(guó)055大驅(qū)第二批加速,美媒:還有被美軍扣船隱憂

荷蘭豆愛健康
2026-01-09 11:08:47
上海一老人沉迷古玩幻想暴富,被小伙捧殺騙走200萬,“家里上億”的雞缸杯就有20個(gè)……

上海一老人沉迷古玩幻想暴富,被小伙捧殺騙走200萬,“家里上億”的雞缸杯就有20個(gè)……

環(huán)球網(wǎng)資訊
2026-01-07 22:06:45
錢小豪“毀滅史”,他的故事比你想得更惡劣

錢小豪“毀滅史”,他的故事比你想得更惡劣

比利
2025-12-21 11:26:52
全網(wǎng)玩?!八狳S瓜”,資本緊急切割,狂妄的閆學(xué)晶,終于付出代價(jià)

全網(wǎng)玩?!八狳S瓜”,資本緊急切割,狂妄的閆學(xué)晶,終于付出代價(jià)

李健政觀察
2026-01-07 11:49:17
尿是黃色!金子也是黃色!德國(guó)男子為了提煉黃金,煮了五千升尿液

尿是黃色!金子也是黃色!德國(guó)男子為了提煉黃金,煮了五千升尿液

扶蘇聊歷史
2025-12-25 16:18:51
反轉(zhuǎn)!三亞吃海鮮被宰續(xù): 商家喊冤回應(yīng),退1000元和解,官方回應(yīng)

反轉(zhuǎn)!三亞吃海鮮被宰續(xù): 商家喊冤回應(yīng),退1000元和解,官方回應(yīng)

古裝影視解說阿兇
2026-01-09 11:33:06
萬億央企蛀蟲終于揪出來了!離職七年難逃法網(wǎng),25年腐化史現(xiàn)真容

萬億央企蛀蟲終于揪出來了!離職七年難逃法網(wǎng),25年腐化史現(xiàn)真容

趣文說娛
2026-01-08 18:50:49
忍無可忍!籃球?qū)<彝磁褐辈グ岬讲耸袌?chǎng),CBA早晚要出事

忍無可忍!籃球?qū)<彝磁褐辈グ岬讲耸袌?chǎng),CBA早晚要出事

體育哲人
2026-01-08 12:46:07
2026-01-09 13:31:00
直面派 incentive-icons
直面派
講述值得講述的真實(shí)故事
244文章數(shù) 236關(guān)注度
往期回顧 全部

科技要聞

市場(chǎng)偏愛MiniMax:開盤漲42%,市值超700億

頭條要聞

男子開車撞死1家3口獲死緩 14秒速度從0飆至129km/h

頭條要聞

男子開車撞死1家3口獲死緩 14秒速度從0飆至129km/h

體育要聞

世乒賽銀牌得主,說自己夢(mèng)里都是孫穎莎

娛樂要聞

檀健次戀愛風(fēng)波越演越烈 上學(xué)經(jīng)歷被扒

財(cái)經(jīng)要聞

郁亮的萬科35年:從"寶萬之爭(zhēng)"到"活下去"

汽車要聞

更智能更豪華 樂道L90加配置會(huì)貴多少?

態(tài)度原創(chuàng)

游戲
房產(chǎn)
教育
藝術(shù)
時(shí)尚

《PUBG:BLINDSPOT》定檔2月5日上線搶先體驗(yàn)版

房產(chǎn)要聞

豪宅搶瘋、剛需撿漏……2025年,一張房票改寫了廣州市場(chǎng)格局

教育要聞

上海幼教專家團(tuán)在祖國(guó)最東地“把脈”

藝術(shù)要聞

Sean Yoro:街頭藝術(shù)界的“沖浪高手”

60+女性穿搭指南來了:4招告別“大媽感”,解鎖冬日優(yōu)雅氣質(zhì)

無障礙瀏覽 進(jìn)入關(guān)懷版