国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

“Qwen3之后,我才真正敢投AI應(yīng)用”

0
分享至

作者 | Yoky
郵箱 | yokyliu@pingwest.com

2025年4月29日凌晨,距離通義千問(wèn)Qwen3正式發(fā)布還有5小時(shí),X和GitHub上的開發(fā)者們已經(jīng)搬好小板凳蹲守發(fā)布。開源社區(qū)的技術(shù)愛好者們熬夜刷新,等待第一時(shí)間測(cè)試和體驗(yàn)這款備受期待的中國(guó)大模型新作。

甚至中國(guó)開發(fā)者已經(jīng)蹲守通宵,在發(fā)布凌晨5點(diǎn)發(fā)布的第一時(shí)間測(cè)試并發(fā)布了評(píng)測(cè)報(bào)告。

這樣的現(xiàn)象曾經(jīng)只在OpenAI發(fā)布新模型前出現(xiàn)過(guò)如此關(guān)注度。如今,中國(guó)大模型也能引發(fā)全球開發(fā)者如此熱切的期待,不僅是模型技術(shù)的突破,也是因?yàn)閷?duì)于開發(fā)者和企業(yè)而言,能夠真正用起來(lái),產(chǎn)生產(chǎn)業(yè)價(jià)值。

“在為企業(yè)在國(guó)內(nèi)選模型,基本上只有Qwen和DeepSeek兩個(gè)選項(xiàng),但R1參數(shù)太大了,很多場(chǎng)景不需要那么強(qiáng)的性能。對(duì)比來(lái)看,千問(wèn)系列提供了從小到大全系列參數(shù)規(guī)模的選擇,在任何場(chǎng)景下都能找到適合的模型?!盇gent數(shù)字員工應(yīng)用公司語(yǔ)核科技創(chuàng)始人翟星吉告訴我們。

尤其在Qwen3發(fā)布之后,模型尺寸從0.6B到235B再度拓寬光譜,并且進(jìn)一步降低了部署和推理成本之后,企業(yè)和開發(fā)者的門檻再度被磨平,也為應(yīng)用生態(tài)的爆發(fā)奠定了基礎(chǔ)。

“Qwen3以后,我才真正敢投大模型應(yīng)用。”一位投資人對(duì)硅星人坦白:“端側(cè)算力不足是事實(shí),如果一味用云端模型沒(méi)法本地部署,很多功能被限制用戶也會(huì)擔(dān)心隱私的問(wèn)題?!?/p>

大模型競(jìng)賽的第一賽段已經(jīng)過(guò)去,淘金之后企業(yè)和開發(fā)者能夠選擇有足夠性能的模型其實(shí)并不多,而Qwen似乎已經(jīng)成為了中國(guó)環(huán)境的首選。

以服務(wù)產(chǎn)業(yè)為目標(biāo)做模型

回顧Qwen系列模型的發(fā)展歷程,能夠發(fā)現(xiàn)其與其他大模型的核心區(qū)別:不是單純追求技術(shù)領(lǐng)先,而是以服務(wù)產(chǎn)業(yè)實(shí)際需求為導(dǎo)向。

做“精”還是做“全”,DeepSeek和Qwen代表著這兩個(gè)技術(shù)的方向。

Qwen系列模型以“全譜系”布局策略,為不同場(chǎng)景提供針對(duì)性解決方案。從參數(shù)規(guī)模來(lái)看,Qwen3涵蓋從輕量級(jí)的0.6B、1.7B、4B、8B、14B、32B稠密模型,到30B-A3B和235B-A22B的混合專家模型,覆蓋了從端側(cè)到云端的所有部署需求。在模型類型上,更大的Qwen系列不僅有基礎(chǔ)語(yǔ)言模型,還包括推理模型、多模態(tài)視覺(jué)理解(VLM)、圖像生成、視頻理解等全模態(tài)能力。

翟星吉指出:“它的模型系列覆蓋得很全,從文本到VL多模態(tài)識(shí)別,再到推理模型,你會(huì)發(fā)現(xiàn)全套它都有。它很早就探索了QVQ,就是視覺(jué)推理模型?!?/b>

這種全譜系布局使得各類企業(yè)都能找到適合自己場(chǎng)景的模型。例如,兒童智能玩具創(chuàng)業(yè)公司躍然創(chuàng)新創(chuàng)始人李勇告訴我們:“之前受限于芯片性能、成本和功耗,無(wú)法在端側(cè)部署推理模型。但Qwen3-0.6B的推出讓端側(cè)部署成為可能,端側(cè)部署意味著無(wú)需聯(lián)網(wǎng),解決了隱私問(wèn)題,同時(shí)消除了網(wǎng)絡(luò)限制和Token計(jì)費(fèi)成本?!?/p>

更廣泛的應(yīng)用場(chǎng)景看,Qwen為各類終端設(shè)備提供了精準(zhǔn)匹配的解決方案:0.6B和1.7B模型支持開發(fā)者用于推測(cè)性解碼和小終端部署;4B模型適合手機(jī)端側(cè)應(yīng)用優(yōu)化;8B模型可針對(duì)電腦或智能汽車座艙場(chǎng)景設(shè)計(jì);14B模型適合普通開發(fā)者和中小企業(yè)使用,資源需求適中;32B模型是企業(yè)最喜歡的規(guī)模,支持大規(guī)模商業(yè)部署;MoE模型則為追求極致性能的場(chǎng)景提供服務(wù)。

翟星吉解釋道:“你像我們給客戶部署,如果要推理模型,我肯定會(huì)考慮大部分客戶資源情況,很多人會(huì)選擇基于千問(wèn)32B的流量版本的推理模型,或者直接用QWQ-32B。”

相比之下,Llama比Qwen更早開源,但卻在后續(xù)的發(fā)展中逐漸成為了開源的第二選擇。首先其在參數(shù)規(guī)模選擇上存在明顯短板。Llama的大模型如400B-500B參數(shù)規(guī)模對(duì)企業(yè)而言難以部署,需要龐大的計(jì)算資源;而70B參數(shù)的模型又被開發(fā)者普遍認(rèn)為能力不足。

相比之下,千問(wèn)72B被認(rèn)為剛好達(dá)到了企業(yè)能負(fù)擔(dān)的最大參數(shù)規(guī)模,在性能和成本之間取得了平衡。另一位開發(fā)者解釋道:“我們測(cè)算下來(lái),企業(yè)最多就是部署72B的模型,再大就部署不了了?!?/p>

其次,Llama在多語(yǔ)言特別是中文能力上明顯不足?!爸形恼Z(yǔ)境下,Llama語(yǔ)料數(shù)據(jù)比較少,它只有5%的多語(yǔ)種數(shù)據(jù),95%的英語(yǔ)語(yǔ)種數(shù)據(jù)。所以大家會(huì)覺(jué)得它在中文場(chǎng)景下有點(diǎn)笨。”這導(dǎo)致Llama在全球化應(yīng)用場(chǎng)景中的適應(yīng)性不佳,尤其對(duì)中文開發(fā)者而言,其實(shí)用價(jià)值大打折扣。

這種策略的成功體現(xiàn)在Qwen在開源社區(qū)獲得的廣泛認(rèn)可上:全球衍生模型數(shù)量已超過(guò)10萬(wàn),下載量超過(guò)3億,在HuggingFace社區(qū)2024年全球模型下載量中占比超30%。在2025年2月的Huggingface全球開源大模型榜單中,排名前十的開源模型全部都基于Qwen二次開發(fā)。

為預(yù)訓(xùn)練Agent,提供BaseModel

“現(xiàn)在一個(gè)Agent不開出多模態(tài)的話,肯定是沒(méi)有前途的?!鄙鲜鐾顿Y人講道:“在當(dāng)前階段,構(gòu)建智能Agent需要模型具備強(qiáng)大的多模態(tài)理解能力、推理能力和自主決策能力?!?b>當(dāng)Agent儼然已經(jīng)成為了下一代應(yīng)用的核心,而構(gòu)建高效Agent需要強(qiáng)大的底層模型支持。

有了在制造業(yè)深耕Agent的諸多嘗試后,翟星吉認(rèn)為現(xiàn)在到了一個(gè)Agent的關(guān)鍵節(jié)點(diǎn),“我們現(xiàn)在做的Agent,比如像Manus背后肯定還是有手搭的workflow。如果嘗試不再是固定流程的,它是智能判斷的,我需要找這個(gè)人干什么,我需要下單,我需要找這個(gè)人驗(yàn)證,我需要取消,那在這場(chǎng)景下,就需要基于一個(gè)強(qiáng)大的base model做預(yù)訓(xùn)練的Agent模型?!?/p>

“首先它應(yīng)該是一個(gè)推理模型,這是基礎(chǔ)的。然后在推理模型上去做再訓(xùn)練,把整個(gè)任務(wù)的第一步、第二步、第三步的路徑數(shù)據(jù),以及在每一步的思考數(shù)據(jù),為什么要這么做的思考數(shù)據(jù),以及最終的結(jié)果數(shù)據(jù)全部標(biāo)出來(lái),標(biāo)出來(lái)之后用強(qiáng)化學(xué)習(xí)的方式讓它不停地去迭代。”

這種訓(xùn)練方法本質(zhì)上是教會(huì)模型如何進(jìn)行任務(wù)分解、如何思考以及如何利用工具,而千問(wèn)作為基礎(chǔ)模型提供了強(qiáng)大的語(yǔ)言理解能力和邏輯推理框架。翟星吉進(jìn)一步補(bǔ)充:“我們到現(xiàn)在都是自己寫推理模板,讓大模型去按照這個(gè)推理模板一步一步走,但未來(lái)希望Agent一步到位就出來(lái)推理模板,不需要我們?nèi)ヌ峁┝?,它自己?huì)思考,自己會(huì)形成一個(gè)推理的架構(gòu)和路徑模板,這對(duì)基礎(chǔ)模型的能力要求很高?!?/p>

Qwen3的混合推理能力,為Agent開發(fā)提供了更靈活的思考與決策框架。在推理模式下,模型會(huì)執(zhí)行更多中間步驟,而在非推理模式下,模型則可快速遵循指令生成答案。這種能力與人類思維極為相似:對(duì)簡(jiǎn)單問(wèn)題快速作答,面對(duì)復(fù)雜問(wèn)題則深思熟慮。在開發(fā)智能Agent時(shí),這種混合推理能力顯得尤為重要。

千問(wèn)還進(jìn)一步通過(guò)Qwen-Agent與MCP(Model-as-Copilot Platform)的結(jié)合降低了開發(fā)門檻,這一創(chuàng)新舉措使得開發(fā)者能夠以更低成本快速構(gòu)建智能應(yīng)用。傳統(tǒng)的Agent開發(fā)需要專業(yè)的AI工程師和大量資源投入,而Qwen-Agent框架與MCP平臺(tái)的結(jié)合,創(chuàng)造了一種'低代碼'的Agent開發(fā)模式。開發(fā)者只需定義任務(wù)流和工具集,系統(tǒng)會(huì)自動(dòng)處理復(fù)雜的推理過(guò)程和執(zhí)行路徑。這種方式極大地簡(jiǎn)化了開發(fā)流程,使得沒(méi)有深厚AI背景的普通開發(fā)者也能構(gòu)建功能強(qiáng)大的智能應(yīng)用。

MCP平臺(tái)作為Agent的運(yùn)行環(huán)境,提供了工具調(diào)用、權(quán)限管理、數(shù)據(jù)處理等基礎(chǔ)設(shè)施,而Qwen-Agent則專注于智能決策和推理能力。以前構(gòu)建一個(gè)能處理客戶服務(wù)的Agent,可能需要1-2個(gè)月的開發(fā)周期和專業(yè)AI團(tuán)隊(duì)?,F(xiàn)在通過(guò)Qwen-Agent與MCP的結(jié)合,一個(gè)普通開發(fā)者可能只需1-2周就能完成原型開發(fā),實(shí)現(xiàn)更高質(zhì)量的交互體驗(yàn)。

這種降低門檻的方式使得AI應(yīng)用開發(fā)呈現(xiàn)“平民化”趨勢(shì),讓更多中小企業(yè)和個(gè)人開發(fā)者也能參與智能應(yīng)用創(chuàng)新,才能帶來(lái)應(yīng)用的爆發(fā)。

開源不是口號(hào),是“生存方式”

如今的一切開放,其實(shí)是建立在真開源的基礎(chǔ)上。

“Qwen是真的很大方,最好性能的模型都拿來(lái)開源?!钡孕羌袊@道。

從最小的0.6B到最大的72B,再到新一代的235B MoE模型,所有規(guī)格都對(duì)外開源;不保留最好的模型作為閉源產(chǎn)品,而是將每個(gè)級(jí)別最好的模型完整開源;持續(xù)更新迭代,不斷推出新的模型和能力,從文本到多模態(tài),從對(duì)話到推理的全方位開放。

不是保留最好的模型作為閉源產(chǎn)品,而是將每個(gè)級(jí)別最好的模型完整開源。事實(shí)上,基座模型廠商通常開源性能有限的小模型,將高性能大模型保留為付費(fèi)API服務(wù),從而形成完整的商業(yè)閉環(huán),才是行業(yè)常見的開源模式。

而Qwen全部尺寸模型向社區(qū)開放,沒(méi)有任何能力衰減或功能限制,不只是預(yù)訓(xùn)練模型,還包括SFT微調(diào)版本、對(duì)話版本和各種專業(yè)領(lǐng)域的指令優(yōu)化模型,為開發(fā)者提供了即取即用的解決方案,同時(shí)允許開發(fā)者進(jìn)行深度修改和二次開發(fā),而不是像某些廠商那樣只提供有限訪問(wèn)權(quán)限的“半開源”模式。這種無(wú)保留的開放態(tài)度,已經(jīng)不再是開源戰(zhàn)略,而是生存之本。

“到2024年年中多模態(tài)模型開始逐步成熟之后,千問(wèn)是最開始推VL模型的,從千問(wèn)2.0就開始有多模態(tài)模型,然后2.5的多模態(tài)更強(qiáng)了。而Llama3.2才支持圖像識(shí)別,已經(jīng)晚了”。翟星吉回憶到,Qwen團(tuán)隊(duì)“太卷了”。

模型的開放與云的服務(wù)形成了良好的閉環(huán)。阿里云作為國(guó)內(nèi)第一的云廠商,需要有更多客戶在上面調(diào)用,提供MaaS服務(wù)。當(dāng)它將開源生態(tài)做起來(lái)以后,養(yǎng)成了品牌心智,如果需要閉源模型,自然也會(huì)選擇千問(wèn)。

另一位to B領(lǐng)域的創(chuàng)業(yè)者講道:“如果我們現(xiàn)在在國(guó)內(nèi)去做應(yīng)用,能用云,我們一定優(yōu)先用云,沒(méi)有運(yùn)維成本,沒(méi)有部署成本。但如果客戶一定要私有化,那我們就會(huì)選擇開源模型部署,尤其是在一些特殊行業(yè),如金融、政府和醫(yī)療領(lǐng)域,出于數(shù)據(jù)安全和合規(guī)要求,往往需要完全私有化部署?!?/p>

在全球范圍內(nèi),目前模型和云能夠形成良性閉環(huán)的,也就只有阿里一家。微軟選擇與OpenAI合作提供服務(wù),AWS選擇與Anthropic合作。

從技術(shù)到產(chǎn)業(yè),從研究到應(yīng)用,Qwen系列通過(guò)全面開源的策略,不僅贏得了開發(fā)者的青睞,也在實(shí)際商業(yè)環(huán)境中找到了自己的位置。開源不只是分享代碼,它是構(gòu)建生態(tài)的方式,是連接開發(fā)者和企業(yè)的橋梁,更是在激烈的大模型競(jìng)爭(zhēng)中生存和發(fā)展的根本。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
排滿2年!變壓器龍頭鎖定高增,2026年凈利增35%+成行業(yè)底線

排滿2年!變壓器龍頭鎖定高增,2026年凈利增35%+成行業(yè)底線

藍(lán)色海邊
2026-03-02 00:25:00
價(jià)格已漲2.5倍!網(wǎng)友網(wǎng)購(gòu)2條8GB內(nèi)存故障退貨:還被商家收15%折舊費(fèi)

價(jià)格已漲2.5倍!網(wǎng)友網(wǎng)購(gòu)2條8GB內(nèi)存故障退貨:還被商家收15%折舊費(fèi)

快科技
2026-03-01 11:11:48
女子回湖北婆家過(guò)年,車被妯娌砸稀爛,報(bào)警后絕不和解,結(jié)局特爽

女子回湖北婆家過(guò)年,車被妯娌砸稀爛,報(bào)警后絕不和解,結(jié)局特爽

閱微札記
2026-03-01 16:56:42
批川普打伊朗不講武德!郭正亮:這不是等于偷襲珍珠港?

批川普打伊朗不講武德!郭正亮:這不是等于偷襲珍珠港?

新時(shí)光點(diǎn)滴
2026-03-02 03:11:09
拒爆冷!中國(guó)男籃逆轉(zhuǎn)臺(tái)北隊(duì),繼偉神仙3分,朱俊龍3分6中5砍19分

拒爆冷!中國(guó)男籃逆轉(zhuǎn)臺(tái)北隊(duì),繼偉神仙3分,朱俊龍3分6中5砍19分

毒舌NBA
2026-03-01 17:53:54
湖人狂勝勇士,艾頓僅得4分10籃板,遭奧尼爾和巴克利群嘲!

湖人狂勝勇士,艾頓僅得4分10籃板,遭奧尼爾和巴克利群嘲!

愛體育
2026-03-01 23:57:13
一位有糖尿病的人講述:喝了一次酒,十幾年對(duì)糖尿病的控制全白搭

一位有糖尿病的人講述:喝了一次酒,十幾年對(duì)糖尿病的控制全白搭

全球軍事記
2026-03-01 18:17:30
哈梅內(nèi)伊身亡,俄羅斯斷一臂

哈梅內(nèi)伊身亡,俄羅斯斷一臂

名人茍或
2026-03-01 14:56:58
沒(méi)想到,南京低調(diào)布局!這3個(gè)地方,未來(lái)你高攀不起

沒(méi)想到,南京低調(diào)布局!這3個(gè)地方,未來(lái)你高攀不起

小蜜情感說(shuō)
2026-03-02 01:07:46
baby再曝私下聚會(huì)視頻!濃妝艷抹穿旗袍,表情浮夸大喊疑精神失常

baby再曝私下聚會(huì)視頻!濃妝艷抹穿旗袍,表情浮夸大喊疑精神失常

八卦王者
2026-02-27 12:12:17
西方軍事專家:“只有泰國(guó)知道,中國(guó)早已是世界最強(qiáng)超級(jí)大國(guó)了”

西方軍事專家:“只有泰國(guó)知道,中國(guó)早已是世界最強(qiáng)超級(jí)大國(guó)了”

風(fēng)云人物看歷史
2026-02-02 09:13:32
油價(jià)最新調(diào)整通知!

油價(jià)最新調(diào)整通知!

瑯琊新聞網(wǎng)
2026-03-01 15:07:11
危險(xiǎn)信號(hào)!賴清德大勝,綠營(yíng)變天,鄭麗文突然改口:支持對(duì)美軍購(gòu)

危險(xiǎn)信號(hào)!賴清德大勝,綠營(yíng)變天,鄭麗文突然改口:支持對(duì)美軍購(gòu)

Ck的蜜糖
2026-02-25 15:08:12
第六波打擊!伊朗發(fā)起斬首行動(dòng),以總參謀部被炸,特朗普開始急了

第六波打擊!伊朗發(fā)起斬首行動(dòng),以總參謀部被炸,特朗普開始急了

墨印齋
2026-03-01 19:26:03
伊朗中程高超音速導(dǎo)彈突破以色列反導(dǎo)攔截,命中特拉維夫市中心!

伊朗中程高超音速導(dǎo)彈突破以色列反導(dǎo)攔截,命中特拉維夫市中心!

阿龍聊軍事
2026-03-01 21:09:05
“精液”真的可以預(yù)防婦科疾病嗎?醫(yī)生直言:不要害羞,早知早好

“精液”真的可以預(yù)防婦科疾病嗎?醫(yī)生直言:不要害羞,早知早好

醫(yī)者榮耀
2025-09-09 12:05:05
三十億防空網(wǎng)七分鐘癱瘓,敗給的不只是美軍

三十億防空網(wǎng)七分鐘癱瘓,敗給的不只是美軍

寰宇文創(chuàng)
2026-01-09 05:39:17
東莞教育局明確晚自習(xí)9點(diǎn)前放學(xué),有家長(zhǎng)建議提前至8點(diǎn)半,引眾怒

東莞教育局明確晚自習(xí)9點(diǎn)前放學(xué),有家長(zhǎng)建議提前至8點(diǎn)半,引眾怒

朗威談星座
2026-03-01 17:37:45
超級(jí)世界波!國(guó)安賽季首球,達(dá)萬(wàn)遠(yuǎn)射破門,22年首人,顏駿凌搖頭

超級(jí)世界波!國(guó)安賽季首球,達(dá)萬(wàn)遠(yuǎn)射破門,22年首人,顏駿凌搖頭

奧拜爾
2026-03-01 16:08:16
“當(dāng)心砸了你兒子的飯碗”,無(wú)知母親曬公務(wù)員兒子做農(nóng)活,被群嘲

“當(dāng)心砸了你兒子的飯碗”,無(wú)知母親曬公務(wù)員兒子做農(nóng)活,被群嘲

妍妍教育日記
2026-02-24 18:13:37
2026-03-02 04:56:49
硅星GenAI incentive-icons
硅星GenAI
比一部分人更先進(jìn)入GenAl。
243文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

特朗普警告伊朗“不要報(bào)復(fù)” 伊朗外長(zhǎng)回應(yīng)

頭條要聞

特朗普警告伊朗“不要報(bào)復(fù)” 伊朗外長(zhǎng)回應(yīng)

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂(lè)要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來(lái)襲

財(cái)經(jīng)要聞

中東局勢(shì)升級(jí) 如何影響A股、黃金和原油

汽車要聞

理想汽車2月交付26421輛 歷史累計(jì)交付超159萬(wàn)輛

態(tài)度原創(chuàng)

數(shù)碼
健康
家居
教育
公開課

數(shù)碼要聞

曝蘋果WWDC 26將推Core AI框架取代Core ML并公布多項(xiàng)AI功能

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

家居要聞

素色肌理 品意式格調(diào)

教育要聞

初中階段的分化,從習(xí)慣悄悄開始

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版