網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

“Qwen3之后，我才真正敢投AI應(yīng)用”

2025-04-30 15:39:02　來(lái)源: 硅星GenAI

上海舉報(bào)

分享至

作者｜ Yoky
郵箱｜ yokyliu@pingwest.com

2025年4月29日凌晨，距離通義千問(wèn)Qwen3正式發(fā)布還有5小時(shí)，X和GitHub上的開發(fā)者們已經(jīng)搬好小板凳蹲守發(fā)布。開源社區(qū)的技術(shù)愛好者們熬夜刷新，等待第一時(shí)間測(cè)試和體驗(yàn)這款備受期待的中國(guó)大模型新作。

甚至中國(guó)開發(fā)者已經(jīng)蹲守通宵，在發(fā)布凌晨5點(diǎn)發(fā)布的第一時(shí)間測(cè)試并發(fā)布了評(píng)測(cè)報(bào)告。

這樣的現(xiàn)象曾經(jīng)只在OpenAI發(fā)布新模型前出現(xiàn)過(guò)如此關(guān)注度。如今，中國(guó)大模型也能引發(fā)全球開發(fā)者如此熱切的期待，不僅是模型技術(shù)的突破，也是因?yàn)閷?duì)于開發(fā)者和企業(yè)而言，能夠真正用起來(lái)，產(chǎn)生產(chǎn)業(yè)價(jià)值。

“在為企業(yè)在國(guó)內(nèi)選模型，基本上只有Qwen和DeepSeek兩個(gè)選項(xiàng)，但R1參數(shù)太大了，很多場(chǎng)景不需要那么強(qiáng)的性能。對(duì)比來(lái)看，千問(wèn)系列提供了從小到大全系列參數(shù)規(guī)模的選擇，在任何場(chǎng)景下都能找到適合的模型?！盇gent數(shù)字員工應(yīng)用公司語(yǔ)核科技創(chuàng)始人翟星吉告訴我們。

尤其在Qwen3發(fā)布之后，模型尺寸從0.6B到235B再度拓寬光譜，并且進(jìn)一步降低了部署和推理成本之后，企業(yè)和開發(fā)者的門檻再度被磨平，也為應(yīng)用生態(tài)的爆發(fā)奠定了基礎(chǔ)。

“Qwen3以后，我才真正敢投大模型應(yīng)用。”一位投資人對(duì)硅星人坦白：“端側(cè)算力不足是事實(shí)，如果一味用云端模型沒(méi)法本地部署，很多功能被限制用戶也會(huì)擔(dān)心隱私的問(wèn)題?！?/p>

大模型競(jìng)賽的第一賽段已經(jīng)過(guò)去，淘金之后企業(yè)和開發(fā)者能夠選擇有足夠性能的模型其實(shí)并不多，而Qwen似乎已經(jīng)成為了中國(guó)環(huán)境的首選。

以服務(wù)產(chǎn)業(yè)為目標(biāo)做模型

回顧Qwen系列模型的發(fā)展歷程，能夠發(fā)現(xiàn)其與其他大模型的核心區(qū)別：不是單純追求技術(shù)領(lǐng)先，而是以服務(wù)產(chǎn)業(yè)實(shí)際需求為導(dǎo)向。

做“精”還是做“全”，DeepSeek和Qwen代表著這兩個(gè)技術(shù)的方向。

Qwen系列模型以“全譜系”布局策略，為不同場(chǎng)景提供針對(duì)性解決方案。從參數(shù)規(guī)模來(lái)看，Qwen3涵蓋從輕量級(jí)的0.6B、1.7B、4B、8B、14B、32B稠密模型，到30B-A3B和235B-A22B的混合專家模型，覆蓋了從端側(cè)到云端的所有部署需求。在模型類型上，更大的Qwen系列不僅有基礎(chǔ)語(yǔ)言模型，還包括推理模型、多模態(tài)視覺(jué)理解(VLM)、圖像生成、視頻理解等全模態(tài)能力。

翟星吉指出：“它的模型系列覆蓋得很全，從文本到VL多模態(tài)識(shí)別，再到推理模型，你會(huì)發(fā)現(xiàn)全套它都有。它很早就探索了QVQ，就是視覺(jué)推理模型?！?/b>

這種全譜系布局使得各類企業(yè)都能找到適合自己場(chǎng)景的模型。例如，兒童智能玩具創(chuàng)業(yè)公司躍然創(chuàng)新創(chuàng)始人李勇告訴我們：“之前受限于芯片性能、成本和功耗，無(wú)法在端側(cè)部署推理模型。但Qwen3-0.6B的推出讓端側(cè)部署成為可能，端側(cè)部署意味著無(wú)需聯(lián)網(wǎng)，解決了隱私問(wèn)題，同時(shí)消除了網(wǎng)絡(luò)限制和Token計(jì)費(fèi)成本?！?/p>

更廣泛的應(yīng)用場(chǎng)景看，Qwen為各類終端設(shè)備提供了精準(zhǔn)匹配的解決方案：0.6B和1.7B模型支持開發(fā)者用于推測(cè)性解碼和小終端部署；4B模型適合手機(jī)端側(cè)應(yīng)用優(yōu)化；8B模型可針對(duì)電腦或智能汽車座艙場(chǎng)景設(shè)計(jì)；14B模型適合普通開發(fā)者和中小企業(yè)使用，資源需求適中；32B模型是企業(yè)最喜歡的規(guī)模，支持大規(guī)模商業(yè)部署；MoE模型則為追求極致性能的場(chǎng)景提供服務(wù)。

翟星吉解釋道：“你像我們給客戶部署，如果要推理模型，我肯定會(huì)考慮大部分客戶資源情況，很多人會(huì)選擇基于千問(wèn)32B的流量版本的推理模型，或者直接用QWQ-32B。”

相比之下，Llama比Qwen更早開源，但卻在后續(xù)的發(fā)展中逐漸成為了開源的第二選擇。首先其在參數(shù)規(guī)模選擇上存在明顯短板。Llama的大模型如400B-500B參數(shù)規(guī)模對(duì)企業(yè)而言難以部署，需要龐大的計(jì)算資源；而70B參數(shù)的模型又被開發(fā)者普遍認(rèn)為能力不足。

相比之下，千問(wèn)72B被認(rèn)為剛好達(dá)到了企業(yè)能負(fù)擔(dān)的最大參數(shù)規(guī)模，在性能和成本之間取得了平衡。另一位開發(fā)者解釋道：“我們測(cè)算下來(lái)，企業(yè)最多就是部署72B的模型，再大就部署不了了?！?/p>

其次，Llama在多語(yǔ)言特別是中文能力上明顯不足?！爸形恼Z(yǔ)境下，Llama語(yǔ)料數(shù)據(jù)比較少，它只有5%的多語(yǔ)種數(shù)據(jù)，95%的英語(yǔ)語(yǔ)種數(shù)據(jù)。所以大家會(huì)覺(jué)得它在中文場(chǎng)景下有點(diǎn)笨。”這導(dǎo)致Llama在全球化應(yīng)用場(chǎng)景中的適應(yīng)性不佳，尤其對(duì)中文開發(fā)者而言，其實(shí)用價(jià)值大打折扣。

這種策略的成功體現(xiàn)在Qwen在開源社區(qū)獲得的廣泛認(rèn)可上：全球衍生模型數(shù)量已超過(guò)10萬(wàn)，下載量超過(guò)3億，在HuggingFace社區(qū)2024年全球模型下載量中占比超30%。在2025年2月的Huggingface全球開源大模型榜單中，排名前十的開源模型全部都基于Qwen二次開發(fā)。

為預(yù)訓(xùn)練Agent，提供BaseModel

“現(xiàn)在一個(gè)Agent不開出多模態(tài)的話，肯定是沒(méi)有前途的?！鄙鲜鐾顿Y人講道：“在當(dāng)前階段，構(gòu)建智能Agent需要模型具備強(qiáng)大的多模態(tài)理解能力、推理能力和自主決策能力?！?b>當(dāng)Agent儼然已經(jīng)成為了下一代應(yīng)用的核心，而構(gòu)建高效Agent需要強(qiáng)大的底層模型支持。

有了在制造業(yè)深耕Agent的諸多嘗試后，翟星吉認(rèn)為現(xiàn)在到了一個(gè)Agent的關(guān)鍵節(jié)點(diǎn)，“我們現(xiàn)在做的Agent，比如像Manus背后肯定還是有手搭的workflow。如果嘗試不再是固定流程的，它是智能判斷的，我需要找這個(gè)人干什么，我需要下單，我需要找這個(gè)人驗(yàn)證，我需要取消，那在這場(chǎng)景下，就需要基于一個(gè)強(qiáng)大的base model做預(yù)訓(xùn)練的Agent模型?！?/p>

“首先它應(yīng)該是一個(gè)推理模型，這是基礎(chǔ)的。然后在推理模型上去做再訓(xùn)練，把整個(gè)任務(wù)的第一步、第二步、第三步的路徑數(shù)據(jù)，以及在每一步的思考數(shù)據(jù)，為什么要這么做的思考數(shù)據(jù)，以及最終的結(jié)果數(shù)據(jù)全部標(biāo)出來(lái)，標(biāo)出來(lái)之后用強(qiáng)化學(xué)習(xí)的方式讓它不停地去迭代。”

這種訓(xùn)練方法本質(zhì)上是教會(huì)模型如何進(jìn)行任務(wù)分解、如何思考以及如何利用工具，而千問(wèn)作為基礎(chǔ)模型提供了強(qiáng)大的語(yǔ)言理解能力和邏輯推理框架。翟星吉進(jìn)一步補(bǔ)充：“我們到現(xiàn)在都是自己寫推理模板，讓大模型去按照這個(gè)推理模板一步一步走，但未來(lái)希望Agent一步到位就出來(lái)推理模板，不需要我們?nèi)ヌ峁┝?，它自己?huì)思考，自己會(huì)形成一個(gè)推理的架構(gòu)和路徑模板，這對(duì)基礎(chǔ)模型的能力要求很高?！?/p>

Qwen3的混合推理能力，為Agent開發(fā)提供了更靈活的思考與決策框架。在推理模式下，模型會(huì)執(zhí)行更多中間步驟，而在非推理模式下，模型則可快速遵循指令生成答案。這種能力與人類思維極為相似：對(duì)簡(jiǎn)單問(wèn)題快速作答，面對(duì)復(fù)雜問(wèn)題則深思熟慮。在開發(fā)智能Agent時(shí)，這種混合推理能力顯得尤為重要。

千問(wèn)還進(jìn)一步通過(guò)Qwen-Agent與MCP（Model-as-Copilot Platform）的結(jié)合降低了開發(fā)門檻，這一創(chuàng)新舉措使得開發(fā)者能夠以更低成本快速構(gòu)建智能應(yīng)用。傳統(tǒng)的Agent開發(fā)需要專業(yè)的AI工程師和大量資源投入，而Qwen-Agent框架與MCP平臺(tái)的結(jié)合，創(chuàng)造了一種'低代碼'的Agent開發(fā)模式。開發(fā)者只需定義任務(wù)流和工具集，系統(tǒng)會(huì)自動(dòng)處理復(fù)雜的推理過(guò)程和執(zhí)行路徑。這種方式極大地簡(jiǎn)化了開發(fā)流程，使得沒(méi)有深厚AI背景的普通開發(fā)者也能構(gòu)建功能強(qiáng)大的智能應(yīng)用。

MCP平臺(tái)作為Agent的運(yùn)行環(huán)境，提供了工具調(diào)用、權(quán)限管理、數(shù)據(jù)處理等基礎(chǔ)設(shè)施，而Qwen-Agent則專注于智能決策和推理能力。以前構(gòu)建一個(gè)能處理客戶服務(wù)的Agent，可能需要1-2個(gè)月的開發(fā)周期和專業(yè)AI團(tuán)隊(duì)?，F(xiàn)在通過(guò)Qwen-Agent與MCP的結(jié)合，一個(gè)普通開發(fā)者可能只需1-2周就能完成原型開發(fā)，實(shí)現(xiàn)更高質(zhì)量的交互體驗(yàn)。

這種降低門檻的方式使得AI應(yīng)用開發(fā)呈現(xiàn)“平民化”趨勢(shì)，讓更多中小企業(yè)和個(gè)人開發(fā)者也能參與智能應(yīng)用創(chuàng)新，才能帶來(lái)應(yīng)用的爆發(fā)。

開源不是口號(hào)，是“生存方式”

如今的一切開放，其實(shí)是建立在真開源的基礎(chǔ)上。

“Qwen是真的很大方，最好性能的模型都拿來(lái)開源?！钡孕羌袊@道。

從最小的0.6B到最大的72B，再到新一代的235B MoE模型，所有規(guī)格都對(duì)外開源；不保留最好的模型作為閉源產(chǎn)品，而是將每個(gè)級(jí)別最好的模型完整開源；持續(xù)更新迭代，不斷推出新的模型和能力，從文本到多模態(tài)，從對(duì)話到推理的全方位開放。

不是保留最好的模型作為閉源產(chǎn)品，而是將每個(gè)級(jí)別最好的模型完整開源。事實(shí)上，基座模型廠商通常開源性能有限的小模型，將高性能大模型保留為付費(fèi)API服務(wù)，從而形成完整的商業(yè)閉環(huán)，才是行業(yè)常見的開源模式。

而Qwen全部尺寸模型向社區(qū)開放，沒(méi)有任何能力衰減或功能限制，不只是預(yù)訓(xùn)練模型，還包括SFT微調(diào)版本、對(duì)話版本和各種專業(yè)領(lǐng)域的指令優(yōu)化模型，為開發(fā)者提供了即取即用的解決方案，同時(shí)允許開發(fā)者進(jìn)行深度修改和二次開發(fā)，而不是像某些廠商那樣只提供有限訪問(wèn)權(quán)限的“半開源”模式。這種無(wú)保留的開放態(tài)度，已經(jīng)不再是開源戰(zhàn)略，而是生存之本。

“到2024年年中多模態(tài)模型開始逐步成熟之后，千問(wèn)是最開始推VL模型的，從千問(wèn)2.0就開始有多模態(tài)模型，然后2.5的多模態(tài)更強(qiáng)了。而Llama3.2才支持圖像識(shí)別，已經(jīng)晚了”。翟星吉回憶到，Qwen團(tuán)隊(duì)“太卷了”。

模型的開放與云的服務(wù)形成了良好的閉環(huán)。阿里云作為國(guó)內(nèi)第一的云廠商，需要有更多客戶在上面調(diào)用，提供MaaS服務(wù)。當(dāng)它將開源生態(tài)做起來(lái)以后，養(yǎng)成了品牌心智，如果需要閉源模型，自然也會(huì)選擇千問(wèn)。

另一位to B領(lǐng)域的創(chuàng)業(yè)者講道：“如果我們現(xiàn)在在國(guó)內(nèi)去做應(yīng)用，能用云，我們一定優(yōu)先用云，沒(méi)有運(yùn)維成本，沒(méi)有部署成本。但如果客戶一定要私有化，那我們就會(huì)選擇開源模型部署，尤其是在一些特殊行業(yè)，如金融、政府和醫(yī)療領(lǐng)域，出于數(shù)據(jù)安全和合規(guī)要求，往往需要完全私有化部署?！?/p>

在全球范圍內(nèi)，目前模型和云能夠形成良性閉環(huán)的，也就只有阿里一家。微軟選擇與OpenAI合作提供服務(wù)，AWS選擇與Anthropic合作。

從技術(shù)到產(chǎn)業(yè)，從研究到應(yīng)用，Qwen系列通過(guò)全面開源的策略，不僅贏得了開發(fā)者的青睞，也在實(shí)際商業(yè)環(huán)境中找到了自己的位置。開源不只是分享代碼，它是構(gòu)建生態(tài)的方式，是連接開發(fā)者和企業(yè)的橋梁，更是在激烈的大模型競(jìng)爭(zhēng)中生存和發(fā)展的根本。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.