小語言模型：構(gòu)建輕量化人工智能生態(tài)的拼圖塊

2025-11-28 10:34:27　來源: 融資中國

北京舉報

分享至

核心觀點：
小語言模型的巨額融資成為常態(tài)，頭部公司的單輪融資額動輒達到數(shù)億美金或歐元量級。例如，MistralAI在短短半年內(nèi)從種子輪（1.05億歐元）迅速躍升至B輪（3.85億歐元），中國的01.AI在A輪融資后估值即超過10億美元，迅速躋身獨角獸行列。
與大型云端模型不同，小語言模型憑借其低延遲、高隱私、離線運行能力，在與用戶日常生活緊密相關(guān)的智能終端領(lǐng)域率先取得突破性進展。
近年來，國家層面通過《關(guān)于深入實施“人工智能+”行動的意見》、《國家人工智能產(chǎn)業(yè)綜合標準化體系建設(shè)指南（2024版）》等頂層設(shè)計，明確了智能終端的規(guī)?；占澳繕?，相關(guān)政策指出到2027年，新一代智能終端、智能體等應(yīng)用普及率要超過70%，直接為小語言模型創(chuàng)造了廣闊的市場需求。
全球小語言模型市場已初步形成"國際科技巨頭生態(tài)壟斷、中國AI獨角獸技術(shù)突破、專注型初創(chuàng)快速落地、硬件終端巨頭跨界整合"的多元化競爭格局。
中國作為全球最大的智能終端制造和消費市場，在小語言模型領(lǐng)域具有天然優(yōu)勢。預(yù)計中國市場占據(jù)全球市場約25-30%的份額，2024年市場規(guī)模約為96~115億元人民幣，到2031年或達到336~403億元人民幣。

（1）定義及優(yōu)勢

小型語言模型（Small Language Models，SLM）指的是相對于大型語言模型而言，規(guī)模較小、參數(shù)數(shù)量較少的模型，通常情況下，其參數(shù)量在數(shù)百萬到數(shù)幾十億之間。而大型語言模型的參數(shù)量則高達千億甚至萬億個，例如OpenAI的chatGPT3.0模型（1750億）。

小語言模型通常在處理特定任務(wù)或領(lǐng)域時，能夠以較低的計算成本實現(xiàn)相對不錯的性能。此外，小語言模型在資源有限、需要快速部署或?qū)崟r性要求較高的應(yīng)用場景中亦非常實用。

（2）主要特點及對比

鑒于參數(shù)量相對較少，小語言模型在訓(xùn)練和部署方面，具有成本低、快速響應(yīng)、特定領(lǐng)域優(yōu)化、易于集成、可解釋性等優(yōu)勢。

圖表1小語言模型特點

信息來源：融中咨詢

總體來說，大模型與小模型在參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)量、計算資源需求及應(yīng)用場景方面有區(qū)別。大模型（參數(shù)十億級以上）依賴海量數(shù)據(jù)和高算力，適用于高精度復(fù)雜任務(wù)（如NLP）；而小模型參數(shù)少，對數(shù)據(jù)和算力的需求低，成本更低。

圖表2大語言模型與小語言模型的對比

信息來源：融中咨詢

以Phi-3全系列、Gemma-7b、Mistral-7b等小語言模型的性能數(shù)據(jù)與Mixtral-8x7b、GPT-3.5-Turbo、Claude-3-Sonnet等大模型進行對比，語言理解、推理、數(shù)學(xué)、代碼生成等方面，并沒有出現(xiàn)明顯的差異。具體如下圖所示。

圖表3Phi-3-Mini的性能對比

信息來源：融中咨詢

（3）近期模型

2024-2025年新發(fā)布的小語言模型匯總了來自全球頂尖科技公司（如Google、Microsoft、Meta、Apple、NVIDIA、阿里巴巴、騰訊等）和學(xué)術(shù)機構(gòu)（如北大），其競爭焦點已從單純追求“參數(shù)規(guī)模”轉(zhuǎn)向追求“性能與效率的極致平衡”。開發(fā)者們正致力于打造在特定場景下（如邊緣計算、手機端、安全領(lǐng)域）能力卓越，且能耗更低、速度更快的“小而強”模型。

圖表42024-2025年新發(fā)布的小語言模型統(tǒng)計

信息來源：融中咨詢

小語言模型（SLM）行業(yè)自2023年起進入了快速發(fā)展期，呈現(xiàn)出從通用模型向?qū)I(yè)化、多樣化方向演進的特點。

早期發(fā)展（2023年之前）：行業(yè)起步階段以開源和通用型模型為主，例如Megatron-GPT2、GPT-Neo等。這些模型為后續(xù)發(fā)展奠定了技術(shù)基礎(chǔ)。

爆發(fā)增長（2023年及之后）：這一年模型發(fā)布數(shù)量顯著增加，并出現(xiàn)了關(guān)鍵趨勢。微軟發(fā)布的Phi系列（從Phi-1.5到Phi-2）展示了通過高質(zhì)量數(shù)據(jù)訓(xùn)練小模型的巨大潛力。同時，領(lǐng)域?qū)Ｓ媚Ｐ烷_始涌現(xiàn)，如AstroLLaMA（天文學(xué)），標志著SLMs開始向垂直領(lǐng)域深入。開發(fā)團隊也愈發(fā)多元，涵蓋了學(xué)術(shù)界、工業(yè)界和開源社區(qū)。

深化與專業(yè)化（2024年及以后）：行業(yè)發(fā)展進一步聚焦于垂直領(lǐng)域和性能優(yōu)化。微軟持續(xù)迭代其Phi系列（Phi-3,Phi-3.5），其他機構(gòu)也推出了如ChemLLM（化學(xué)）和Hippocrates（醫(yī)療）等大量專業(yè)模型。同時，技術(shù)路徑更加多樣，出現(xiàn)了如Rho-1等專注于代碼訓(xùn)練的模型。這一趨勢預(yù)計將持續(xù)到2025年及未來，SLMs正朝著更精細的領(lǐng)域定制、更高的效率以及更廣泛的開發(fā)者參與方向演進。

圖表5小語言模型的發(fā)展歷史

信息來源：融中咨詢

（1）產(chǎn)業(yè)鏈結(jié)構(gòu)：端、邊、芯協(xié)同生態(tài)

小語言模型產(chǎn)業(yè)鏈涵蓋硬件基礎(chǔ)設(shè)施、算法模型研發(fā)及行業(yè)終端應(yīng)用的多層次生態(tài)體系。其最顯著的特點是與"端、邊、芯"（終端設(shè)備、邊緣計算、芯片）的高度協(xié)同。與傳統(tǒng)云端大模型依賴數(shù)據(jù)中心算力不同，SLM的價值實現(xiàn)必須深度嵌入終端設(shè)備的硬件能力和應(yīng)用場景。

圖表6小語言模型產(chǎn)業(yè)鏈結(jié)構(gòu)圖

信息來源：融中咨詢

上游：數(shù)據(jù)與硬件支持

小語言模型產(chǎn)業(yè)的蓬勃發(fā)展，離不開其上游堅實的基礎(chǔ)支撐層，該層級為模型的研發(fā)、訓(xùn)練與部署提供了不可或缺的核心資源。

1）在硬件與算力層面，訓(xùn)練環(huán)節(jié)主要由NVIDIA的GPU（如H100/H200）主導(dǎo)，AMD、Intel等廠商也在積極競爭。而在推理環(huán)節(jié)，尤其是邊緣計算芯片，如高通手機芯片、蘋果的M系列NPU以及Intel的CoreUltraNPU，成為了小模型生態(tài)落地的關(guān)鍵戰(zhàn)場，它們?yōu)槟Ｐ驮诮K端設(shè)備上的高效運行提供了硬件基礎(chǔ)，同時眾多初創(chuàng)公司也致力于開發(fā)專用的低功耗AI加速器。

2）AWS、Azure、GoogleCloud等全球云計算平臺則提供了強大的訓(xùn)練算力與便捷的模型托管服務(wù)，顯著降低了研發(fā)門檻。其次，高質(zhì)量的數(shù)據(jù)與服務(wù)是模型智能的源泉，專業(yè)的數(shù)據(jù)供應(yīng)商提供預(yù)訓(xùn)練數(shù)據(jù)集與合成數(shù)據(jù)，而數(shù)據(jù)清洗與標注公司則為小模型在特定領(lǐng)域的專業(yè)化提供了關(guān)鍵的精標數(shù)據(jù)支持。

3）成熟的框架與工具構(gòu)成了技術(shù)棧的基石。以PyTorch、TensorFlow、JAX為核心的開源框架，與HuggingFace的Transformers、Tokenizers等生態(tài)工具共同構(gòu)成了模型開發(fā)的標準流程，而ONNX等開放格式則極大地推動了模型的跨平臺部署與應(yīng)用。

中游：技術(shù)研發(fā)與模型開發(fā)

中游是模型與生態(tài)層，作為產(chǎn)業(yè)鏈的核心，這里匯聚了多元的參與者，共同推動小語言模型的研發(fā)、優(yōu)化與分發(fā)。

1）在模型開發(fā)者層面，科技巨頭如Microsoft、Google、Meta和Apple憑借其前沿的Phi、Gemma、Llama及OpenELM等系列模型引領(lǐng)技術(shù)方向，并普遍采用開源策略以構(gòu)建開發(fā)者生態(tài)，同時為其云業(yè)務(wù)引流。

2）01.AI、Moondream等頂尖AI實驗室與初創(chuàng)公司則展現(xiàn)出更高的靈活性與專注度，在特定領(lǐng)域或技術(shù)點上實現(xiàn)關(guān)鍵突破；而充滿活力的開源社區(qū)基于巨頭發(fā)布的基座模型，進行精細微調(diào)、壓縮與優(yōu)化。

下游：應(yīng)用場景的落地

在行業(yè)應(yīng)用解決方案上，小模型憑借其能夠本地化部署的優(yōu)勢，在各個領(lǐng)域發(fā)揮優(yōu)勢。

1）在金融領(lǐng)域，SLM實現(xiàn)智能客服、財報分析和風(fēng)險審核，嚴格保障數(shù)據(jù)安全；

2）在醫(yī)療領(lǐng)域，SLM輔助臨床決策、結(jié)構(gòu)化病歷，有力保護患者隱私；

3）在教育領(lǐng)域，SLM充當(dāng)個性化學(xué)習(xí)助手；

4）在法律領(lǐng)域完成高效的合同審查與案例查詢；

5）在手機與PC上，以端側(cè)智能助手的形式實現(xiàn)照片增強、文案創(chuàng)作和實時翻譯；

6）在汽車座艙內(nèi)，作為車載語音助手提供快速響應(yīng)、離線可用的交互體驗；

7）在IoT設(shè)備中，則成為機器人、智能家居的中控大腦，實現(xiàn)低延遲、低功耗的智能控制。

（2）市場規(guī)模：從爆發(fā)期邁向成熟期

全球小語言模型市場正處于快速增長通道。2024年市場規(guī)模為53.8億美元，到2031年將增長至188億美元，年復(fù)合增長率（CAGR）為20.9%。這一增速顯著高于傳統(tǒng)企業(yè)軟件市場，反映了端側(cè)AI作為新興技術(shù)的強勁需求。

中國市場占據(jù)全球小語言市場25-30%的份額。中國作為全球最大的智能終端制造和消費市場，在小語言模型領(lǐng)域具有天然優(yōu)勢。預(yù)計中國市場占據(jù)全球市場約25-30%的份額，2024年市場規(guī)模約為96-115億元人民幣，到2031年將達到336-403億元人民幣。

圖表7全球及中國小語言模型行業(yè)規(guī)模情況

數(shù)據(jù)來源：融中咨詢

SLM正逐漸成為推動行業(yè)智能化變革的關(guān)鍵力量。在金融領(lǐng)域，它用于自動化處理財報摘要生成與智能投研信息提取，提升風(fēng)控與運營效率；娛樂行業(yè)利用它創(chuàng)作營銷文案、驅(qū)動游戲NPC基礎(chǔ)對話并賦能互動敘事；汽車系統(tǒng)通過集成SLM，打造能理解復(fù)雜指令的車載語音助手，提升交互體驗與駕駛安全；教育工具借其提供個性化的學(xué)習(xí)輔導(dǎo)和交互式語言練習(xí)；電商零售則依靠SLM聊天機器人高效處理售前售后咨詢，顯著提升客戶服務(wù)體驗與滿意度；在醫(yī)療領(lǐng)域，SLM被用于初步的健康問答分診，并輔助完成病歷結(jié)構(gòu)化等行政工作，幫助優(yōu)化緊張的醫(yī)療資源分配。

圖表8小語言模型下游細分結(jié)構(gòu)

數(shù)據(jù)來源：融中咨詢

（1）核心應(yīng)用場景：智能終端引領(lǐng)落地潮

小語言模型的應(yīng)用落地正處在從"探索孵化期"向"規(guī)模應(yīng)用期"過渡的關(guān)鍵階段。與大型云端模型不同，SLM憑借其低延遲、高隱私、離線運行能力，在與用戶日常生活緊密相關(guān)的智能終端領(lǐng)域率先取得突破性進展。其應(yīng)用的核心邏輯在于將智能計算從云端前置到設(shè)備本地，為用戶提供更即時、更個性化、更安全的AI體驗，推動AI應(yīng)用從"能用"向"好用"邁進。

圖表9主要行業(yè)小語言模型應(yīng)用成熟度評估（2024-2025年）

數(shù)據(jù)來源：融中咨詢

（2）標桿案例深度剖析

案例一：小米"超級小愛同學(xué)"——生態(tài)融合的端側(cè)AI大腦

小米公司在其澎湃OS（HyperOS）中集成的"超級小愛同學(xué)"，是SLM在智能手機終端應(yīng)用的標桿案例。它不再是一個簡單的語音問答工具，而是深度融合了SLM能力的端側(cè)AI大腦。

該助手具備強大的多模態(tài)交互、全局自然語言搜索、屏幕識別和跨設(shè)備執(zhí)行能力。例如，用戶可以直接用自然語言命令手機"幫我查找上周拍的帶狗的照片，并發(fā)送給媽媽"，系統(tǒng)能理解指令、識別圖像內(nèi)容、調(diào)用聯(lián)系人并執(zhí)行發(fā)送動作。其核心是結(jié)合了全生態(tài)感知的個人本地信息庫。SLM在端側(cè)直接處理和理解用戶的個人數(shù)據(jù)（如日程、照片、偏好），無需上傳云端，從而具備了高度個性化的記憶能力，極大地保護了用戶隱私。該功能已于2024年11月開始在小米15、小米14等系列機型上推送內(nèi)測。

案例二：長安馬自達EZ-60——端側(cè)模型賦能的智能座艙

面壁智能與長安馬自達的合作，誕生了全球首批搭載純端側(cè)大模型并實現(xiàn)量產(chǎn)的車型——MAZDAEZ-60，標志著SLM在智能汽車領(lǐng)域的商業(yè)化落地取得了重大突破。

在智能座艙內(nèi)，SLM作為長安馬自達的車載AI助手，負責(zé)處理導(dǎo)航、娛樂、車輛控制等多種語音指令。用戶可以通過自然語言與車輛交互，例如"幫我找一家附近評分高的川菜館，并導(dǎo)航過去"，系統(tǒng)能夠理解意圖、搜索信息、規(guī)劃路線并啟動導(dǎo)航。車載助手即使在隧道、山區(qū)等無網(wǎng)絡(luò)環(huán)境下，依然能夠提供毫秒級的快速響應(yīng)和穩(wěn)定流暢的交互。同時，所有語音交互數(shù)據(jù)和用戶偏好數(shù)據(jù)都在車內(nèi)本地處理，最大限度地保障了用戶的隱私和數(shù)據(jù)安全。

案例三：GooglePixel的GeminiNano——操作系統(tǒng)級整合

在國際市場，Google的GeminiNano代表了另一種端側(cè)AI的落地路徑——通過操作系統(tǒng)級別的深度整合，將SLM能力開放給整個Android生態(tài)。GeminiNano推出了1.8B和3.25B兩個參數(shù)版本，專為移動設(shè)備優(yōu)化，支持4位量化部署，可在主流Android手機上流暢運行。其核心能力包括設(shè)備端文本生成、智能回復(fù)建議、實時語音轉(zhuǎn)寫等。

Google的策略是將GeminiNano作為Android操作系統(tǒng)的基礎(chǔ)AI能力，開放給所有應(yīng)用開發(fā)者調(diào)用。這意味著，未來數(shù)十億臺Android設(shè)備都將內(nèi)置端側(cè)AI能力，開發(fā)者無需自己訓(xùn)練模型，即可為用戶提供智能化體驗。這種"平臺化"策略，與小米、面壁智能的"場景化"落地形成了有趣的對比，反映了不同企業(yè)在SLM商業(yè)化路徑上的差異化選擇。

圖表10SLM在主流終端的應(yīng)用功能對比

信息來源：融中咨詢

（1）市場參與者圖譜：多元化競爭生態(tài)

全球小語言模型市場已初步形成"國際科技巨頭生態(tài)壟斷、中國AI獨角獸技術(shù)突破、專注型初創(chuàng)快速落地、硬件終端巨頭跨界整合"的多元化競爭格局。

第一梯隊：國際科技巨頭

以Google、Apple為代表。這些企業(yè)通過操作系統(tǒng)和芯片的生態(tài)控制力，構(gòu)建了難以撼動的競爭壁壘。Google的GeminiNano深度集成Android系統(tǒng)，覆蓋全球數(shù)十億設(shè)備；Apple的AppleIntelligence基于自研芯片，強調(diào)隱私優(yōu)先和端云協(xié)同，截至2024年Q4，超過10億臺設(shè)備將獲得該功能。

谷歌：谷歌的小語言模型（如Gemma）是基于谷歌最強大的大模型（如Gemini）的技術(shù)和研究構(gòu)建的輕量級、開源模型。它們共享相同的技術(shù)基礎(chǔ)架構(gòu)和組件，但在參數(shù)規(guī)模上進行了精簡，旨在讓更多的開發(fā)者和組織能夠輕松獲取和使用先進的AI技術(shù)。

Gemma模型的核心特點是輕量級和高度優(yōu)化，確保它們可以在從移動設(shè)備到云端系統(tǒng)等各種計算環(huán)境中靈活訪問和運行。谷歌發(fā)布了兩個主要版本的Gemma模型，分別為20億參數(shù)和70億參數(shù)的規(guī)模。每個版本都提供預(yù)訓(xùn)練模型和指令調(diào)優(yōu)的變體，以滿足不同開發(fā)者的需求和應(yīng)用場景。

微軟：微軟在小語言模型領(lǐng)域也有著清晰的戰(zhàn)略和出色的產(chǎn)品，微軟開源了一個名為Phi-3-mini的小型語言模型，它擁有38億參數(shù)，并在多種任務(wù)上展現(xiàn)出了出色的性能。Phi系列（開源模型）是微軟SLM研究的主力軍，已經(jīng)迭代了多個版本。Phi-3系列(2024年4月發(fā)布)，Phi-3使用了與Llama2類似的更現(xiàn)代架構(gòu)，并在一個由高度篩選的網(wǎng)頁數(shù)據(jù)和合成數(shù)據(jù)組成的超大數(shù)據(jù)集上進行了訓(xùn)練，進一步鞏固了“數(shù)據(jù)質(zhì)量至上”的理念。

英偉達：英偉達的SLM代表作是Nemotron和ChatQA系列，但其影響力更體現(xiàn)在它提供的整個開發(fā)生態(tài)上。與谷歌、微軟等主要從模型研發(fā)角度切入不同，英偉達的SLM戰(zhàn)略是其全棧AI帝國藍圖中的關(guān)鍵一環(huán)，核心思想是：“我們提供從芯片、軟件到模型的一整套最佳實踐，告訴全世界如何最高效地構(gòu)建和使用SLM。

Meta：Meta的SLM戰(zhàn)略核心非常清晰，Meta強力推進開源，與OpenAI和Anthropic的閉源策略相反，Meta選擇將其最重要的模型（如Llama系列）開源，允許研究者和開發(fā)者免費商用、研究和修改。這極大地推動了AI技術(shù)的民主化。此外，Meta構(gòu)建模型家族，Meta不滿足于只發(fā)布一個模型，而是構(gòu)建了從70億到700億參數(shù)的完整模型譜系，覆蓋從手機到數(shù)據(jù)中心的各類場景。同時，Meta注重社區(qū)驅(qū)動創(chuàng)新，通過開源，Meta吸引了全球最聰明的頭腦在其模型基礎(chǔ)上進行微調(diào)、優(yōu)化和創(chuàng)新，形成了一個強大的飛輪效應(yīng)。社區(qū)貢獻的無數(shù)微調(diào)版本反過來又增強了Llama生態(tài)的活力。

Apple：OpenELM是蘋果在2024年4月發(fā)布的一個模型家族，它清晰地展示了蘋果在SLM領(lǐng)域的技術(shù)路線。OpenELM是一個基礎(chǔ)語言模型，而非對話模型。它的目的是作為一個強大的起點，供社區(qū)和研究者進行微調(diào)和進一步開發(fā)，同時也向業(yè)界展示了蘋果在模型架構(gòu)上的創(chuàng)新能力。

第二梯隊：中國AI獨角獸

以智譜AI、MiniMax為代表。這些企業(yè)在通用大模型領(lǐng)域已建立深厚的技術(shù)和資本壁壘，現(xiàn)階段正利用其優(yōu)勢向下布局端側(cè)市場。智譜AI推出GLM-Edge系列，與高通深度適配；MiniMax探索MoE等高效架構(gòu)以降低推理成本。

此外，阿里巴巴的SLM戰(zhàn)略是其宏大AI藍圖中的關(guān)鍵一環(huán)，旨在滿足不同場景下的算力和效率需求。Qwen2.5系列是阿里巴巴最新一代的小語言模型，這是目前阿里最新、最強大的模型家族，其中包含了多個卓越的小模型，包括Qwen2.5-1.5B/3B/7B、Qwen2.5-72B-IN-9B等。

第三梯隊：專注型初創(chuàng)企業(yè)

以面壁智能為代表。此類企業(yè)自創(chuàng)立之初就聚焦于端側(cè)AI和輕量化模型賽道，技術(shù)迭代迅速，商業(yè)化落地目標明確。其核心優(yōu)勢在于技術(shù)專注度和靈活性，能夠快速響應(yīng)市場需求。

第四梯隊：硬件及終端巨頭

以小米、地平線為代表。小米通過自研"超級小愛同學(xué)"，將SLM能力深度集成到手機和IoT產(chǎn)品生態(tài)中；地平線則作為上游芯片領(lǐng)導(dǎo)者，通過提供高性能車規(guī)級AI芯片，賦能下游智能汽車應(yīng)用。

此外，vivo的“藍心大模型”是一個覆蓋不同規(guī)模的模型家族，其中端側(cè)模型是其重中之重，也是一個典型的代表。其中藍心大模型7B（70億參數(shù)）及以下，這是vivo端側(cè)能力的核心，主要包括藍心大模型7B，這是能夠在旗艦機型上流暢運行的、能力最全面的端側(cè)模型。它負責(zé)處理手機端大部分復(fù)雜的AI任務(wù)。

（2）核心競爭力分析：技術(shù)、生態(tài)、場景三維博弈

不同類型的參與者圍繞技術(shù)、生態(tài)和場景三個維度構(gòu)建自身的核心競爭力，形成了差異化的競爭格局。

圖表11全球小語言模型競爭格局分布

信息來源：融中咨詢

（3）國內(nèi)代表企業(yè)分析

面壁智能——專注端側(cè)，快速迭代

面壁智能是當(dāng)前中國SLM賽道中最具代表性的領(lǐng)跑者。公司成立于2022年8月，核心戰(zhàn)略是專注于端側(cè)AI和小語言模型的研發(fā)。其推出的MiniCPM系列輕量化模型，在輕量化與高性能方面表現(xiàn)突出。其最新模型可在端側(cè)設(shè)備上實現(xiàn)GPT-3.5級別的性能，而參數(shù)量大幅減少。公司堅持開源戰(zhàn)略，模型在HuggingFace等平臺廣受認可，截至2025年5月，全平臺下載量累計已突破1000萬。它通過創(chuàng)新的模型壓縮、量化和蒸餾技術(shù)，在保持性能的前提下，將模型規(guī)模壓縮到可以在手機、車機等終端設(shè)備上流暢運行的程度。

面壁智能的商業(yè)化路徑清晰且迅速。2025年4月，其端側(cè)模型成功搭載于長安馬自達MAZDAEZ-60量產(chǎn)車型上，完成了車規(guī)級場景的重大突破。這是全球首批搭載純端側(cè)大模型并實現(xiàn)量產(chǎn)的車型，具有里程碑意義。車規(guī)級應(yīng)用的難度遠高于消費電子。它要求模型不僅性能優(yōu)異，還要滿足極端溫度、振動、電磁干擾等嚴苛環(huán)境下的穩(wěn)定運行，以及汽車行業(yè)對安全性的極高標準。面壁智能的成功，證明了其技術(shù)的成熟度和工程化能力。

憑借清晰的技術(shù)路線和商業(yè)化進展，面壁智能獲得了資本市場的高度認可。在2024年12月至2025年5月的半年內(nèi)，連續(xù)完成兩輪由龍芯創(chuàng)投、北京市人工智能產(chǎn)業(yè)投資基金、洪泰基金等參與的數(shù)億元融資。這種密集融資節(jié)奏反映了投資方對其長期價值的看好，也為公司后續(xù)的技術(shù)研發(fā)和市場拓展提供了充足的資金支持。

地平線——車規(guī)芯片，生態(tài)賦能

地平線是SLM產(chǎn)業(yè)鏈上游的核心企業(yè)，是邊緣人工智能芯片的全球領(lǐng)導(dǎo)者，也是國內(nèi)唯一實現(xiàn)車規(guī)級AI芯片大規(guī)模量產(chǎn)前裝的企業(yè)。地平線是國內(nèi)首家、也是目前規(guī)模最大實現(xiàn)車規(guī)級AI芯片前裝量產(chǎn)的企業(yè)。征程系列芯片出貨量已達數(shù)百萬片，與超過30家國內(nèi)外主流車企建立了合作關(guān)系。截至2024年底，其芯片已搭載于超過200萬輛汽車上，覆蓋比亞迪、長城、上汽、理想等主流車企。

圖表12地平線征程系列芯片算力對比

信息來源：融中咨詢

公司基于自研的BPU（BrainProcessingUnit）人工智能專用計算架構(gòu)，打造了征程（Journey）系列芯片。其征程5單芯片算力可達96TOPS，最新的征程6系列性能更強，能夠滿足L2至L4級自動駕駛的算力需求。BPU架構(gòu)的核心優(yōu)勢在于，針對AI推理任務(wù)進行專門優(yōu)化，相比通用GPU，在能效比和成本上具有顯著優(yōu)勢。這使得地平線的芯片能夠在車載這種對功耗、散熱、成本都有嚴格限制的場景下，提供強大的AI算力。

公司與上汽、小米等頭部企業(yè)及超過20家機器人廠商建立了深度合作關(guān)系。通過提供強大的、開放的芯片平臺，地平線為下游廣大的SLM模型和應(yīng)用廠商提供了堅實的硬件基礎(chǔ)。這種開放生態(tài)策略的價值在于，通過成為產(chǎn)業(yè)鏈的"基礎(chǔ)設(shè)施提供者"，地平線不僅能夠獲得芯片銷售收入，更重要的是在整個產(chǎn)業(yè)生態(tài)中占據(jù)了不可或缺的核心地位，建立了長期的競爭壁壘。

地平線的商業(yè)模式正在從單純的芯片銷售，向"芯片+算法+工具鏈"的整體解決方案演進。公司不僅提供硬件，還提供配套的算法開發(fā)工具、模型優(yōu)化服務(wù)，幫助客戶快速將AI能力落地到產(chǎn)品中。這種轉(zhuǎn)型使得地平線能夠獲取更高的產(chǎn)品附加值，同時也加深了與客戶的綁定關(guān)系。

阿里巴巴——算力支持，性能領(lǐng)先

阿里巴巴集團控股有限公司是中國領(lǐng)先的互聯(lián)網(wǎng)科技企業(yè)，創(chuàng)立于1999年，是開源模型領(lǐng)域的積極推動者之一。其通義千問團隊既研發(fā)千億級別的超大模型以處理核心難題，也大力推廣其1.8B、7B等“輕量化”模型，以滿足端側(cè)部署和低成本快速響應(yīng)的需求，形成了完整的技術(shù)覆蓋。其Qwen1.5系列提供了從0.5B到72B的完整模型矩陣，其中1.8B、4B、7B等輕量化模型在同等規(guī)模中性能表現(xiàn)相對領(lǐng)先。

通義千問團隊背靠阿里云遍布全球的數(shù)據(jù)中心和強大的算力設(shè)施（如倚天710等自研芯片），在模型訓(xùn)練和推理上具備顯著優(yōu)勢。在落地場景方面，阿里巴巴龐大的電商、支付、物流、文娛等業(yè)務(wù)生態(tài)，為通義千問模型提供了海量的真實世界測試數(shù)據(jù)和落地場景，這是絕大多數(shù)團隊不具備的獨特優(yōu)勢。

深度求索——技術(shù)驅(qū)動，垂直領(lǐng)域突出

深度求索（DeepSeek）成立于2023年，總部位于杭州，由幻方量化孵化，專注于人工智能底層模型與技術(shù)的研發(fā)。DeepSeek-V2及其Lite版本是其重要的模型產(chǎn)品。他們的DeepSeek-Coder系列在代碼模型領(lǐng)域表現(xiàn)優(yōu)異。

深度求索專注于“高效性能”的核心技術(shù)路線。DeepSeek-V2采用了創(chuàng)新的MoE（混合專家）架構(gòu)，總參數(shù)量為236B，但通過路由機制每次推理僅激活約21B參數(shù)，實現(xiàn)了以較低的計算成本獲得接近大模型的性能。深度求索公司通過技術(shù)驅(qū)動，在代碼和數(shù)學(xué)等垂直領(lǐng)域能力突出，堅持開源策略，具有較高的成本效益比。

全志科技——“算力底座”，芯片賦能

全志科技的芯片產(chǎn)品作為底層算力平臺，對小語言模型在端側(cè)設(shè)備的普及和高效運行提供了關(guān)鍵支持。全志科技成立于2007年，2015年在創(chuàng)業(yè)板上市，主營業(yè)務(wù)涵蓋智能應(yīng)用處理器SoC、高性能模擬器件及無線互聯(lián)芯片的研發(fā)與銷售。全志科技2025年上半年營業(yè)收入為13.37億元，同比增長25.82%；歸屬于上市公司股東的凈利潤1.61億元，同比增長35.36%。

近年來，全志科技發(fā)布的多款新一代SoC（如MR系列、R系列和H系列的部分型號）都原生集成了專用NPU。這意味著芯片在設(shè)計階段就為AI計算進行了優(yōu)化，能夠高效地執(zhí)行小語言模型的推理任務(wù)。此外，全志科技正致力于深化“算力底座”的角色，通過推出算力更強的AIoT芯片，并與模型廠商深度合作，為客戶提供“推薦芯片型號+適配的輕量級模型+優(yōu)化部署工具”的一站式解決方案，極大降低終端產(chǎn)品實現(xiàn)AI智能化門檻。

（1）政策環(huán)境：從"通用鼓勵"到"精準扶持”

2024至2025年，中國AI產(chǎn)業(yè)的政策環(huán)境呈現(xiàn)出清晰的結(jié)構(gòu)性傾斜——從對通用大模型的全面鼓勵，轉(zhuǎn)向?qū)?yīng)用落地和算力高效性的精準扶持，為小語言模型（SLM）和端側(cè)AI的發(fā)展打開了關(guān)鍵的政策窗口期。

國家層面通過《關(guān)于深入實施“人工智能+”行動的意見》、《國家人工智能產(chǎn)業(yè)綜合標準化體系建設(shè)指南（2024版）》、《“十四五”數(shù)字經(jīng)濟發(fā)展規(guī)劃》等頂層設(shè)計，明確了智能終端的規(guī)?；占澳繕?，直接為SLM創(chuàng)造了廣闊的市場需求。其政策信號明確，政策指出到2027年，新一代智能終端、智能體等應(yīng)用普及率要超過70%，這意味著未來三年內(nèi)，數(shù)以億計的智能設(shè)備將需要配置高效的端側(cè)AI能力。

同時，地方政府政策迅速跟進。北京作為AI產(chǎn)業(yè)的政策高地，出臺《北京市推動"人工智能+"行動計劃（2024-2025年）》，為面壁智能等本地端側(cè)AI企業(yè)提供了從研發(fā)補貼到場景開放的全方位支持。深圳也發(fā)布了《深圳市加快推動人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動方案（2023—2024年）》。

圖表13中國小語言模型（SLM）扶持政策

信息來源：融中咨詢

（2）融資動態(tài)：資本聚焦"輕量化"新賽道

近年來對小語言模型的投資呈現(xiàn)出巨額資本集中于頭部項目、于近年全球性爆發(fā)、并由戰(zhàn)略性和生態(tài)性投資驅(qū)動的鮮明趨勢。

小語言模型的巨額融資成為常態(tài)，彰顯資本對其的強烈信心。如下圖所示，頭部公司的單輪融資額動輒達到數(shù)億美金或歐元量級。例如，MistralAI在短短半年內(nèi)從種子輪（1.05億歐元）迅速躍升至B輪（3.85億歐元），彰顯了資本對其的強烈信心。中國的01.AI在A輪融資后估值即超過10億美元，迅速躋身獨角獸行列。這表明市場愿意為平臺的潛在價值支付高額溢價。

小語言模型融資近年來全球爆發(fā)。2023年是小語言模型融資的爆發(fā)年，下圖中大部分核心融資事件（MistralAI兩輪融資、Cohere的C輪、HuggingFace的D輪等）都密集發(fā)生在2023年。這表明在ChatGPT帶來生成式AI熱潮后，市場意識到小語言模型是具有商業(yè)化潛力的方向，資本在當(dāng)年集中涌入。融資事件覆蓋了美國（AdeptAI）、歐洲（MistralAI）和中國（01.AI,智譜AI），形成了北美、歐洲、亞洲三足鼎立的競爭格局。

融資階段從早期到成長期并重，戰(zhàn)略投資占據(jù)主導(dǎo)地位。小語言模型的融資市場不僅限于早期投資（種子/A輪），B輪、C輪乃至D輪的成熟期項目同樣活躍。這說明一批領(lǐng)先的初創(chuàng)公司已經(jīng)跑通了技術(shù)或初步商業(yè)模式，獲得了持續(xù)的大額資金支持以加速擴張。此外，小語言模型的投資方名單中出現(xiàn)了阿里云、小米等產(chǎn)業(yè)資本，以及a16z、Lightspeed等頂級風(fēng)投。產(chǎn)業(yè)資本的深度參與，意味著小語言模型的發(fā)展與各大科技公司的云服務(wù)、硬件生態(tài)等核心戰(zhàn)略緊密綁定。

圖表14全球重點小語言模型融資情況

信息來源：融中咨詢

安全與濫用風(fēng)險：AIBussiness研究指出，由于SLMs的代碼是開源的，數(shù)據(jù)盜竊和隱私問題等安全風(fēng)險會更加嚴重。浙江大學(xué)區(qū)塊鏈與數(shù)據(jù)安全全國重點實驗室發(fā)現(xiàn)，近50%的SLMs在遭受越獄攻擊時顯示出高脆弱性，開發(fā)人員需從開發(fā)早期階段優(yōu)先考慮安全設(shè)計原則。

模型泛化能力風(fēng)險：SLMs雖然在特定任務(wù)中表現(xiàn)優(yōu)秀，但在應(yīng)對更廣泛、多變的場景時，如復(fù)雜推理、跨領(lǐng)域知識整合上，往往難以維持高效表現(xiàn)。相較于LLMs，SLMs可能更容易受到數(shù)據(jù)偏見的影響，缺乏足夠的適應(yīng)能力。盡管SLMs在特定場景表現(xiàn)良好，但在復(fù)雜推理、代碼生成等任務(wù)上仍難以匹敵大規(guī)模LLMs。

數(shù)據(jù)質(zhì)量風(fēng)險：如果訓(xùn)練數(shù)據(jù)中存在偏差或不平衡，小模型可能會在特定場景下表現(xiàn)出較低的泛化能力，甚至產(chǎn)生不準確的預(yù)測或生成內(nèi)容。因此，要確保訓(xùn)練數(shù)據(jù)的質(zhì)量。一方面，在數(shù)據(jù)清洗時要進行去噪處理，通過去除重復(fù)項、糾正標注錯誤等方式來提高數(shù)據(jù)質(zhì)量。另一方面，要結(jié)合外部的知識庫，彌補數(shù)據(jù)中存在的不足，增強模型的泛化能力。

小模型局限性風(fēng)險：小語言模型通常設(shè)計為專門處理特定領(lǐng)域或任務(wù)，因此其知識庫相對有限，難以應(yīng)對跨領(lǐng)域的復(fù)雜問題。為了解決小模型使用局限性的問題，一是模塊化設(shè)計，將小模型設(shè)計為可擴展的模塊系統(tǒng)，可以通過引入專門的插件或外部知識庫，擴充其對不同主題的處理能力。二是多模型集成，通過將多個小模型進行集成，形成一個組合型的系統(tǒng)，充分發(fā)揮每個模型在特定領(lǐng)域的優(yōu)勢。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.