国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

小語言模型:構(gòu)建輕量化人工智能生態(tài)的拼圖塊

0
分享至


核心觀點:
  • 小語言模型的巨額融資成為常態(tài),頭部公司的單輪融資額動輒達到數(shù)億美金或歐元量級。例如,MistralAI在短短半年內(nèi)從種子輪(1.05億歐元)迅速躍升至B輪(3.85億歐元),中國的01.AI在A輪融資后估值即超過10億美元,迅速躋身獨角獸行列。
  • 與大型云端模型不同,小語言模型憑借其低延遲、高隱私、離線運行能力,在與用戶日常生活緊密相關(guān)的智能終端領(lǐng)域率先取得突破性進展。
  • 近年來,國家層面通過《關(guān)于深入實施“人工智能+”行動的意見》、《國家人工智能產(chǎn)業(yè)綜合標準化體系建設(shè)指南(2024版)》等頂層設(shè)計,明確了智能終端的規(guī)?;占澳繕?,相關(guān)政策指出到2027年,新一代智能終端、智能體等應(yīng)用普及率要超過70%,直接為小語言模型創(chuàng)造了廣闊的市場需求。
  • 全球小語言模型市場已初步形成"國際科技巨頭生態(tài)壟斷、中國AI獨角獸技術(shù)突破、專注型初創(chuàng)快速落地、硬件終端巨頭跨界整合"的多元化競爭格局。
  • 中國作為全球最大的智能終端制造和消費市場,在小語言模型領(lǐng)域具有天然優(yōu)勢。預(yù)計中國市場占據(jù)全球市場約25-30%的份額,2024年市場規(guī)模約為96~115億元人民幣,到2031年或達到336~403億元人民幣。


(1)定義及優(yōu)勢

小型語言模型(Small Language Models,SLM)指的是相對于大型語言模型而言,規(guī)模較小、參數(shù)數(shù)量較少的模型,通常情況下,其參數(shù)量在數(shù)百萬到數(shù)幾十億之間。而大型語言模型的參數(shù)量則高達千億甚至萬億個,例如OpenAI的chatGPT3.0模型(1750億)。

小語言模型通常在處理特定任務(wù)或領(lǐng)域時,能夠以較低的計算成本實現(xiàn)相對不錯的性能。此外,小語言模型在資源有限、需要快速部署或?qū)崟r性要求較高的應(yīng)用場景中亦非常實用。

(2)主要特點及對比

鑒于參數(shù)量相對較少,小語言模型在訓(xùn)練和部署方面,具有成本低、快速響應(yīng)、特定領(lǐng)域優(yōu)化、易于集成、可解釋性等優(yōu)勢。

圖表1小語言模型特點


信息來源:融中咨詢

總體來說,大模型與小模型在參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)量、計算資源需求及應(yīng)用場景方面有區(qū)別。大模型(參數(shù)十億級以上)依賴海量數(shù)據(jù)和高算力,適用于高精度復(fù)雜任務(wù)(如NLP);而小模型參數(shù)少,對數(shù)據(jù)和算力的需求低,成本更低。

圖表2大語言模型與小語言模型的對比


信息來源:融中咨詢

以Phi-3全系列、Gemma-7b、Mistral-7b等小語言模型的性能數(shù)據(jù)與Mixtral-8x7b、GPT-3.5-Turbo、Claude-3-Sonnet等大模型進行對比,語言理解、推理、數(shù)學(xué)、代碼生成等方面,并沒有出現(xiàn)明顯的差異。具體如下圖所示。

圖表3Phi-3-Mini的性能對比


信息來源:融中咨詢

(3)近期模型

2024-2025年新發(fā)布的小語言模型匯總了來自全球頂尖科技公司(如Google、Microsoft、Meta、Apple、NVIDIA、阿里巴巴、騰訊等)和學(xué)術(shù)機構(gòu)(如北大),其競爭焦點已從單純追求“參數(shù)規(guī)模”轉(zhuǎn)向追求“性能與效率的極致平衡”。開發(fā)者們正致力于打造在特定場景下(如邊緣計算、手機端、安全領(lǐng)域)能力卓越,且能耗更低、速度更快的“小而強”模型。

圖表42024-2025年新發(fā)布的小語言模型統(tǒng)計


信息來源:融中咨詢


小語言模型(SLM)行業(yè)自2023年起進入了快速發(fā)展期,呈現(xiàn)出從通用模型向?qū)I(yè)化、多樣化方向演進的特點。

早期發(fā)展(2023年之前):行業(yè)起步階段以開源和通用型模型為主,例如Megatron-GPT2、GPT-Neo等。這些模型為后續(xù)發(fā)展奠定了技術(shù)基礎(chǔ)。

爆發(fā)增長(2023年及之后):這一年模型發(fā)布數(shù)量顯著增加,并出現(xiàn)了關(guān)鍵趨勢。微軟發(fā)布的Phi系列(從Phi-1.5到Phi-2)展示了通過高質(zhì)量數(shù)據(jù)訓(xùn)練小模型的巨大潛力。同時,領(lǐng)域?qū)S媚P烷_始涌現(xiàn),如AstroLLaMA(天文學(xué)),標志著SLMs開始向垂直領(lǐng)域深入。開發(fā)團隊也愈發(fā)多元,涵蓋了學(xué)術(shù)界、工業(yè)界和開源社區(qū)。

深化與專業(yè)化(2024年及以后):行業(yè)發(fā)展進一步聚焦于垂直領(lǐng)域和性能優(yōu)化。微軟持續(xù)迭代其Phi系列(Phi-3,Phi-3.5),其他機構(gòu)也推出了如ChemLLM(化學(xué))和Hippocrates(醫(yī)療)等大量專業(yè)模型。同時,技術(shù)路徑更加多樣,出現(xiàn)了如Rho-1等專注于代碼訓(xùn)練的模型。這一趨勢預(yù)計將持續(xù)到2025年及未來,SLMs正朝著更精細的領(lǐng)域定制、更高的效率以及更廣泛的開發(fā)者參與方向演進。

圖表5小語言模型的發(fā)展歷史


信息來源:融中咨詢


(1)產(chǎn)業(yè)鏈結(jié)構(gòu):端、邊、芯協(xié)同生態(tài)

小語言模型產(chǎn)業(yè)鏈涵蓋硬件基礎(chǔ)設(shè)施、算法模型研發(fā)及行業(yè)終端應(yīng)用的多層次生態(tài)體系。其最顯著的特點是與"端、邊、芯"(終端設(shè)備、邊緣計算、芯片)的高度協(xié)同。與傳統(tǒng)云端大模型依賴數(shù)據(jù)中心算力不同,SLM的價值實現(xiàn)必須深度嵌入終端設(shè)備的硬件能力和應(yīng)用場景。

圖表6小語言模型產(chǎn)業(yè)鏈結(jié)構(gòu)圖


信息來源:融中咨詢

  • 上游:數(shù)據(jù)與硬件支持

小語言模型產(chǎn)業(yè)的蓬勃發(fā)展,離不開其上游堅實的基礎(chǔ)支撐層,該層級為模型的研發(fā)、訓(xùn)練與部署提供了不可或缺的核心資源。

1)在硬件與算力層面,訓(xùn)練環(huán)節(jié)主要由NVIDIA的GPU(如H100/H200)主導(dǎo),AMD、Intel等廠商也在積極競爭。而在推理環(huán)節(jié),尤其是邊緣計算芯片,如高通手機芯片、蘋果的M系列NPU以及Intel的CoreUltraNPU,成為了小模型生態(tài)落地的關(guān)鍵戰(zhàn)場,它們?yōu)槟P驮诮K端設(shè)備上的高效運行提供了硬件基礎(chǔ),同時眾多初創(chuàng)公司也致力于開發(fā)專用的低功耗AI加速器。

2)AWS、Azure、GoogleCloud等全球云計算平臺則提供了強大的訓(xùn)練算力與便捷的模型托管服務(wù),顯著降低了研發(fā)門檻。其次,高質(zhì)量的數(shù)據(jù)與服務(wù)是模型智能的源泉,專業(yè)的數(shù)據(jù)供應(yīng)商提供預(yù)訓(xùn)練數(shù)據(jù)集與合成數(shù)據(jù),而數(shù)據(jù)清洗與標注公司則為小模型在特定領(lǐng)域的專業(yè)化提供了關(guān)鍵的精標數(shù)據(jù)支持。

3)成熟的框架與工具構(gòu)成了技術(shù)棧的基石。以PyTorch、TensorFlow、JAX為核心的開源框架,與HuggingFace的Transformers、Tokenizers等生態(tài)工具共同構(gòu)成了模型開發(fā)的標準流程,而ONNX等開放格式則極大地推動了模型的跨平臺部署與應(yīng)用。

  • 中游:技術(shù)研發(fā)與模型開發(fā)

中游是模型與生態(tài)層,作為產(chǎn)業(yè)鏈的核心,這里匯聚了多元的參與者,共同推動小語言模型的研發(fā)、優(yōu)化與分發(fā)。

1)在模型開發(fā)者層面,科技巨頭如Microsoft、Google、Meta和Apple憑借其前沿的Phi、Gemma、Llama及OpenELM等系列模型引領(lǐng)技術(shù)方向,并普遍采用開源策略以構(gòu)建開發(fā)者生態(tài),同時為其云業(yè)務(wù)引流。

2)01.AI、Moondream等頂尖AI實驗室與初創(chuàng)公司則展現(xiàn)出更高的靈活性與專注度,在特定領(lǐng)域或技術(shù)點上實現(xiàn)關(guān)鍵突破;而充滿活力的開源社區(qū)基于巨頭發(fā)布的基座模型,進行精細微調(diào)、壓縮與優(yōu)化。

  • 下游:應(yīng)用場景的落地

在行業(yè)應(yīng)用解決方案上,小模型憑借其能夠本地化部署的優(yōu)勢,在各個領(lǐng)域發(fā)揮優(yōu)勢。

1)在金融領(lǐng)域,SLM實現(xiàn)智能客服、財報分析和風(fēng)險審核,嚴格保障數(shù)據(jù)安全;

2)在醫(yī)療領(lǐng)域,SLM輔助臨床決策、結(jié)構(gòu)化病歷,有力保護患者隱私;

3)在教育領(lǐng)域,SLM充當(dāng)個性化學(xué)習(xí)助手;

4)在法律領(lǐng)域完成高效的合同審查與案例查詢;

5)在手機與PC上,以端側(cè)智能助手的形式實現(xiàn)照片增強、文案創(chuàng)作和實時翻譯;

6)在汽車座艙內(nèi),作為車載語音助手提供快速響應(yīng)、離線可用的交互體驗;

7)在IoT設(shè)備中,則成為機器人、智能家居的中控大腦,實現(xiàn)低延遲、低功耗的智能控制。

(2)市場規(guī)模:從爆發(fā)期邁向成熟期

全球小語言模型市場正處于快速增長通道。2024年市場規(guī)模為53.8億美元,到2031年將增長至188億美元,年復(fù)合增長率(CAGR)為20.9%。這一增速顯著高于傳統(tǒng)企業(yè)軟件市場,反映了端側(cè)AI作為新興技術(shù)的強勁需求。

中國市場占據(jù)全球小語言市場25-30%的份額。中國作為全球最大的智能終端制造和消費市場,在小語言模型領(lǐng)域具有天然優(yōu)勢。預(yù)計中國市場占據(jù)全球市場約25-30%的份額,2024年市場規(guī)模約為96-115億元人民幣,到2031年將達到336-403億元人民幣。

圖表7全球及中國小語言模型行業(yè)規(guī)模情況


數(shù)據(jù)來源:融中咨詢


SLM正逐漸成為推動行業(yè)智能化變革的關(guān)鍵力量。在金融領(lǐng)域,它用于自動化處理財報摘要生成與智能投研信息提取,提升風(fēng)控與運營效率;娛樂行業(yè)利用它創(chuàng)作營銷文案、驅(qū)動游戲NPC基礎(chǔ)對話并賦能互動敘事;汽車系統(tǒng)通過集成SLM,打造能理解復(fù)雜指令的車載語音助手,提升交互體驗與駕駛安全;教育工具借其提供個性化的學(xué)習(xí)輔導(dǎo)和交互式語言練習(xí);電商零售則依靠SLM聊天機器人高效處理售前售后咨詢,顯著提升客戶服務(wù)體驗與滿意度;在醫(yī)療領(lǐng)域,SLM被用于初步的健康問答分診,并輔助完成病歷結(jié)構(gòu)化等行政工作,幫助優(yōu)化緊張的醫(yī)療資源分配。

圖表8小語言模型下游細分結(jié)構(gòu)


數(shù)據(jù)來源:融中咨詢

(1)核心應(yīng)用場景:智能終端引領(lǐng)落地潮

小語言模型的應(yīng)用落地正處在從"探索孵化期"向"規(guī)模應(yīng)用期"過渡的關(guān)鍵階段。與大型云端模型不同,SLM憑借其低延遲、高隱私、離線運行能力,在與用戶日常生活緊密相關(guān)的智能終端領(lǐng)域率先取得突破性進展。其應(yīng)用的核心邏輯在于將智能計算從云端前置到設(shè)備本地,為用戶提供更即時、更個性化、更安全的AI體驗,推動AI應(yīng)用從"能用"向"好用"邁進。

圖表9主要行業(yè)小語言模型應(yīng)用成熟度評估(2024-2025年)



數(shù)據(jù)來源:融中咨詢

(2)標桿案例深度剖析

  • 案例一:小米"超級小愛同學(xué)"——生態(tài)融合的端側(cè)AI大腦

小米公司在其澎湃OS(HyperOS)中集成的"超級小愛同學(xué)",是SLM在智能手機終端應(yīng)用的標桿案例。它不再是一個簡單的語音問答工具,而是深度融合了SLM能力的端側(cè)AI大腦。

該助手具備強大的多模態(tài)交互、全局自然語言搜索、屏幕識別和跨設(shè)備執(zhí)行能力。例如,用戶可以直接用自然語言命令手機"幫我查找上周拍的帶狗的照片,并發(fā)送給媽媽",系統(tǒng)能理解指令、識別圖像內(nèi)容、調(diào)用聯(lián)系人并執(zhí)行發(fā)送動作。其核心是結(jié)合了全生態(tài)感知的個人本地信息庫。SLM在端側(cè)直接處理和理解用戶的個人數(shù)據(jù)(如日程、照片、偏好),無需上傳云端,從而具備了高度個性化的記憶能力,極大地保護了用戶隱私。該功能已于2024年11月開始在小米15、小米14等系列機型上推送內(nèi)測。

  • 案例二:長安馬自達EZ-60——端側(cè)模型賦能的智能座艙

面壁智能與長安馬自達的合作,誕生了全球首批搭載純端側(cè)大模型并實現(xiàn)量產(chǎn)的車型——MAZDAEZ-60,標志著SLM在智能汽車領(lǐng)域的商業(yè)化落地取得了重大突破。

在智能座艙內(nèi),SLM作為長安馬自達的車載AI助手,負責(zé)處理導(dǎo)航、娛樂、車輛控制等多種語音指令。用戶可以通過自然語言與車輛交互,例如"幫我找一家附近評分高的川菜館,并導(dǎo)航過去",系統(tǒng)能夠理解意圖、搜索信息、規(guī)劃路線并啟動導(dǎo)航。車載助手即使在隧道、山區(qū)等無網(wǎng)絡(luò)環(huán)境下,依然能夠提供毫秒級的快速響應(yīng)和穩(wěn)定流暢的交互。同時,所有語音交互數(shù)據(jù)和用戶偏好數(shù)據(jù)都在車內(nèi)本地處理,最大限度地保障了用戶的隱私和數(shù)據(jù)安全。

  • 案例三:GooglePixel的GeminiNano——操作系統(tǒng)級整合

在國際市場,Google的GeminiNano代表了另一種端側(cè)AI的落地路徑——通過操作系統(tǒng)級別的深度整合,將SLM能力開放給整個Android生態(tài)。GeminiNano推出了1.8B和3.25B兩個參數(shù)版本,專為移動設(shè)備優(yōu)化,支持4位量化部署,可在主流Android手機上流暢運行。其核心能力包括設(shè)備端文本生成、智能回復(fù)建議、實時語音轉(zhuǎn)寫等。

Google的策略是將GeminiNano作為Android操作系統(tǒng)的基礎(chǔ)AI能力,開放給所有應(yīng)用開發(fā)者調(diào)用。這意味著,未來數(shù)十億臺Android設(shè)備都將內(nèi)置端側(cè)AI能力,開發(fā)者無需自己訓(xùn)練模型,即可為用戶提供智能化體驗。這種"平臺化"策略,與小米、面壁智能的"場景化"落地形成了有趣的對比,反映了不同企業(yè)在SLM商業(yè)化路徑上的差異化選擇。

圖表10SLM在主流終端的應(yīng)用功能對比


信息來源:融中咨詢


(1)市場參與者圖譜:多元化競爭生態(tài)

全球小語言模型市場已初步形成"國際科技巨頭生態(tài)壟斷、中國AI獨角獸技術(shù)突破、專注型初創(chuàng)快速落地、硬件終端巨頭跨界整合"的多元化競爭格局。

  • 第一梯隊:國際科技巨頭

以Google、Apple為代表。這些企業(yè)通過操作系統(tǒng)和芯片的生態(tài)控制力,構(gòu)建了難以撼動的競爭壁壘。Google的GeminiNano深度集成Android系統(tǒng),覆蓋全球數(shù)十億設(shè)備;Apple的AppleIntelligence基于自研芯片,強調(diào)隱私優(yōu)先和端云協(xié)同,截至2024年Q4,超過10億臺設(shè)備將獲得該功能。

谷歌:谷歌的小語言模型(如Gemma)是基于谷歌最強大的大模型(如Gemini)的技術(shù)和研究構(gòu)建的輕量級、開源模型。它們共享相同的技術(shù)基礎(chǔ)架構(gòu)和組件,但在參數(shù)規(guī)模上進行了精簡,旨在讓更多的開發(fā)者和組織能夠輕松獲取和使用先進的AI技術(shù)。

Gemma模型的核心特點是輕量級和高度優(yōu)化,確保它們可以在從移動設(shè)備到云端系統(tǒng)等各種計算環(huán)境中靈活訪問和運行。谷歌發(fā)布了兩個主要版本的Gemma模型,分別為20億參數(shù)和70億參數(shù)的規(guī)模。每個版本都提供預(yù)訓(xùn)練模型和指令調(diào)優(yōu)的變體,以滿足不同開發(fā)者的需求和應(yīng)用場景。

微軟:微軟在小語言模型領(lǐng)域也有著清晰的戰(zhàn)略和出色的產(chǎn)品,微軟開源了一個名為Phi-3-mini的小型語言模型,它擁有38億參數(shù),并在多種任務(wù)上展現(xiàn)出了出色的性能。Phi系列(開源模型)是微軟SLM研究的主力軍,已經(jīng)迭代了多個版本。Phi-3系列(2024年4月發(fā)布),Phi-3使用了與Llama2類似的更現(xiàn)代架構(gòu),并在一個由高度篩選的網(wǎng)頁數(shù)據(jù)和合成數(shù)據(jù)組成的超大數(shù)據(jù)集上進行了訓(xùn)練,進一步鞏固了“數(shù)據(jù)質(zhì)量至上”的理念。

英偉達:英偉達的SLM代表作是Nemotron和ChatQA系列,但其影響力更體現(xiàn)在它提供的整個開發(fā)生態(tài)上。與谷歌、微軟等主要從模型研發(fā)角度切入不同,英偉達的SLM戰(zhàn)略是其全棧AI帝國藍圖中的關(guān)鍵一環(huán),核心思想是:“我們提供從芯片、軟件到模型的一整套最佳實踐,告訴全世界如何最高效地構(gòu)建和使用SLM。

Meta:Meta的SLM戰(zhàn)略核心非常清晰,Meta強力推進開源,與OpenAI和Anthropic的閉源策略相反,Meta選擇將其最重要的模型(如Llama系列)開源,允許研究者和開發(fā)者免費商用、研究和修改。這極大地推動了AI技術(shù)的民主化。此外,Meta構(gòu)建模型家族,Meta不滿足于只發(fā)布一個模型,而是構(gòu)建了從70億到700億參數(shù)的完整模型譜系,覆蓋從手機到數(shù)據(jù)中心的各類場景。同時,Meta注重社區(qū)驅(qū)動創(chuàng)新,通過開源,Meta吸引了全球最聰明的頭腦在其模型基礎(chǔ)上進行微調(diào)、優(yōu)化和創(chuàng)新,形成了一個強大的飛輪效應(yīng)。社區(qū)貢獻的無數(shù)微調(diào)版本反過來又增強了Llama生態(tài)的活力。

Apple:OpenELM是蘋果在2024年4月發(fā)布的一個模型家族,它清晰地展示了蘋果在SLM領(lǐng)域的技術(shù)路線。OpenELM是一個基礎(chǔ)語言模型,而非對話模型。它的目的是作為一個強大的起點,供社區(qū)和研究者進行微調(diào)和進一步開發(fā),同時也向業(yè)界展示了蘋果在模型架構(gòu)上的創(chuàng)新能力。

  • 第二梯隊:中國AI獨角獸

以智譜AI、MiniMax為代表。這些企業(yè)在通用大模型領(lǐng)域已建立深厚的技術(shù)和資本壁壘,現(xiàn)階段正利用其優(yōu)勢向下布局端側(cè)市場。智譜AI推出GLM-Edge系列,與高通深度適配;MiniMax探索MoE等高效架構(gòu)以降低推理成本。

此外,阿里巴巴的SLM戰(zhàn)略是其宏大AI藍圖中的關(guān)鍵一環(huán),旨在滿足不同場景下的算力和效率需求。Qwen2.5系列是阿里巴巴最新一代的小語言模型,這是目前阿里最新、最強大的模型家族,其中包含了多個卓越的小模型,包括Qwen2.5-1.5B/3B/7B、Qwen2.5-72B-IN-9B等。

  • 第三梯隊:專注型初創(chuàng)企業(yè)

以面壁智能為代表。此類企業(yè)自創(chuàng)立之初就聚焦于端側(cè)AI和輕量化模型賽道,技術(shù)迭代迅速,商業(yè)化落地目標明確。其核心優(yōu)勢在于技術(shù)專注度和靈活性,能夠快速響應(yīng)市場需求。

  • 第四梯隊:硬件及終端巨頭

以小米、地平線為代表。小米通過自研"超級小愛同學(xué)",將SLM能力深度集成到手機和IoT產(chǎn)品生態(tài)中;地平線則作為上游芯片領(lǐng)導(dǎo)者,通過提供高性能車規(guī)級AI芯片,賦能下游智能汽車應(yīng)用。

此外,vivo的“藍心大模型”是一個覆蓋不同規(guī)模的模型家族,其中端側(cè)模型是其重中之重,也是一個典型的代表。其中藍心大模型7B(70億參數(shù))及以下,這是vivo端側(cè)能力的核心,主要包括藍心大模型7B,這是能夠在旗艦機型上流暢運行的、能力最全面的端側(cè)模型。它負責(zé)處理手機端大部分復(fù)雜的AI任務(wù)。

(2)核心競爭力分析:技術(shù)、生態(tài)、場景三維博弈

不同類型的參與者圍繞技術(shù)、生態(tài)和場景三個維度構(gòu)建自身的核心競爭力,形成了差異化的競爭格局。

圖表11全球小語言模型競爭格局分布


信息來源:融中咨詢

(3)國內(nèi)代表企業(yè)分析

  • 面壁智能——專注端側(cè),快速迭代

面壁智能是當(dāng)前中國SLM賽道中最具代表性的領(lǐng)跑者。公司成立于2022年8月,核心戰(zhàn)略是專注于端側(cè)AI和小語言模型的研發(fā)。其推出的MiniCPM系列輕量化模型,在輕量化與高性能方面表現(xiàn)突出。其最新模型可在端側(cè)設(shè)備上實現(xiàn)GPT-3.5級別的性能,而參數(shù)量大幅減少。公司堅持開源戰(zhàn)略,模型在HuggingFace等平臺廣受認可,截至2025年5月,全平臺下載量累計已突破1000萬。它通過創(chuàng)新的模型壓縮、量化和蒸餾技術(shù),在保持性能的前提下,將模型規(guī)模壓縮到可以在手機、車機等終端設(shè)備上流暢運行的程度。

面壁智能的商業(yè)化路徑清晰且迅速。2025年4月,其端側(cè)模型成功搭載于長安馬自達MAZDAEZ-60量產(chǎn)車型上,完成了車規(guī)級場景的重大突破。這是全球首批搭載純端側(cè)大模型并實現(xiàn)量產(chǎn)的車型,具有里程碑意義。車規(guī)級應(yīng)用的難度遠高于消費電子。它要求模型不僅性能優(yōu)異,還要滿足極端溫度、振動、電磁干擾等嚴苛環(huán)境下的穩(wěn)定運行,以及汽車行業(yè)對安全性的極高標準。面壁智能的成功,證明了其技術(shù)的成熟度和工程化能力。

憑借清晰的技術(shù)路線和商業(yè)化進展,面壁智能獲得了資本市場的高度認可。在2024年12月至2025年5月的半年內(nèi),連續(xù)完成兩輪由龍芯創(chuàng)投、北京市人工智能產(chǎn)業(yè)投資基金、洪泰基金等參與的數(shù)億元融資。這種密集融資節(jié)奏反映了投資方對其長期價值的看好,也為公司后續(xù)的技術(shù)研發(fā)和市場拓展提供了充足的資金支持。

  • 地平線——車規(guī)芯片,生態(tài)賦能

地平線是SLM產(chǎn)業(yè)鏈上游的核心企業(yè),是邊緣人工智能芯片的全球領(lǐng)導(dǎo)者,也是國內(nèi)唯一實現(xiàn)車規(guī)級AI芯片大規(guī)模量產(chǎn)前裝的企業(yè)。地平線是國內(nèi)首家、也是目前規(guī)模最大實現(xiàn)車規(guī)級AI芯片前裝量產(chǎn)的企業(yè)。征程系列芯片出貨量已達數(shù)百萬片,與超過30家國內(nèi)外主流車企建立了合作關(guān)系。截至2024年底,其芯片已搭載于超過200萬輛汽車上,覆蓋比亞迪、長城、上汽、理想等主流車企。

圖表12地平線征程系列芯片算力對比


信息來源:融中咨詢

公司基于自研的BPU(BrainProcessingUnit)人工智能專用計算架構(gòu),打造了征程(Journey)系列芯片。其征程5單芯片算力可達96TOPS,最新的征程6系列性能更強,能夠滿足L2至L4級自動駕駛的算力需求。BPU架構(gòu)的核心優(yōu)勢在于,針對AI推理任務(wù)進行專門優(yōu)化,相比通用GPU,在能效比和成本上具有顯著優(yōu)勢。這使得地平線的芯片能夠在車載這種對功耗、散熱、成本都有嚴格限制的場景下,提供強大的AI算力。

公司與上汽、小米等頭部企業(yè)及超過20家機器人廠商建立了深度合作關(guān)系。通過提供強大的、開放的芯片平臺,地平線為下游廣大的SLM模型和應(yīng)用廠商提供了堅實的硬件基礎(chǔ)。這種開放生態(tài)策略的價值在于,通過成為產(chǎn)業(yè)鏈的"基礎(chǔ)設(shè)施提供者",地平線不僅能夠獲得芯片銷售收入,更重要的是在整個產(chǎn)業(yè)生態(tài)中占據(jù)了不可或缺的核心地位,建立了長期的競爭壁壘。

地平線的商業(yè)模式正在從單純的芯片銷售,向"芯片+算法+工具鏈"的整體解決方案演進。公司不僅提供硬件,還提供配套的算法開發(fā)工具、模型優(yōu)化服務(wù),幫助客戶快速將AI能力落地到產(chǎn)品中。這種轉(zhuǎn)型使得地平線能夠獲取更高的產(chǎn)品附加值,同時也加深了與客戶的綁定關(guān)系。

  • 阿里巴巴——算力支持,性能領(lǐng)先

阿里巴巴集團控股有限公司是中國領(lǐng)先的互聯(lián)網(wǎng)科技企業(yè),創(chuàng)立于1999年,是開源模型領(lǐng)域的積極推動者之一。其通義千問團隊既研發(fā)千億級別的超大模型以處理核心難題,也大力推廣其1.8B、7B等“輕量化”模型,以滿足端側(cè)部署和低成本快速響應(yīng)的需求,形成了完整的技術(shù)覆蓋。其Qwen1.5系列提供了從0.5B到72B的完整模型矩陣,其中1.8B、4B、7B等輕量化模型在同等規(guī)模中性能表現(xiàn)相對領(lǐng)先。

通義千問團隊背靠阿里云遍布全球的數(shù)據(jù)中心和強大的算力設(shè)施(如倚天710等自研芯片),在模型訓(xùn)練和推理上具備顯著優(yōu)勢。在落地場景方面,阿里巴巴龐大的電商、支付、物流、文娛等業(yè)務(wù)生態(tài),為通義千問模型提供了海量的真實世界測試數(shù)據(jù)和落地場景,這是絕大多數(shù)團隊不具備的獨特優(yōu)勢。

  • 深度求索——技術(shù)驅(qū)動,垂直領(lǐng)域突出

深度求索(DeepSeek)成立于2023年,總部位于杭州,由幻方量化孵化,專注于人工智能底層模型與技術(shù)的研發(fā)。DeepSeek-V2及其Lite版本是其重要的模型產(chǎn)品。他們的DeepSeek-Coder系列在代碼模型領(lǐng)域表現(xiàn)優(yōu)異。

深度求索專注于“高效性能”的核心技術(shù)路線。DeepSeek-V2采用了創(chuàng)新的MoE(混合專家)架構(gòu),總參數(shù)量為236B,但通過路由機制每次推理僅激活約21B參數(shù),實現(xiàn)了以較低的計算成本獲得接近大模型的性能。深度求索公司通過技術(shù)驅(qū)動,在代碼和數(shù)學(xué)等垂直領(lǐng)域能力突出,堅持開源策略,具有較高的成本效益比。

  • 全志科技——“算力底座”,芯片賦能

全志科技的芯片產(chǎn)品作為底層算力平臺,對小語言模型在端側(cè)設(shè)備的普及和高效運行提供了關(guān)鍵支持。全志科技成立于2007年,2015年在創(chuàng)業(yè)板上市,主營業(yè)務(wù)涵蓋智能應(yīng)用處理器SoC、高性能模擬器件及無線互聯(lián)芯片的研發(fā)與銷售。全志科技2025年上半年營業(yè)收入為13.37億元,同比增長25.82%;歸屬于上市公司股東的凈利潤1.61億元,同比增長35.36%。

近年來,全志科技發(fā)布的多款新一代SoC(如MR系列、R系列和H系列的部分型號)都原生集成了專用NPU。這意味著芯片在設(shè)計階段就為AI計算進行了優(yōu)化,能夠高效地執(zhí)行小語言模型的推理任務(wù)。此外,全志科技正致力于深化“算力底座”的角色,通過推出算力更強的AIoT芯片,并與模型廠商深度合作,為客戶提供“推薦芯片型號+適配的輕量級模型+優(yōu)化部署工具”的一站式解決方案,極大降低終端產(chǎn)品實現(xiàn)AI智能化門檻。


(1)政策環(huán)境:從"通用鼓勵"到"精準扶持”

2024至2025年,中國AI產(chǎn)業(yè)的政策環(huán)境呈現(xiàn)出清晰的結(jié)構(gòu)性傾斜——從對通用大模型的全面鼓勵,轉(zhuǎn)向?qū)?yīng)用落地和算力高效性的精準扶持,為小語言模型(SLM)和端側(cè)AI的發(fā)展打開了關(guān)鍵的政策窗口期。

國家層面通過《關(guān)于深入實施“人工智能+”行動的意見》、《國家人工智能產(chǎn)業(yè)綜合標準化體系建設(shè)指南(2024版)》、《“十四五”數(shù)字經(jīng)濟發(fā)展規(guī)劃》等頂層設(shè)計,明確了智能終端的規(guī)?;占澳繕?,直接為SLM創(chuàng)造了廣闊的市場需求。其政策信號明確,政策指出到2027年,新一代智能終端、智能體等應(yīng)用普及率要超過70%,這意味著未來三年內(nèi),數(shù)以億計的智能設(shè)備將需要配置高效的端側(cè)AI能力。

同時,地方政府政策迅速跟進。北京作為AI產(chǎn)業(yè)的政策高地,出臺《北京市推動"人工智能+"行動計劃(2024-2025年)》,為面壁智能等本地端側(cè)AI企業(yè)提供了從研發(fā)補貼到場景開放的全方位支持。深圳也發(fā)布了《深圳市加快推動人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動方案(2023—2024年)》。

圖表13中國小語言模型(SLM)扶持政策


信息來源:融中咨詢

(2)融資動態(tài):資本聚焦"輕量化"新賽道

近年來對小語言模型的投資呈現(xiàn)出巨額資本集中于頭部項目、于近年全球性爆發(fā)、并由戰(zhàn)略性和生態(tài)性投資驅(qū)動的鮮明趨勢。

小語言模型的巨額融資成為常態(tài),彰顯資本對其的強烈信心。如下圖所示,頭部公司的單輪融資額動輒達到數(shù)億美金或歐元量級。例如,MistralAI在短短半年內(nèi)從種子輪(1.05億歐元)迅速躍升至B輪(3.85億歐元),彰顯了資本對其的強烈信心。中國的01.AI在A輪融資后估值即超過10億美元,迅速躋身獨角獸行列。這表明市場愿意為平臺的潛在價值支付高額溢價。

小語言模型融資近年來全球爆發(fā)。2023年是小語言模型融資的爆發(fā)年,下圖中大部分核心融資事件(MistralAI兩輪融資、Cohere的C輪、HuggingFace的D輪等)都密集發(fā)生在2023年。這表明在ChatGPT帶來生成式AI熱潮后,市場意識到小語言模型是具有商業(yè)化潛力的方向,資本在當(dāng)年集中涌入。融資事件覆蓋了美國(AdeptAI)、歐洲(MistralAI)和中國(01.AI,智譜AI),形成了北美、歐洲、亞洲三足鼎立的競爭格局。

融資階段從早期到成長期并重,戰(zhàn)略投資占據(jù)主導(dǎo)地位。小語言模型的融資市場不僅限于早期投資(種子/A輪),B輪、C輪乃至D輪的成熟期項目同樣活躍。這說明一批領(lǐng)先的初創(chuàng)公司已經(jīng)跑通了技術(shù)或初步商業(yè)模式,獲得了持續(xù)的大額資金支持以加速擴張。此外,小語言模型的投資方名單中出現(xiàn)了阿里云、小米等產(chǎn)業(yè)資本,以及a16z、Lightspeed等頂級風(fēng)投。產(chǎn)業(yè)資本的深度參與,意味著小語言模型的發(fā)展與各大科技公司的云服務(wù)、硬件生態(tài)等核心戰(zhàn)略緊密綁定。

圖表14全球重點小語言模型融資情況


信息來源:融中咨詢


安全與濫用風(fēng)險:AIBussiness研究指出,由于SLMs的代碼是開源的,數(shù)據(jù)盜竊和隱私問題等安全風(fēng)險會更加嚴重。浙江大學(xué)區(qū)塊鏈與數(shù)據(jù)安全全國重點實驗室發(fā)現(xiàn),近50%的SLMs在遭受越獄攻擊時顯示出高脆弱性,開發(fā)人員需從開發(fā)早期階段優(yōu)先考慮安全設(shè)計原則。

模型泛化能力風(fēng)險:SLMs雖然在特定任務(wù)中表現(xiàn)優(yōu)秀,但在應(yīng)對更廣泛、多變的場景時,如復(fù)雜推理、跨領(lǐng)域知識整合上,往往難以維持高效表現(xiàn)。相較于LLMs,SLMs可能更容易受到數(shù)據(jù)偏見的影響,缺乏足夠的適應(yīng)能力。盡管SLMs在特定場景表現(xiàn)良好,但在復(fù)雜推理、代碼生成等任務(wù)上仍難以匹敵大規(guī)模LLMs。

數(shù)據(jù)質(zhì)量風(fēng)險:如果訓(xùn)練數(shù)據(jù)中存在偏差或不平衡,小模型可能會在特定場景下表現(xiàn)出較低的泛化能力,甚至產(chǎn)生不準確的預(yù)測或生成內(nèi)容。因此,要確保訓(xùn)練數(shù)據(jù)的質(zhì)量。一方面,在數(shù)據(jù)清洗時要進行去噪處理,通過去除重復(fù)項、糾正標注錯誤等方式來提高數(shù)據(jù)質(zhì)量。另一方面,要結(jié)合外部的知識庫,彌補數(shù)據(jù)中存在的不足,增強模型的泛化能力。

小模型局限性風(fēng)險:小語言模型通常設(shè)計為專門處理特定領(lǐng)域或任務(wù),因此其知識庫相對有限,難以應(yīng)對跨領(lǐng)域的復(fù)雜問題。為了解決小模型使用局限性的問題,一是模塊化設(shè)計,將小模型設(shè)計為可擴展的模塊系統(tǒng),可以通過引入專門的插件或外部知識庫,擴充其對不同主題的處理能力。二是多模型集成,通過將多個小模型進行集成,形成一個組合型的系統(tǒng),充分發(fā)揮每個模型在特定領(lǐng)域的優(yōu)勢。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
樓市可能要下猛藥了

樓市可能要下猛藥了

金融界
2026-01-05 11:46:04
29歲女生確診尿毒癥晚期,再也無法小便,提醒:一定要遠離飲料、外賣,改掉熬夜、憋尿的壞習(xí)慣

29歲女生確診尿毒癥晚期,再也無法小便,提醒:一定要遠離飲料、外賣,改掉熬夜、憋尿的壞習(xí)慣

觀威海
2026-01-04 19:02:04
廟小妖風(fēng)大!有網(wǎng)友稱我以為工作中“收到”很卑微了,結(jié)果被教育

廟小妖風(fēng)大!有網(wǎng)友稱我以為工作中“收到”很卑微了,結(jié)果被教育

火山詩話
2026-01-05 13:48:31
98年返鄉(xiāng)途中,我把軟臥讓給抱孩子的大姐,她臨下車時遞來一個信封

98年返鄉(xiāng)途中,我把軟臥讓給抱孩子的大姐,她臨下車時遞來一個信封

城事錄主
2026-01-01 05:00:03
演都不演了!田樸珺承認嫌王石煩,她給所有的老夫少妻都提了個醒

演都不演了!田樸珺承認嫌王石煩,她給所有的老夫少妻都提了個醒

涵豆說娛
2026-01-04 18:40:14
一職工長期失聯(lián)、無法履職,鄭州一事業(yè)單位發(fā)解聘公告

一職工長期失聯(lián)、無法履職,鄭州一事業(yè)單位發(fā)解聘公告

大象新聞
2026-01-05 11:13:03
前途無量!1米85日本留洋中鋒入選國少隊:已獲歐洲球探關(guān)注

前途無量!1米85日本留洋中鋒入選國少隊:已獲歐洲球探關(guān)注

邱澤云
2026-01-05 17:00:46
黃宗澤26年終奪雙料視帝,淚灑頒獎臺憶往昔

黃宗澤26年終奪雙料視帝,淚灑頒獎臺憶往昔

小兔子的快樂
2026-01-05 09:16:17
超重磅!2026年26只潛力股出爐

超重磅!2026年26只潛力股出爐

數(shù)據(jù)寶
2026-01-05 07:38:08
剛剛,暴漲超1600點!全線大漲,席卷亞太!

剛剛,暴漲超1600點!全線大漲,席卷亞太!

券商中國
2026-01-05 15:43:45
省管干部任前公示公告,涉及19人

省管干部任前公示公告,涉及19人

加油大理
2026-01-05 10:33:39
中國財政供養(yǎng)人員達6846萬?結(jié)構(gòu)失衡才是財政壓力的核心

中國財政供養(yǎng)人員達6846萬?結(jié)構(gòu)失衡才是財政壓力的核心

流蘇晚晴
2025-12-04 19:27:08
時也命也,馬杜羅距離安全僅差數(shù)秒,關(guān)上鋼門后,美軍將被全殲?

時也命也,馬杜羅距離安全僅差數(shù)秒,關(guān)上鋼門后,美軍將被全殲?

王鶔吃吃喝喝
2026-01-04 23:24:52
萬科2000名跟投員工討要跟投資金

萬科2000名跟投員工討要跟投資金

地產(chǎn)微資訊
2026-01-04 11:43:17
張水華辭職3天,田協(xié)除名真相大白,好友曝下步計劃,野心藏不住

張水華辭職3天,田協(xié)除名真相大白,好友曝下步計劃,野心藏不住

深析古今
2026-01-05 14:12:19
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
東航:堅決擁護黨中央決定

東航:堅決擁護黨中央決定

新京報政事兒
2026-01-05 13:19:25
王祖貽在合肥逝世,享年99歲

王祖貽在合肥逝世,享年99歲

極目新聞
2026-01-04 22:24:40
你身邊有細思極恐的人嗎?網(wǎng)友:老天爺,大晚上給我看害怕了

你身邊有細思極恐的人嗎?網(wǎng)友:老天爺,大晚上給我看害怕了

解讀熱點事件
2026-01-05 00:05:06
A股2026年開門紅?楊德龍:除科技板塊外,更多板塊有望在 2026 年開始輪番上漲

A股2026年開門紅?楊德龍:除科技板塊外,更多板塊有望在 2026 年開始輪番上漲

和訊網(wǎng)
2026-01-05 16:05:05
2026-01-05 19:04:49
融資中國 incentive-icons
融資中國
股權(quán)投資與產(chǎn)業(yè)投資媒體平臺
7145文章數(shù) 21307關(guān)注度
往期回顧 全部

科技要聞

4100家科技企業(yè)集結(jié)賭城,CES揭開AI新戰(zhàn)場

頭條要聞

美對委動手致歐盟立場分裂 兩元首先后發(fā)文內(nèi)容南轅北轍

頭條要聞

美對委動手致歐盟立場分裂 兩元首先后發(fā)文內(nèi)容南轅北轍

體育要聞

41歲詹皇26+10+6又迎里程碑 湖媒贊GOAT

娛樂要聞

黃宗澤奪雙料視帝,淚灑頒獎臺憶往昔

財經(jīng)要聞

李迅雷:擴內(nèi)需要把重心從"投"轉(zhuǎn)向"消"

汽車要聞

海獅06EV冬季續(xù)航挑戰(zhàn) "電"這事比亞迪絕對玩明白了

態(tài)度原創(chuàng)

數(shù)碼
教育
房產(chǎn)
公開課
軍事航空

數(shù)碼要聞

追風(fēng)者公布Matrix系列機箱,全系內(nèi)置LED織物點陣屏幕

教育要聞

到底需不需要讓學(xué)生怕你,我一個視頻,給你說透!

房產(chǎn)要聞

再次登頂海南樓市!超越阿那亞的,只有阿那亞!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

馬杜羅預(yù)計5日在紐約"首次出庭"

無障礙瀏覽 進入關(guān)懷版