非Transformer架構(gòu)新突破，液態(tài)神經(jīng)網(wǎng)絡(luò)推理小模型只用900M內(nèi)存

2026-01-21 18:08:27　來源: 機器之心Pro

廣西舉報

分享至

編輯｜冷貓

谷歌 2017 年提出的 Transformer 架構(gòu)事實上已經(jīng)基本壟斷了大模型。

不采用 Transformer 架構(gòu)的大模型已經(jīng)是少之又少，而采用非 Transformer 架構(gòu)，還能與主流第一梯隊大模型扳手腕的，更是鳳毛麟角。

不知道大家是否還有印象，當(dāng)年有一個嘗試給大模型裝上「蟲腦」的初創(chuàng)公司，他們的研究人員受到秀麗隱桿線蟲的神經(jīng)結(jié)構(gòu)啟發(fā)，研發(fā)出一種新型的靈活神經(jīng)網(wǎng)絡(luò)，也被稱為液態(tài)神經(jīng)網(wǎng)絡(luò)。

這是一個連續(xù)時間模型，由多個簡單的動態(tài)系統(tǒng)組成，這些系統(tǒng)通過非線性門相互調(diào)節(jié)。這種網(wǎng)絡(luò)的特點是時間常數(shù)可變，輸出通過求解微分方程得到。它在穩(wěn)定性、表達(dá)能力和時間序列預(yù)測方面都優(yōu)于傳統(tǒng)模型。

除此以外，液態(tài)神經(jīng)網(wǎng)絡(luò)的另一個特點是規(guī)模小得多，在 2024 年該架構(gòu)就實現(xiàn)了 1.3B 大小的模型部署，但彼時尚未能與主流大模型一拼高下。

提出液態(tài)神經(jīng)網(wǎng)絡(luò)架構(gòu)，并且做出 Liquid Foundation Models（LFM）大模型的，是由 MIT 計算機科學(xué)和人工智能實驗室 CSAIL 孵化，成立于 2023 年 3 月的初創(chuàng)公司 Liquid AI。

就在剛剛，Liquid AI 又一次在 LFM 模型上放大招。他們正式發(fā)布并開源了 LFM2.5-1.2B-Thinking，一款可完全在端側(cè)運行的推理模型。

Liquid AI 聲稱，該模型專門為簡潔推理而訓(xùn)練；在生成最終答案前，會先生成內(nèi)部思考軌跡；在端側(cè)級別的低延遲條件下，實現(xiàn)系統(tǒng)化的問題求解；在工具使用、數(shù)學(xué)推理和指令遵循方面表現(xiàn)尤為出色。

該模型在手機上僅需900 MB 內(nèi)存即可運行，同時在同等規(guī)模模型中實現(xiàn)了最快的推理速度和最佳的質(zhì)量表現(xiàn)。兩年前還必須依賴數(shù)據(jù)中心才能完成的能力，如今已經(jīng)可以在你的口袋里離線運行。

Leap 開源鏈接：https://leap.liquid.ai/models
HuggingFace 鏈接：https://huggingface.co/LiquidAI/LFM2.5-1.2B-Thinking

優(yōu)于 Transformer 的性能

與 Liquid AI 之前的模型 LFM2.5-1.2B-Instruct 相比，LFM2.5-1.2B-Thinking 在三項能力上實現(xiàn)了顯著提升：

數(shù)學(xué)推理：在 MATH-500 上從 63 提升至 88
指令遵循：在 Multi-IF 上從 61 提升至 69
工具使用：在 BFCLv3 上從 49 提升至 57

在大多數(shù)推理基準(zhǔn)測試中，LFM2.5-1.2B-Thinking 的表現(xiàn)已與甚至超過 Qwen3-1.7B，盡管其參數(shù)量少了約 40%。

同時，該模型在質(zhì)量與測試時計算效率之間取得了良好平衡：與 Qwen3-1.7B（思考模式）相比，它在使用更少輸出 token 的情況下，依然提供了更高的整體性能。

在推理階段，這一性能差距進一步拉大：LFM2.5-1.2B-Thinking 在推理速度和內(nèi)存效率兩方面，都優(yōu)于純 Transformer 模型（如 Qwen3-1.7B）和混合架構(gòu)模型（如 Granite-4.0-H-1B）。

Liquid AI 表示，LFM2.5-1.2B-Thinking 在智能體式（agentic）任務(wù)和高推理強度任務(wù)（例如工具使用、數(shù)學(xué)、編程）中表現(xiàn)尤為突出。當(dāng)模型需要規(guī)劃一系列工具調(diào)用、驗證中間結(jié)果并動態(tài)調(diào)整解題策略時，其生成的推理軌跡能夠發(fā)揮實際價值。而在對話交互和創(chuàng)意寫作等場景下，則更推薦使用 LFM2.5-1.2B-Instruct。

訓(xùn)練細(xì)節(jié)

要構(gòu)建能力強的小型推理模型，關(guān)鍵在于：在知識容量有限的前提下，通過多步推理來彌補能力，同時又要保持答案簡潔，以滿足端側(cè)低延遲部署的需求。

此前在 LFM-1B-Math 上的實驗表明，在中期訓(xùn)練階段引入推理軌跡，有助于模型內(nèi)化「先推理，再作答」的模式。隨后，基于合成推理軌跡進行的監(jiān)督微調(diào)（SFT），進一步讓模型能夠穩(wěn)定地產(chǎn)生思維鏈，而無需依賴特定格式的獎勵設(shè)計。

然而，SFT 并不能解決推理模型中的一個常見問題：模型可能陷入重復(fù)文本模式，遲遲無法得出結(jié)論。這種行為通常被稱為「doom looping」（死循環(huán)式生成）。為此，Liquid AI 采用了一種相對直接的緩解方法：

在偏好對齊階段，基于 SFT 模型生成了 5 個溫度采樣候選和 1 個貪婪解碼候選；當(dāng)不存在循環(huán)時，選擇由 LLM 評判得分最高的作為正樣本、得分最低的作為負(fù)樣本；一旦出現(xiàn)循環(huán)生成，則無論評判得分如何，直接將出現(xiàn)循環(huán)的候選作為負(fù)樣本。
在 RLVR 階段，進一步在訓(xùn)練早期引入了基于 n-gram 的重復(fù)懲罰，以抑制循環(huán)生成行為。

通過這些策略，模型在保持推理能力的同時，顯著降低了陷入無效循環(huán)的風(fēng)險。

這一方法在一個具有代表性提示詞的數(shù)據(jù)集上，將死循環(huán)生成的比例從 15.74%（中期訓(xùn)練階段）顯著降低到了 0.36%（RLVR 階段），效果非常直接且穩(wěn)定。

Liquid AI 的 RL 訓(xùn)練流水線核心采用的是無 critic、類 GRPO 方法。整體實現(xiàn)是 reference-free 的，并結(jié)合了多項訓(xùn)練技巧，包括：

非對稱比例裁剪（asymmetric ratio clipping）
對零方差提示組的動態(tài)過濾
超長樣本掩碼（overlong-sample masking）
不進行優(yōu)勢歸一化（no advantage normalization）
截斷的重要性采樣（truncated importance sampling）

RL 方法的簡化示意圖：最終發(fā)布的 checkpoint 是一個合并模型，其「家族樹」中包含 25 個不同的子 checkpoint。

Liquid AI 采用了一種高度并行的Curriculum RL 訓(xùn)練框架，先以指令跟隨的 RLVR 作為基礎(chǔ)起點，再分叉出面向推理、數(shù)學(xué)、工具使用等不同領(lǐng)域的專項 checkpoint。

這種并行結(jié)構(gòu)不同于傳統(tǒng)的「單模型、多任務(wù)同時訓(xùn)練」方式，往往會引發(fā)能力相互干擾。

Curriculum RL 提供了更精細(xì)的控制粒度：每個領(lǐng)域的模型都可以獨立優(yōu)化，擁有各自的獎勵設(shè)計、超參數(shù)和評估標(biāo)準(zhǔn)。隨后，我們在不同階段進行迭代式模型合并，生成在多種能力之間更均衡的新 checkpoint。

實踐表明，模型合并在保留整體性能的同時，能夠有效吸收專項能力提升，是一條可行且可擴展的通用 RLVR 訓(xùn)練路徑。

此外，Liquid AI 正在全力拓展 LFM 系列模型的生態(tài)系統(tǒng)和合作伙伴。

LFM2.5-1.2B-Thinking 實現(xiàn)了開箱即用支持，兼容最流行的推理框架，包括 llama.cpp、MLX、vLLM 和 ONNX Runtime。所有框架均支持 CPU 和 GPU 加速，覆蓋 Apple、AMD、Qualcomm 和 Nvidia 等硬件。

為了確保 LFM2.5 系列能夠在各種場景下高效運行，Liquid AI 正在快速擴展軟硬件生態(tài)系統(tǒng)，并歡迎 Qualcomm Technologies, Inc.、Ollama、FastFlowLM 和 Cactus Compute 作為新的合作伙伴加入。

LFM2.5-1.2B-Thinking 在不同硬件設(shè)備上的長上下文推理表現(xiàn)。

LFM2.5-1.2B-Thinking 可能只是個起點，但它已經(jīng)證明了一件事 ——Transformer 并非唯一解，小而強的端側(cè)推理模型或許有更優(yōu)解。

更重要的是，運行推理模型的門檻越來越低，讓更多設(shè)備激發(fā) AI 潛能，不論如何，都是一件美事。

參考鏈接：https://www.liquid.ai/blog/lfm2-5-1-2b-thinking-on-device-reasoning-under-1gb#training-recipe

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.