国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

非Transformer架構(gòu)新突破,液態(tài)神經(jīng)網(wǎng)絡(luò)推理小模型只用900M內(nèi)存

0
分享至

編輯|冷貓

谷歌 2017 年提出的 Transformer 架構(gòu)事實上已經(jīng)基本壟斷了大模型。

不采用 Transformer 架構(gòu)的大模型已經(jīng)是少之又少,而采用非 Transformer 架構(gòu),還能與主流第一梯隊大模型扳手腕的,更是鳳毛麟角。

不知道大家是否還有印象,當(dāng)年有一個嘗試給大模型裝上「蟲腦」的初創(chuàng)公司,他們的研究人員受到秀麗隱桿線蟲的神經(jīng)結(jié)構(gòu)啟發(fā),研發(fā)出一種新型的靈活神經(jīng)網(wǎng)絡(luò),也被稱為液態(tài)神經(jīng)網(wǎng)絡(luò)。

這是一個連續(xù)時間模型,由多個簡單的動態(tài)系統(tǒng)組成,這些系統(tǒng)通過非線性門相互調(diào)節(jié)。這種網(wǎng)絡(luò)的特點是時間常數(shù)可變,輸出通過求解微分方程得到。它在穩(wěn)定性、表達(dá)能力和時間序列預(yù)測方面都優(yōu)于傳統(tǒng)模型。

除此以外,液態(tài)神經(jīng)網(wǎng)絡(luò)的另一個特點是規(guī)模小得多,在 2024 年該架構(gòu)就實現(xiàn)了 1.3B 大小的模型部署,但彼時尚未能與主流大模型一拼高下。

提出液態(tài)神經(jīng)網(wǎng)絡(luò)架構(gòu),并且做出 Liquid Foundation Models(LFM)大模型的,是由 MIT 計算機科學(xué)和人工智能實驗室 CSAIL 孵化,成立于 2023 年 3 月的初創(chuàng)公司 Liquid AI。

就在剛剛,Liquid AI 又一次在 LFM 模型上放大招。他們正式發(fā)布并開源了 LFM2.5-1.2B-Thinking,一款可完全在端側(cè)運行的推理模型。



Liquid AI 聲稱,該模型專門為簡潔推理而訓(xùn)練;在生成最終答案前,會先生成內(nèi)部思考軌跡;在端側(cè)級別的低延遲條件下,實現(xiàn)系統(tǒng)化的問題求解;在工具使用、數(shù)學(xué)推理和指令遵循方面表現(xiàn)尤為出色。

該模型在手機上僅需900 MB 內(nèi)存即可運行,同時在同等規(guī)模模型中實現(xiàn)了最快的推理速度和最佳的質(zhì)量表現(xiàn)。兩年前還必須依賴數(shù)據(jù)中心才能完成的能力,如今已經(jīng)可以在你的口袋里離線運行。



  • Leap 開源鏈接:https://leap.liquid.ai/models
  • HuggingFace 鏈接:https://huggingface.co/LiquidAI/LFM2.5-1.2B-Thinking

優(yōu)于 Transformer 的性能

與 Liquid AI 之前的模型 LFM2.5-1.2B-Instruct 相比,LFM2.5-1.2B-Thinking 在三項能力上實現(xiàn)了顯著提升:

  • 數(shù)學(xué)推理:在 MATH-500 上從 63 提升至 88
  • 指令遵循:在 Multi-IF 上從 61 提升至 69
  • 工具使用:在 BFCLv3 上從 49 提升至 57

在大多數(shù)推理基準(zhǔn)測試中,LFM2.5-1.2B-Thinking 的表現(xiàn)已與甚至超過 Qwen3-1.7B,盡管其參數(shù)量少了 約 40%。





同時,該模型在質(zhì)量與測試時計算效率之間取得了良好平衡:與 Qwen3-1.7B(思考模式) 相比,它在使用更少輸出 token 的情況下,依然提供了更高的整體性能。



在推理階段,這一性能差距進一步拉大:LFM2.5-1.2B-Thinking 在推理速度和內(nèi)存效率兩方面,都優(yōu)于純 Transformer 模型(如 Qwen3-1.7B)和混合架構(gòu)模型(如 Granite-4.0-H-1B)。



Liquid AI 表示,LFM2.5-1.2B-Thinking 在 智能體式(agentic)任務(wù)和高推理強度任務(wù)(例如工具使用、數(shù)學(xué)、編程)中表現(xiàn)尤為突出。當(dāng)模型需要規(guī)劃一系列工具調(diào)用、驗證中間結(jié)果并動態(tài)調(diào)整解題策略時,其生成的推理軌跡能夠發(fā)揮實際價值。而在對話交互和創(chuàng)意寫作等場景下,則更推薦使用 LFM2.5-1.2B-Instruct。

訓(xùn)練細(xì)節(jié)

要構(gòu)建能力強的小型推理模型,關(guān)鍵在于:在知識容量有限的前提下,通過多步推理來彌補能力,同時又要保持答案簡潔,以滿足端側(cè)低延遲部署的需求。

此前在 LFM-1B-Math 上的實驗表明,在中期訓(xùn)練階段引入推理軌跡,有助于模型內(nèi)化「先推理,再作答」的模式。隨后,基于合成推理軌跡進行的監(jiān)督微調(diào)(SFT),進一步讓模型能夠穩(wěn)定地產(chǎn)生思維鏈,而無需依賴特定格式的獎勵設(shè)計。

然而,SFT 并不能解決推理模型中的一個常見問題:模型可能陷入重復(fù)文本模式,遲遲無法得出結(jié)論。這種行為通常被稱為「doom looping」(死循環(huán)式生成)。為此,Liquid AI 采用了一種相對直接的緩解方法:

  • 在偏好對齊階段,基于 SFT 模型生成了 5 個溫度采樣候選和 1 個貪婪解碼候選;當(dāng)不存在循環(huán)時,選擇由 LLM 評判得分最高的作為正樣本、得分最低的作為負(fù)樣本;一旦出現(xiàn)循環(huán)生成,則無論評判得分如何,直接將出現(xiàn)循環(huán)的候選作為負(fù)樣本。
  • 在 RLVR 階段,進一步在訓(xùn)練早期引入了基于 n-gram 的重復(fù)懲罰,以抑制循環(huán)生成行為。

通過這些策略,模型在保持推理能力的同時,顯著降低了陷入無效循環(huán)的風(fēng)險。



這一方法在一個具有代表性提示詞的數(shù)據(jù)集上,將死循環(huán)生成的比例從 15.74%(中期訓(xùn)練階段) 顯著降低到了 0.36%(RLVR 階段),效果非常直接且穩(wěn)定。

Liquid AI 的 RL 訓(xùn)練流水線核心采用的是無 critic、類 GRPO 方法。整體實現(xiàn)是 reference-free 的,并結(jié)合了多項訓(xùn)練技巧,包括:

  • 非對稱比例裁剪(asymmetric ratio clipping)
  • 對零方差提示組的動態(tài)過濾
  • 超長樣本掩碼(overlong-sample masking)
  • 不進行優(yōu)勢歸一化(no advantage normalization)
  • 截斷的重要性采樣(truncated importance sampling)



RL 方法的簡化示意圖:最終發(fā)布的 checkpoint 是一個合并模型,其「家族樹」中包含 25 個不同的子 checkpoint。

Liquid AI 采用了一種高度并行的Curriculum RL 訓(xùn)練框架,先以指令跟隨的 RLVR 作為基礎(chǔ)起點,再分叉出面向推理、數(shù)學(xué)、工具使用等不同領(lǐng)域的專項 checkpoint。

這種并行結(jié)構(gòu)不同于傳統(tǒng)的「單模型、多任務(wù)同時訓(xùn)練」方式,往往會引發(fā)能力相互干擾。

Curriculum RL 提供了更精細(xì)的控制粒度:每個領(lǐng)域的模型都可以獨立優(yōu)化,擁有各自的獎勵設(shè)計、超參數(shù)和評估標(biāo)準(zhǔn)。隨后,我們在不同階段進行迭代式模型合并,生成在多種能力之間更均衡的新 checkpoint。

實踐表明,模型合并在保留整體性能的同時,能夠有效吸收專項能力提升,是一條可行且可擴展的通用 RLVR 訓(xùn)練路徑。

此外,Liquid AI 正在全力拓展 LFM 系列模型的生態(tài)系統(tǒng)和合作伙伴。

LFM2.5-1.2B-Thinking 實現(xiàn)了開箱即用支持,兼容最流行的推理框架,包括 llama.cpp、MLX、vLLM 和 ONNX Runtime。所有框架均支持 CPU 和 GPU 加速,覆蓋 Apple、AMD、Qualcomm 和 Nvidia 等硬件。

為了確保 LFM2.5 系列 能夠在各種場景下高效運行,Liquid AI 正在快速擴展軟硬件生態(tài)系統(tǒng),并歡迎 Qualcomm Technologies, Inc.、Ollama、FastFlowLM 和 Cactus Compute 作為新的合作伙伴加入。



LFM2.5-1.2B-Thinking 在不同硬件設(shè)備上的長上下文推理表現(xiàn)。

LFM2.5-1.2B-Thinking 可能只是個起點,但它已經(jīng)證明了一件事 ——Transformer 并非唯一解,小而強的端側(cè)推理模型或許有更優(yōu)解。

更重要的是,運行推理模型的門檻越來越低,讓更多設(shè)備激發(fā) AI 潛能,不論如何,都是一件美事。

參考鏈接:https://www.liquid.ai/blog/lfm2-5-1-2b-thinking-on-device-reasoning-under-1gb#training-recipe

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
韓媒:長期輕視中國隊,現(xiàn)在我們還能自信地說比中國足球強嗎?

韓媒:長期輕視中國隊,現(xiàn)在我們還能自信地說比中國足球強嗎?

邱澤云
2026-01-21 17:24:18
中國躲無可躲,回應(yīng)特朗普4月訪華

中國躲無可躲,回應(yīng)特朗普4月訪華

戎評
2026-01-21 11:30:33
國乒為什么全力培養(yǎng)王楚欽?原來是馬龍樊振東,給劉國梁一個錯覺

國乒為什么全力培養(yǎng)王楚欽?原來是馬龍樊振東,給劉國梁一個錯覺

悅君兮君不知
2026-01-20 20:54:40
美軍在加勒比海再次 強扣一艘油輪

美軍在加勒比海再次 強扣一艘油輪

每日經(jīng)濟新聞
2026-01-21 08:26:50
大齡剩女崩潰的瞬間是什么時候?網(wǎng)友:多年的舔狗突然結(jié)婚

大齡剩女崩潰的瞬間是什么時候?網(wǎng)友:多年的舔狗突然結(jié)婚

夜深愛雜談
2026-01-20 18:56:34
《太平年》定檔央一!但凡白宇拉胯一點,都壓不住這群王炸配角

《太平年》定檔央一!但凡白宇拉胯一點,都壓不住這群王炸配角

往史過眼云煙
2026-01-21 19:29:32
國足3個小組第一全拿下!越南門將一席話,給日本隊上足強度

國足3個小組第一全拿下!越南門將一席話,給日本隊上足強度

十點街球體育
2026-01-21 12:55:03
“每次在歐洲吃飯都感覺自己像來上供的?!?>
    </a>
        <h3>
      <a href=“每次在歐洲吃飯都感覺自己像來上供的?!?/a> 窮游網(wǎng)
2026-01-20 11:11:24
交易所:調(diào)整漲跌停板幅度

交易所:調(diào)整漲跌停板幅度

中國基金報
2026-01-20 21:44:23
4線飄紅!槍手將帥不應(yīng)該只盯著英超 歐洲4冠王才是終極目標(biāo)

4線飄紅!槍手將帥不應(yīng)該只盯著英超 歐洲4冠王才是終極目標(biāo)

雪狼侃體育
2026-01-21 20:01:17
我是空姐,丈夫總疑心我出軌。直到他在我飛行箱里找到癌癥確診書

我是空姐,丈夫總疑心我出軌。直到他在我飛行箱里找到癌癥確診書

真實人物采訪
2026-01-20 18:00:03
俄烏鋒線最新動態(tài):前線殊死血戰(zhàn),后方猛烈對轟

俄烏鋒線最新動態(tài):前線殊死血戰(zhàn),后方猛烈對轟

史政先鋒
2026-01-20 20:17:19
不查不知道一查嚇一跳,坐擁北京60畝馬場的于謙,私下到底有多壕

不查不知道一查嚇一跳,坐擁北京60畝馬場的于謙,私下到底有多壕

小熊侃史
2026-01-20 07:40:05
2026年1月開始,酒駕新規(guī)將正式實施,交警嚴(yán)查“隔夜酒駕”

2026年1月開始,酒駕新規(guī)將正式實施,交警嚴(yán)查“隔夜酒駕”

老特有話說
2026-01-21 03:25:03
俞敏洪開辦“退休俱樂部”,針對50到75歲人群,線下課體驗價19.9元

俞敏洪開辦“退休俱樂部”,針對50到75歲人群,線下課體驗價19.9元

紅星新聞
2026-01-21 18:02:27
貴州省銅仁市第二人民醫(yī)院黨委書記熊蓮主動投案!

貴州省銅仁市第二人民醫(yī)院黨委書記熊蓮主動投案!

瀟湘晨報
2026-01-21 15:37:11
日媒:中國實現(xiàn)了日本也未達(dá)到的零封晉級,前馬競青訓(xùn)李昊值得警惕

日媒:中國實現(xiàn)了日本也未達(dá)到的零封晉級,前馬競青訓(xùn)李昊值得警惕

懂球帝
2026-01-21 11:43:36
婆婆去世,老公失聯(lián),王艷做夢也沒想到,如今繼子竟成自己的救贖

婆婆去世,老公失聯(lián),王艷做夢也沒想到,如今繼子竟成自己的救贖

冷紫葉
2026-01-21 13:24:02
視頻女博主怒撕嫣然醫(yī)院房東!完全就是謊話連篇,你真的是找抽

視頻女博主怒撕嫣然醫(yī)院房東!完全就是謊話連篇,你真的是找抽

小徐講八卦
2026-01-20 13:28:43
中國駐日武官王慶簡:大校軍銜,每天定時開窗向日本傳遞絕密情報

中國駐日武官王慶簡:大校軍銜,每天定時開窗向日本傳遞絕密情報

萬年歷史老號
2026-01-20 05:40:03
2026-01-21 20:36:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12162文章數(shù) 142547關(guān)注度
往期回顧 全部

科技要聞

給機器人做仿真訓(xùn)練 這家創(chuàng)企年營收破億

頭條要聞

32歲程序員周末暈倒后猝死 搶救期間還被拉入工作群

頭條要聞

32歲程序員周末暈倒后猝死 搶救期間還被拉入工作群

體育要聞

只會防守反擊?不好意思,我們要踢決賽了

娛樂要聞

田亮一家新年全家福!森碟變清純少女

財經(jīng)要聞

丹麥打響第一槍 歐洲用資本保衛(wèi)格陵蘭島

汽車要聞

2026款上汽大眾朗逸正式上市 售價12.09萬起

態(tài)度原創(chuàng)

藝術(shù)
教育
游戲
親子
手機

藝術(shù)要聞

一百多年前的中國,太雄偉震撼了!

教育要聞

聚焦“26屆廣州高考復(fù)讀學(xué)校哪家好”:這三所學(xué)校值得考慮

粉絲:比GTA6更好?《劍星2》最新概念圖匯總

親子要聞

智商如奶油一般化開了

手機要聞

給蘋果iPhone 17 Pro Max穿金甲,京東京造推出Au99.99黃金手機殼

無障礙瀏覽 進入關(guān)懷版