最卷春節(jié)檔，改寫模型“地板”的只有 TA

2026-02-24 18:30:58　來源: InfoQ

北京舉報

分享至

作者 | 凌敏

電影圈或許也沒想到，搶走 2026 年春節(jié)檔風頭的，竟然是 AI。

從年前到年后，全球 AI 領域迎來了一波密集的發(fā)布潮，國內外科技巨頭與創(chuàng)新企業(yè)爭相“交卷”，火藥味十足。從 Seedance 2.0 到 GLM-5，從 Claude Sonnet 4.6 到 Gemini 3.1 Pro，諸神混戰(zhàn)，商量好了似的一起致敬去年 DeepSeek 在春節(jié)檔的一戰(zhàn)成名。

值得玩味的是，這一輪諸神之戰(zhàn)，大家更多關注的是如何刷新“天花板”，卻很少有人在改變“地板”。換句話說，模型越來越強，但能觸達這些能力的人，依然有限——最先進的模型仍然掌握在極少數(shù)公司手中，再強的突破，也難以轉化為更廣泛的創(chuàng)新紅利。

在這場春節(jié)檔混戰(zhàn)中，螞蟻集團也發(fā)布了三款模型：百靈家族旗艦即時模型 Ling-2.5-1T、混合線性架構的思考模型 Ring-2.5-1T，以及全模態(tài)大模型 Ming-flash-omni-2.0。前兩款模型均基于 Ling 2.5 架構，該架構在 Ling 2.0 基礎上，采用混合線性注意力機制，大幅提升了長文本處理效率。其中，Ling-2.5-1T 在 token 效率、偏好對齊等維度全面升級；Ring-2.5-1T 主打復雜推理，同時實現(xiàn) IMO 2025 和 CMO 2025 的金牌水平。Ming-flash-omni-2.0 則基于 Ling-2.0 架構，在視覺理解、語音交互、圖像編輯上均實現(xiàn)大幅提升。

相比“更大更強”的發(fā)布，這次發(fā)布的特殊性在于，開源世界終于又迎來了一款萬億參數(shù)推理模型。

在當前以 OpenAI、Google 為代表的閉源大模型體系主導下，萬億級參數(shù)模型長期被視為超級實驗室的專屬資產。要打造一個萬億參數(shù)的模型，必須同時跨越算力、數(shù)據(jù)、工程三道門檻：需要數(shù)萬張高端 GPU 組成的集群，并且這些 GPU 能夠協(xié)同工作，還需要海量、高質量、多樣化的數(shù)據(jù)。因此，目前業(yè)內開源的萬億級模型寥寥，專注于深度思考的萬億級推理模型更是稀缺。

這也是 Ring-2.5-1T 這款開源模型能夠在社區(qū)引起廣泛討論的根因之一。最重要的是，螞蟻愿意在萬億參數(shù)這個量級上，持續(xù)進行底層的架構創(chuàng)新。這一點尤為關鍵，意味著團隊需要具備迎難而上、勇于探索技術邊界的決心和能力。比如這次在架構上，百靈大模型創(chuàng)新引入了混合線性注意力架構，大幅提升推理效率，同時保持訓練系統(tǒng)的開放開源，與社區(qū)攜手攻堅這一工程難題。

1 萬億模型的意義，不只在于參數(shù)本身

當模型規(guī)?？邕^千億之后，單純依賴參數(shù)堆疊，已經(jīng)很難帶來線性的能力提升，反而會帶來訓練成本飆升、推理效率下降等一系列現(xiàn)實問題。行業(yè)對此已經(jīng)形成了效率優(yōu)先的共識，要么圍繞注意力機制進行優(yōu)化，要么針對 KV Cache 進行壓縮，要么在數(shù)據(jù)質量和訓練策略上挖掘突破口……本質上，大家再次來到同一起跑線，尋找新的 Scaling Law。

這也是為什么，這次 Ling 2.5 在架構上的升級能夠成為社區(qū)討論的焦點。

去年 10 月，螞蟻百靈團隊在一份長達 58 頁的硬核技術報告《Ling 2.0 Technical Report》中，詳細介紹了 Ling 2.0 架構。Ling 2.0 采用了統(tǒng)一的 MoE 基礎架構，總專家數(shù)達 256 個，每次前向傳播僅激活 8 個專家和 1 個共享專家，整體激活率約為 3.5%。

Ling 2.5 在 Ling 2.0 架構基礎上，引入了混合線性注意力機制，對傳統(tǒng)全注意力路徑進行重構。具體而言，百靈團隊通過增量訓練方式，將原有 GQA（Grouped Query Attention）升級為 1:7 的 MLA（Multi-head Latent Attention）與 Lightning Linear Attention 組合結構。一部分注意力層被替換為線性注意力路徑，以降低長序列計算復雜度；其余層則通過近似轉換為 MLA，在壓縮 KV Cache 的同時實現(xiàn)更好的表達能力。在實現(xiàn)層面，還對 QK Norm、Partial RoPE 等關鍵組件進行了針對性適配，以增強 Ling 2.5 架構在混合注意力架構下的表達能力。

這一設計其實相當務實，同時兼顧了長序列處理能力與低成本部署的現(xiàn)實要求。用線性注意力將傳統(tǒng)自注意力的時間復雜度從 ?O(n2)? 降低至 ?O(n)?，提升模型在長上下文場景中的效率；通過對 KV Cache 的針對性優(yōu)化，有效降低推理階段高昂的顯存與帶寬開銷。

在訓練階段，Ling-2.5-1T-base 專門基于約 9T 高質量語料進行了持續(xù)預訓練，重點強化了知識覆蓋、智能體多輪交互和長程執(zhí)行能力。在此基礎上，借助混合線性注意力在長序列上的計算效率，將訓練上下文窗口擴展至 256K tokens，并通過 YaRN（Yet another RoPE extensioN）實現(xiàn)最高 1M tokens 的穩(wěn)定外推。

對于混合線性注意力在超長上下文推理中的效果，此前在社區(qū)中仍存在爭議。一部分原因在于，線性注意力在理論上可能損失部分全局信息交互能力，此外，其在實際任務中的表現(xiàn)依賴于具體實現(xiàn)與訓練策略。

架構改造后，Ling-2.5-1T 的激活參數(shù)規(guī)模由 51B 提升至 63B，但整體推理效率并未因此下降，相反，其在長文本生成中的吞吐優(yōu)勢甚至會隨著生成長度增加而進一步放大。

Ling-2.5-1T 還專門針對超長上下文場景進行了系統(tǒng)性評測。在與采用 MLA 和 DSA 架構的大型即時模型對比中，Ling-2.5-1T 在多項長文本任務中表現(xiàn)出一定優(yōu)勢，驗證了混合注意力路徑在工程落地中的可行性。不過，與當前領先的閉源模型，如 GPT-5.2、Gemini 3 Pro 相比，仍存在一定差距。百靈團隊表示，仍將持續(xù)在接下來版本中推進相關能力的進一步提升。

整體而言，從性能表現(xiàn)上來看，這一次的架構改造帶來的提升十分明顯，尤其是在效率上的提升，直接回應了深度思考模型的長期痛點。

過去，強調多步推理、鏈式思考的模型，往往意味著高延遲、高成本，在真實的生產環(huán)境中落地挑戰(zhàn)重重?；诟弑壤木€性注意力機制，Ring-2.5-1T 在?成?度超過 32K 時，訪存規(guī)模降低 10 倍，?成吞吐提升 3 倍 +。通過混合線性注意力的設計，讓長程推理變得更輕量、更高效。

從這個角度來看，萬億推理模型開源的意義，早已不在于參數(shù)規(guī)模本身，而在于是否找到一條可以持續(xù)擴展的路徑。而混合線性注意力所代表的，正是一種面向長期演進的架構思路。以新的架構范式，將模型能力真正轉化為可落地的價值。某種程度上，這也體現(xiàn)了螞蟻百靈團隊的價值取向——長期主義，以及對 inclusion 的關注。通過架構創(chuàng)新，讓更多開發(fā)者、更多場景有機會參與進來。

2 奧數(shù)金牌水平的模型，如何深度思考？

架構上的升級使得 Ring-2.5-1T 和 Ling-2.5-1T 在多個權威基準評測上均有不錯的表現(xiàn)。Ling-2.5-1T 作為百靈家族當前最強大的即時模型，其與主流的大尺寸即時模型相比，在復雜推理、指令遵循能力具有明顯優(yōu)勢。

Ring-2.5-1T 則在數(shù)學、代碼、邏輯等高難推理任務和智能體搜索、軟件工程、工具調用等長程任務執(zhí)行上均達到了開源領先水平。并且在 IMO 2025（滿分 42 分）中，Ring-2.5-1T 獲得 35 分，達到金牌水平；在 CMO 2025（滿分 126 分）中取得 105 分，顯著高于金牌線（78 分）及國家集訓隊入選線（87 分）。（Ring-2.5-1T 在 IMO 2025 與 CMO 2025 中的詳細解答：https://github.com/inclusionAI/Ring-V2.5/tree/main/examples）

在實際應用中，這兩款模型表現(xiàn)如何？

在一句話生成 PPT 測試中，Ling-2.5-1T 根據(jù)一句指令，快速完成了從內容組織到 HTML 代碼生成的全過程，直接輸出了一份可用于演示的 PPT 頁面，并且給出了詳細的參考文獻。在可視化、專業(yè)知識梳理上，均有不錯的表現(xiàn)。

Prompt: 幫我用 HTML 生成一個介紹 LLM 基本原理的 PPT，畫風要有科技感，術語嚴謹學術性強，16:9 的頁面。

Ring-2.5-1T 則更擅長深度思考，能根據(jù)指令自動開發(fā)一個微型版操作系統(tǒng)（TinyOS），完成從任務拆解、模塊設計到代碼生成與調試的完整閉環(huán)。

這種深度思考能力，決定了模型能否真正跨越復雜問題的門檻。在 Ring-2.5-1T 中，一個關鍵變化是 dense reward 機制（稠密獎勵），這也是支撐 Ring-2.5-1T 能夠實現(xiàn)奧數(shù)金牌水平深度思考的關鍵。

百靈團隊將 dense reward 引入到了 RLVR 的框架中，讓模型的訓練目標從給出正確結果，轉向對每個推理步驟或關鍵節(jié)點都給予反饋。這種訓練方式帶來最直接的變化就是，相當于給模型思考過程加上了監(jiān)督員，確保每一步推理都能合乎邏輯，減少漏洞，從而提升模型在復雜推理任務中的穩(wěn)定性。

簡單來說，dense reward 的核心理念就是關注過程而非僅僅是結果。當思考過程本身成為優(yōu)化目標，大模型才真正具備了接近人類思考方式的能力。這也是螞蟻這幾款開源模型，能夠在春節(jié)檔殺出重圍的根因之一。

3 萬億推理模型的開源，只是螞蟻 AGI 布局中的一環(huán)

從行業(yè)經(jīng)驗來看，開源已經(jīng)被證明是一條有效的生態(tài)路徑，但如果僅僅把螞蟻在這次春節(jié)檔的動作理解為“開源策略”，明顯低估了其背后的意圖。因為螞蟻正在做的，從來不只是開放模型本身，而是試圖開放一整套圍繞大模型運行的系統(tǒng)能力——包括訓練、推理、強化學習乃至應用構建在內的完整技術體系。

支撐百靈大模型體系的，是螞蟻集團自研的高性能強化學習系統(tǒng) ASystem，其針對萬億參數(shù)模型的顯存管理和訓推權重交換問題做了精細的優(yōu)化，實現(xiàn)了單機顯存碎片秒級回收、權重零冗余交換，把大規(guī)模 RL 訓練穩(wěn)定跑成日常。

圍繞這一底座，百靈團隊在過去一年中持續(xù)推進核心能力的開源。自去年 11 月起，陸續(xù)推出「ASystem 系統(tǒng)開源」系列技術解析，并同步開放了一系列關鍵組件，包括高性能強化學習權重交換框架 Awex、用于提升通信效率的 NCCL 擴展庫 AMem NCCL-Plugin、面向強化學習的高性能狀態(tài)數(shù)據(jù)管理系統(tǒng) AState、強化學習訓練框架 AReaL，以及 Agentic RL 環(huán)境系統(tǒng) AEnvironment。百靈團隊希望將這套融合了技術深度與工程實踐的系統(tǒng)性探索回饋社區(qū)，提供模型與系統(tǒng)協(xié)同設計的實踐經(jīng)驗與參考路徑。

當行業(yè)都在熱熱鬧鬧地重新定義模型“天花板”時，百靈團隊緊盯“地板”，向更多開發(fā)者構建一條面向未來的技術路徑：不僅提供模型能力，還提供構建模型的能力。百靈團隊表示，未來還將陸續(xù)開源 ASystem 的其他核心 RL 組件，進一步完善開源強化學習訓練生態(tài)。表面上看，這似乎脫離了金融科技公司的敘事主線，實際上，這只是螞蟻集團在 AGI 布局中的冰山一角。

作為最早將 AI 技術大規(guī)模應用于金融場景的公司之一，螞蟻集團在過去多年來一直致力于 AI 研究，并將機器學習應用于欺詐檢測、信用評估和服務自動化等領域。2023 年，隨著生成式 AI 興起，集團明確提出“AI First”戰(zhàn)略，將 AI 置于公司發(fā)展的核心位置，并與“支付寶雙飛輪”“加速全球化”共同構成新的增長引擎。

在模型層，百靈大模型系列持續(xù)演進，覆蓋語言、多模態(tài)與推理能力；在應用層，則圍繞自身優(yōu)勢場景，在金融、健康與生活服務等領域探索 AI 原生產品形態(tài)，通過“AI 管家”等形式，將模型能力轉化為可感知的用戶價值。

2025 年是螞蟻 AGI 的重要分野。這一年，百靈大模型的迭代節(jié)奏明顯加快，技術路線也逐漸清晰，從大語言模型 Ling，到多模態(tài)模型 Ming，再到強調深度思考能力的 Ring，構建起一套覆蓋理解、生成與推理的模型體系。

在應用層，螞蟻也在加速探索。去年 11 月，發(fā)布了“靈光”AI 助手，將多模態(tài)生成能力與實際使用場景結合，支持包括 3D、音視頻、圖表、動畫與地圖在內的多種信息形式輸出，嘗試構建一種更加直觀的人機交互方式。

去年 12 月升級的 AI 健康助手——阿福，則集成健康問答、健康陪伴、健康服務三大功能模塊，支持語音、文字、圖片交互及“AI 診室”主動追問模式，曾連續(xù)三天登頂 App Store 應用下載總榜第一。在 2 月 16 日的馬年央視春晚舞臺上，螞蟻阿福出現(xiàn)在小品《血壓計》中，成為全民關注熱點。

當模型能力、系統(tǒng)基礎設施與應用場景開始協(xié)同演進時，一套完整的 AI 體系正在逐步成型。而螞蟻，也早已完成從金融科技公司到 AI 核心玩家的轉身。從數(shù)據(jù)庫、隱私計算，再到智能體、萬億參數(shù)模型，螞蟻源源不斷地將核心能力向社區(qū)釋放，試圖在更大范圍內建立技術共識與生態(tài)協(xié)同。對螞蟻而言，開源更像是一種組織能力與創(chuàng)新模式，驅動團隊在開放中進化，在探索中打磨能力。通過持續(xù)的開放與協(xié)同，構建一個能夠自我生長的技術生態(tài)。

從這個角度來看，這次萬億參數(shù)推理模型的開放，并不只是一次技術展示，更像是其在 AGI 路徑上的一次階段性落子——將能力交給開發(fā)者，讓生態(tài)參與進來，也為下一個智能十年寫下自己的注腳。當模型、算力與場景通過開放機制形成正循環(huán)時，技術的演進速度將不再由單一組織決定，而是由整個生態(tài)共同驅動。誰能夠在這一過程中構建起穩(wěn)定的開放體系，誰就更有可能在下一階段占據(jù)主動權。而螞蟻的選擇，正是押注在這樣一條更長期、更復雜，但也更具確定性的路徑之上。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.