国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

最卷春節(jié)檔,改寫模型“地板”的只有 TA

0
分享至


作者 | 凌敏

電影圈或許也沒想到,搶走 2026 年春節(jié)檔風頭的,竟然是 AI。

從年前到年后,全球 AI 領域迎來了一波密集的發(fā)布潮,國內外科技巨頭與創(chuàng)新企業(yè)爭相“交卷”,火藥味十足。從 Seedance 2.0 到 GLM-5,從 Claude Sonnet 4.6 到 Gemini 3.1 Pro,諸神混戰(zhàn),商量好了似的一起致敬去年 DeepSeek 在春節(jié)檔的一戰(zhàn)成名。

值得玩味的是,這一輪諸神之戰(zhàn),大家更多關注的是如何刷新“天花板”,卻很少有人在改變“地板”。換句話說,模型越來越強,但能觸達這些能力的人,依然有限——最先進的模型仍然掌握在極少數(shù)公司手中,再強的突破,也難以轉化為更廣泛的創(chuàng)新紅利。

在這場春節(jié)檔混戰(zhàn)中,螞蟻集團也發(fā)布了三款模型:百靈家族旗艦即時模型 Ling-2.5-1T混合線性架構的思考模型 Ring-2.5-1T,以及全模態(tài)大模型 Ming-flash-omni-2.0。前兩款模型均基于 Ling 2.5 架構,該架構在 Ling 2.0 基礎上,采用混合線性注意力機制,大幅提升了長文本處理效率。其中,Ling-2.5-1T 在 token 效率、偏好對齊等維度全面升級;Ring-2.5-1T 主打復雜推理,同時實現(xiàn) IMO 2025 和 CMO 2025 的金牌水平。Ming-flash-omni-2.0 則基于 Ling-2.0 架構,在視覺理解、語音交互、圖像編輯上均實現(xiàn)大幅提升。

相比“更大更強”的發(fā)布,這次發(fā)布的特殊性在于,開源世界終于又迎來了一款萬億參數(shù)推理模型。

在當前以 OpenAI、Google 為代表的閉源大模型體系主導下,萬億級參數(shù)模型長期被視為超級實驗室的專屬資產。要打造一個萬億參數(shù)的模型,必須同時跨越算力、數(shù)據(jù)、工程三道門檻:需要數(shù)萬張高端 GPU 組成的集群,并且這些 GPU 能夠協(xié)同工作,還需要海量、高質量、多樣化的數(shù)據(jù)。因此,目前業(yè)內開源的萬億級模型寥寥,專注于深度思考的萬億級推理模型更是稀缺。

這也是 Ring-2.5-1T 這款開源模型能夠在社區(qū)引起廣泛討論的根因之一。最重要的是,螞蟻愿意在萬億參數(shù)這個量級上,持續(xù)進行底層的架構創(chuàng)新。這一點尤為關鍵,意味著團隊需要具備迎難而上、勇于探索技術邊界的決心和能力。比如這次在架構上,百靈大模型創(chuàng)新引入了混合線性注意力架構,大幅提升推理效率,同時保持訓練系統(tǒng)的開放開源,與社區(qū)攜手攻堅這一工程難題。

1 萬億模型的意義,不只在于參數(shù)本身

當模型規(guī)??邕^千億之后,單純依賴參數(shù)堆疊,已經(jīng)很難帶來線性的能力提升,反而會帶來訓練成本飆升、推理效率下降等一系列現(xiàn)實問題。行業(yè)對此已經(jīng)形成了效率優(yōu)先的共識,要么圍繞注意力機制進行優(yōu)化,要么針對 KV Cache 進行壓縮,要么在數(shù)據(jù)質量和訓練策略上挖掘突破口……本質上,大家再次來到同一起跑線,尋找新的 Scaling Law。

這也是為什么,這次 Ling 2.5 在架構上的升級能夠成為社區(qū)討論的焦點。

去年 10 月,螞蟻百靈團隊在一份長達 58 頁的硬核技術報告《Ling 2.0 Technical Report》中,詳細介紹了 Ling 2.0 架構。Ling 2.0 采用了統(tǒng)一的 MoE 基礎架構,總專家數(shù)達 256 個,每次前向傳播僅激活 8 個專家和 1 個共享專家,整體激活率約為 3.5%。

Ling 2.5 在 Ling 2.0 架構基礎上,引入了混合線性注意力機制,對傳統(tǒng)全注意力路徑進行重構。具體而言,百靈團隊通過增量訓練方式,將原有 GQA(Grouped Query Attention)升級為 1:7 的 MLA(Multi-head Latent Attention)與 Lightning Linear Attention 組合結構。一部分注意力層被替換為線性注意力路徑,以降低長序列計算復雜度;其余層則通過近似轉換為 MLA,在壓縮 KV Cache 的同時實現(xiàn)更好的表達能力。在實現(xiàn)層面,還對 QK Norm、Partial RoPE 等關鍵組件進行了針對性適配,以增強 Ling 2.5 架構在混合注意力架構下的表達能力。


這一設計其實相當務實,同時兼顧了長序列處理能力與低成本部署的現(xiàn)實要求。用線性注意力將傳統(tǒng)自注意力的時間復雜度從 ?O(n2)? 降低至 ?O(n)?,提升模型在長上下文場景中的效率;通過對 KV Cache 的針對性優(yōu)化,有效降低推理階段高昂的顯存與帶寬開銷。

在訓練階段,Ling-2.5-1T-base 專門基于約 9T 高質量語料進行了持續(xù)預訓練,重點強化了知識覆蓋、智能體多輪交互和長程執(zhí)行能力。在此基礎上,借助混合線性注意力在長序列上的計算效率,將訓練上下文窗口擴展至 256K tokens,并通過 YaRN(Yet another RoPE extensioN)實現(xiàn)最高 1M tokens 的穩(wěn)定外推。

對于混合線性注意力在超長上下文推理中的效果,此前在社區(qū)中仍存在爭議。一部分原因在于,線性注意力在理論上可能損失部分全局信息交互能力,此外,其在實際任務中的表現(xiàn)依賴于具體實現(xiàn)與訓練策略。

架構改造后,Ling-2.5-1T 的激活參數(shù)規(guī)模由 51B 提升至 63B,但整體推理效率并未因此下降,相反,其在長文本生成中的吞吐優(yōu)勢甚至會隨著生成長度增加而進一步放大。

Ling-2.5-1T 還專門針對超長上下文場景進行了系統(tǒng)性評測。在與采用 MLA 和 DSA 架構的大型即時模型對比中,Ling-2.5-1T 在多項長文本任務中表現(xiàn)出一定優(yōu)勢,驗證了混合注意力路徑在工程落地中的可行性。不過,與當前領先的閉源模型,如 GPT-5.2、Gemini 3 Pro 相比,仍存在一定差距。百靈團隊表示,仍將持續(xù)在接下來版本中推進相關能力的進一步提升。


整體而言,從性能表現(xiàn)上來看,這一次的架構改造帶來的提升十分明顯,尤其是在效率上的提升,直接回應了深度思考模型的長期痛點。

過去,強調多步推理、鏈式思考的模型,往往意味著高延遲、高成本,在真實的生產環(huán)境中落地挑戰(zhàn)重重?;诟弑壤木€性注意力機制,Ring-2.5-1T 在?成?度超過 32K 時,訪存規(guī)模降低 10 倍,?成吞吐提升 3 倍 +。通過混合線性注意力的設計,讓長程推理變得更輕量、更高效。

從這個角度來看,萬億推理模型開源的意義,早已不在于參數(shù)規(guī)模本身,而在于是否找到一條可以持續(xù)擴展的路徑。而混合線性注意力所代表的,正是一種面向長期演進的架構思路。以新的架構范式,將模型能力真正轉化為可落地的價值。某種程度上,這也體現(xiàn)了螞蟻百靈團隊的價值取向——長期主義,以及對 inclusion 的關注。通過架構創(chuàng)新,讓更多開發(fā)者、更多場景有機會參與進來。

2 奧數(shù)金牌水平的模型,如何深度思考?

架構上的升級使得 Ring-2.5-1T 和 Ling-2.5-1T 在多個權威基準評測上均有不錯的表現(xiàn)。Ling-2.5-1T 作為百靈家族當前最強大的即時模型,其與主流的大尺寸即時模型相比,在復雜推理、 指令遵循能力具有明顯優(yōu)勢。


Ring-2.5-1T 則在數(shù)學、代碼、邏輯等高難推理任務和智能體搜索、軟件工程、工具調用等長程任務執(zhí)行上均達到了開源領先水平。并且在 IMO 2025(滿分 42 分)中,Ring-2.5-1T 獲得 35 分,達到金牌水平;在 CMO 2025(滿分 126 分)中取得 105 分,顯著高于金牌線(78 分)及國家集訓隊入選線(87 分)。(Ring-2.5-1T 在 IMO 2025 與 CMO 2025 中的詳細解答:https://github.com/inclusionAI/Ring-V2.5/tree/main/examples)


在實際應用中,這兩款模型表現(xiàn)如何?

在一句話生成 PPT 測試中,Ling-2.5-1T 根據(jù)一句指令,快速完成了從內容組織到 HTML 代碼生成的全過程,直接輸出了一份可用于演示的 PPT 頁面,并且給出了詳細的參考文獻。在可視化、專業(yè)知識梳理上,均有不錯的表現(xiàn)。

Prompt: 幫我用 HTML 生成一個介紹 LLM 基本原理的 PPT,畫風要有科技感,術語嚴謹學術性強,16:9 的頁面。

Ring-2.5-1T 則更擅長深度思考,能根據(jù)指令自動開發(fā)一個微型版操作系統(tǒng)(TinyOS),完成從任務拆解、模塊設計到代碼生成與調試的完整閉環(huán)。

這種深度思考能力,決定了模型能否真正跨越復雜問題的門檻。在 Ring-2.5-1T 中,一個關鍵變化是 dense reward 機制(稠密獎勵),這也是支撐 Ring-2.5-1T 能夠實現(xiàn)奧數(shù)金牌水平深度思考的關鍵。

百靈團隊將 dense reward 引入到了 RLVR 的框架中,讓模型的訓練目標從給出正確結果,轉向對每個推理步驟或關鍵節(jié)點都給予反饋。這種訓練方式帶來最直接的變化就是,相當于給模型思考過程加上了監(jiān)督員,確保每一步推理都能合乎邏輯,減少漏洞,從而提升模型在復雜推理任務中的穩(wěn)定性。

簡單來說,dense reward 的核心理念就是關注過程而非僅僅是結果。當思考過程本身成為優(yōu)化目標,大模型才真正具備了接近人類思考方式的能力。這也是螞蟻這幾款開源模型,能夠在春節(jié)檔殺出重圍的根因之一。

3 萬億推理模型的開源,只是螞蟻 AGI 布局中的一環(huán)

從行業(yè)經(jīng)驗來看,開源已經(jīng)被證明是一條有效的生態(tài)路徑,但如果僅僅把螞蟻在這次春節(jié)檔的動作理解為“開源策略”,明顯低估了其背后的意圖。因為螞蟻正在做的,從來不只是開放模型本身,而是試圖開放一整套圍繞大模型運行的系統(tǒng)能力——包括訓練、推理、強化學習乃至應用構建在內的完整技術體系。

支撐百靈大模型體系的,是螞蟻集團自研的高性能強化學習系統(tǒng) ASystem,其針對萬億參數(shù)模型的顯存管理和訓推權重交換問題做了精細的優(yōu)化,實現(xiàn)了單機顯存碎片秒級回收、權重零冗余交換,把大規(guī)模 RL 訓練穩(wěn)定跑成日常。

圍繞這一底座,百靈團隊在過去一年中持續(xù)推進核心能力的開源。自去年 11 月起,陸續(xù)推出「ASystem 系統(tǒng)開源」系列技術解析,并同步開放了一系列關鍵組件,包括高性能強化學習權重交換框架 Awex、用于提升通信效率的 NCCL 擴展庫 AMem NCCL-Plugin、面向強化學習的高性能狀態(tài)數(shù)據(jù)管理系統(tǒng) AState、強化學習訓練框架 AReaL,以及 Agentic RL 環(huán)境系統(tǒng) AEnvironment。百靈團隊希望將這套融合了技術深度與工程實踐的系統(tǒng)性探索回饋社區(qū),提供模型與系統(tǒng)協(xié)同設計的實踐經(jīng)驗與參考路徑。

當行業(yè)都在熱熱鬧鬧地重新定義模型“天花板”時,百靈團隊緊盯“地板”,向更多開發(fā)者構建一條面向未來的技術路徑:不僅提供模型能力,還提供構建模型的能力。百靈團隊表示,未來還將陸續(xù)開源 ASystem 的其他核心 RL 組件,進一步完善開源強化學習訓練生態(tài)。表面上看,這似乎脫離了金融科技公司的敘事主線,實際上,這只是螞蟻集團在 AGI 布局中的冰山一角。

作為最早將 AI 技術大規(guī)模應用于金融場景的公司之一,螞蟻集團在過去多年來一直致力于 AI 研究,并將機器學習應用于欺詐檢測、信用評估和服務自動化等領域。2023 年,隨著生成式 AI 興起,集團明確提出“AI First”戰(zhàn)略,將 AI 置于公司發(fā)展的核心位置,并與“支付寶雙飛輪”“加速全球化”共同構成新的增長引擎。

在模型層,百靈大模型系列持續(xù)演進,覆蓋語言、多模態(tài)與推理能力;在應用層,則圍繞自身優(yōu)勢場景,在金融、健康與生活服務等領域探索 AI 原生產品形態(tài),通過“AI 管家”等形式,將模型能力轉化為可感知的用戶價值。

2025 年是螞蟻 AGI 的重要分野。這一年,百靈大模型的迭代節(jié)奏明顯加快,技術路線也逐漸清晰,從大語言模型 Ling,到多模態(tài)模型 Ming,再到強調深度思考能力的 Ring,構建起一套覆蓋理解、生成與推理的模型體系。

在應用層,螞蟻也在加速探索。去年 11 月,發(fā)布了“靈光”AI 助手,將多模態(tài)生成能力與實際使用場景結合,支持包括 3D、音視頻、圖表、動畫與地圖在內的多種信息形式輸出,嘗試構建一種更加直觀的人機交互方式。

去年 12 月升級的 AI 健康助手——阿福,則集成健康問答、健康陪伴、健康服務三大功能模塊,支持語音、文字、圖片交互及“AI 診室”主動追問模式,曾連續(xù)三天登頂 App Store 應用下載總榜第一。在 2 月 16 日的馬年央視春晚舞臺上,螞蟻阿福出現(xiàn)在小品《血壓計》中,成為全民關注熱點。

當模型能力、系統(tǒng)基礎設施與應用場景開始協(xié)同演進時,一套完整的 AI 體系正在逐步成型。而螞蟻,也早已完成從金融科技公司到 AI 核心玩家的轉身。從數(shù)據(jù)庫、隱私計算,再到智能體、萬億參數(shù)模型,螞蟻源源不斷地將核心能力向社區(qū)釋放,試圖在更大范圍內建立技術共識與生態(tài)協(xié)同。對螞蟻而言,開源更像是一種組織能力與創(chuàng)新模式,驅動團隊在開放中進化,在探索中打磨能力。通過持續(xù)的開放與協(xié)同,構建一個能夠自我生長的技術生態(tài)。

從這個角度來看,這次萬億參數(shù)推理模型的開放,并不只是一次技術展示,更像是其在 AGI 路徑上的一次階段性落子——將能力交給開發(fā)者,讓生態(tài)參與進來,也為下一個智能十年寫下自己的注腳。當模型、算力與場景通過開放機制形成正循環(huán)時,技術的演進速度將不再由單一組織決定,而是由整個生態(tài)共同驅動。誰能夠在這一過程中構建起穩(wěn)定的開放體系,誰就更有可能在下一階段占據(jù)主動權。而螞蟻的選擇,正是押注在這樣一條更長期、更復雜,但也更具確定性的路徑之上。


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
歐洲天然氣價格漲幅擴大至42%,創(chuàng)2022年3月以來最大漲幅

歐洲天然氣價格漲幅擴大至42%,創(chuàng)2022年3月以來最大漲幅

每日經(jīng)濟新聞
2026-03-02 20:22:09
伊朗人拿的清末劇本,答案在我們中學課本

伊朗人拿的清末劇本,答案在我們中學課本

鑒茶院
2026-03-03 08:03:31
伊朗最高國家安全委員會秘書:已為長期戰(zhàn)爭做好準備

伊朗最高國家安全委員會秘書:已為長期戰(zhàn)爭做好準備

財聯(lián)社
2026-03-02 20:44:25
中東激戰(zhàn),日本相當難受!

中東激戰(zhàn),日本相當難受!

環(huán)球時報國際
2026-03-02 21:31:30
“以為是六個博士,結果是六個送外賣的!”六個兒子征婚視頻火了

“以為是六個博士,結果是六個送外賣的!”六個兒子征婚視頻火了

阿凱銷售場
2026-03-01 01:46:42
痛心!深圳一醫(yī)院工地出事,張某才(男,29歲,汕頭人)身亡,事故原因公布

痛心!深圳一醫(yī)院工地出事,張某才(男,29歲,汕頭人)身亡,事故原因公布

南方都市報
2026-03-02 23:28:00
43歲阿Sa承認與男友同居,已帶男友見過家長,疑好事將近

43歲阿Sa承認與男友同居,已帶男友見過家長,疑好事將近

扒蝦侃娛
2026-03-02 22:27:05
這條無恥新聞,引起公憤了!

這條無恥新聞,引起公憤了!

胖胖說他不胖
2026-03-02 12:58:07
椰樹集團被約談,不能任由其將低俗進行到底

椰樹集團被約談,不能任由其將低俗進行到底

極目新聞
2026-03-03 09:00:42
慘遭15分大逆轉!女籃霸主加時3分惜?。簵盍S空砍14分3板4助!

慘遭15分大逆轉!女籃霸主加時3分惜?。簵盍S空砍14分3板4助!

籃球快餐車
2026-03-03 01:57:58
英媒:歐美要死死守住這5項技術,一旦被中國突破那將勢不可擋

英媒:歐美要死死守住這5項技術,一旦被中國突破那將勢不可擋

林子說事
2026-03-03 01:07:19
央視首次曝光!每臺4億美元重180噸,全世界最先進光刻機揭開面紗

央視首次曝光!每臺4億美元重180噸,全世界最先進光刻機揭開面紗

凡知
2026-03-03 01:52:38
衛(wèi)星證實!林肯號航母被伊朗導彈襲擊時,進行90度機動規(guī)避!

衛(wèi)星證實!林肯號航母被伊朗導彈襲擊時,進行90度機動規(guī)避!

52赫茲實驗室
2026-03-02 21:00:37
美軍再度動用B-2轟炸伊朗,加固導彈基地是首批目標

美軍再度動用B-2轟炸伊朗,加固導彈基地是首批目標

中國青年報
2026-03-02 11:33:08
內塔尼亞胡辦公室遭猛烈襲擊!伊朗:摧毀美國一總領館及一軍事基地,擊落3架美軍機

內塔尼亞胡辦公室遭猛烈襲擊!伊朗:摧毀美國一總領館及一軍事基地,擊落3架美軍機

新民晚報
2026-03-02 19:04:01
男子送相親對象回家遇其忘帶鑰匙,開房遭拒后女子怒斥男子真沒用

男子送相親對象回家遇其忘帶鑰匙,開房遭拒后女子怒斥男子真沒用

朗威談星座
2026-03-02 16:54:30
所有發(fā)達國家都有一個共性:人工很貴,勞動很值錢。

所有發(fā)達國家都有一個共性:人工很貴,勞動很值錢。

流蘇晚晴
2026-01-27 18:18:22
油價或飆升至每桶130美元?伊朗警告:若油氣設施遭襲,將摧毀地區(qū)所有國家油氣設施

油價或飆升至每桶130美元?伊朗警告:若油氣設施遭襲,將摧毀地區(qū)所有國家油氣設施

紅星新聞
2026-03-02 11:33:13
記者:沙特足協(xié)與參加亞冠球隊的代表開會,商討后續(xù)賽程解決方案

記者:沙特足協(xié)與參加亞冠球隊的代表開會,商討后續(xù)賽程解決方案

懂球帝
2026-03-03 00:25:10
為什么科學家說:如果宇宙中只有人類,比找到外星人更可怕?

為什么科學家說:如果宇宙中只有人類,比找到外星人更可怕?

觀察宇宙
2026-03-01 20:46:19
2026-03-03 10:11:00
InfoQ incentive-icons
InfoQ
有內容的技術社區(qū)媒體
12095文章數(shù) 51783關注度
往期回顧 全部

科技要聞

蘋果iPhone17e發(fā)布:4499元起 升級A19芯片

頭條要聞

牛彈琴:多國對轟炸保持沉默 西班牙首相確實是條漢子

頭條要聞

牛彈琴:多國對轟炸保持沉默 西班牙首相確實是條漢子

體育要聞

伯納烏8萬人暴怒!高呼78歲老佛爺下課

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

霍爾木茲海峽近乎停擺 布油直逼80美元

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

數(shù)碼
游戲
旅游
家居
公開課

數(shù)碼要聞

小米靠規(guī)模和高端應對!盧偉冰:內存漲價將影響消費電子所有玩家 持續(xù)到2027年

Xbox發(fā)彩蛋暗示《賽博朋克2077》將加入XGP!?

旅游要聞

打造沉浸式元宵體驗 萬寧推出六大特色活動

家居要聞

萬物互聯(lián) 享科技福祉

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版