国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

業(yè)界首個!螞蟻開源萬億參數(shù)混合線性思考模型,IMO金牌水平

0
分享至


智東西
作者 程茜
編輯 李水青

智東西2月13日消息,今天,螞蟻集團開源全球首個基于混合線性架構(gòu)的萬億參數(shù)思考模型Ring-2.5-1T。

根據(jù)官方信息,相比螞蟻2025年10月發(fā)布的萬億級思考模型Ring-1T,Ring-2.5-1T在生成效率、推理深度和長時程任務(wù)執(zhí)行能力三個關(guān)鍵維度上實現(xiàn)提升,且在長文本生成、數(shù)學(xué)推理與智能體任務(wù)執(zhí)行上達到開源領(lǐng)先水平。

在生成效率上,Ring-2.5-1T在32K以上長文本生成場景中,對比上代模型訪存規(guī)模降低至1/10,生成吞吐提升3倍以上。

在深度思考能力方面,該模型在國際數(shù)學(xué)奧林匹克競賽(IMO 2025)和中國數(shù)學(xué)奧林匹克(CMO 2025)自測均達到金牌水平,IMO為35分、CMO為105分。


目前,該模型已經(jīng)適配Claude Code等智能體框架與OpenClaw個人AI助理,支持多步規(guī)劃與工具調(diào)用。

Ring-2.5-1T的模型權(quán)重與推理代碼已在Hugging Face、ModelScope等主流開源平臺發(fā)布,官方平臺Chat體驗頁和API服務(wù)將在近期上線。

Hugging Face:https://huggingface.co/inclusionAI/Ring-2.5-1T

ModelScape:https://modelscope.cn/organization/inclusionAI

一、拿下多項開源SOTA,達IMO金牌水平

為了評估Ring-2.5-1T的深度思考與長時任務(wù)執(zhí)行能力,螞蟻研究人員選擇了具有代表性的開源思考模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking和閉源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking作為比較。

螞蟻集團公布的多項權(quán)威基準測試結(jié)果顯示,Ring-2.5-1T在數(shù)學(xué)、編程和邏輯推理的IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2等高難度推理任務(wù)以及Agent搜索、工具調(diào)用和軟件工程Gaia2-search、Tau2-bench和SWE-Bench Verified等長時任務(wù)執(zhí)行方面均實現(xiàn)了最先進的開源性能。

此外,螞蟻還對深度思考(Heavy Thinking)模式下的模型性能進行了額外測試,Ring-2.5-1T在IMOAnswerBench、HMMT-25等數(shù)學(xué)競賽推理基準和LiveCodeBench-v6代碼生成基準中超越所有對比模型。

其中,在IMO 2025(滿分42分)中,Ring-2.5-1T獲得35分,達到金牌水平;在CMO 2025(滿分126分)中,該模型獲得105分,超過金牌分數(shù)線78分和國家隊集訓(xùn)隊選拔線87分。

研究人員比較了Ring-2.5-1T和Ring-1T的答案發(fā)現(xiàn),前者在推理邏輯的嚴謹性、高級數(shù)學(xué)證明技術(shù)的應(yīng)用以及答案表述的完整性方面均有提升。

智能體搜索任務(wù)Gaia2-search中,Ring-2.5-1T在開源模型中取得了SOTA性能。Gaia2環(huán)境強調(diào)跨應(yīng)用工具協(xié)作和復(fù)雜任務(wù)執(zhí)行能力,Ring-2.5-1T在規(guī)劃生成和多步工具調(diào)用方面均展現(xiàn)出較高的效率和準確性。

二、三大關(guān)鍵維度提升,能快速適配Claude Code、OpenClaw

相比螞蟻2025年10月發(fā)布的萬億級思考模型Ring-1T,Ring-2.5-1T在生成效率、推理深度和長時程任務(wù)執(zhí)行能力三個關(guān)鍵維度上有顯著改進。

首先在生成效率方面,通過采用高比例線性注意力機制,Ring-2.5-1T將內(nèi)存訪問開銷降低至1/10,并將超過32K token序列的生成吞吐量提高了3倍以上,適用于深度思考和長時程任務(wù)執(zhí)行。

其次在深度思考層面,該模型在RLVR(基于可驗證獎勵的強化學(xué)習(xí))基礎(chǔ)上引入密集獎勵機制,為推理過程提供嚴格性反饋,使Ring-2.5-1T同時達到IMO 2025和CMO 2025(自測)的金獎水平。

最后是長程任務(wù)執(zhí)行,Ring-2.5-1T通過大規(guī)模完全異步智能體RL(強化學(xué)習(xí))訓(xùn)練,增強了解決復(fù)雜任務(wù)的長時程自主執(zhí)行能力,使其能快速適配Claude Code等智能體編程框架和OpenClaw個人AI助手。

三、引入混合線性注意力架構(gòu),可提升長程推理場景吞吐量

Ring-2.5-1T基于Ling 2.5架構(gòu),通過優(yōu)化注意力機制,可提升長文本推理的效率與穩(wěn)定性。

作為實現(xiàn)自主模型架構(gòu)的關(guān)鍵進展,Ling 2.5架構(gòu)在Ling 2.0架構(gòu)的基礎(chǔ)上引入了一種混合線性注意力架構(gòu)。通過增量訓(xùn)練,研究人員將Ling 2.0架構(gòu)中的GQA(分組查詢注意力)升級為MLA(多頭線性注意力)+Lightning Linear結(jié)構(gòu)的1:7比例。

具體來說,基于其先前發(fā)布的Ring-flash-linear-2.0技術(shù)路線圖,研究人員將部分GQA層轉(zhuǎn)換為Lightning Linear注意力,以提升長時程推理場景中的吞吐量。

同時為了進一步壓縮KV緩存,研究人員將剩余的GQA層近似轉(zhuǎn)換為MLA,同時針對QK Norm(查詢-核歸一化)和Partial RoPE(部分旋轉(zhuǎn)位置編碼)等特征進行針對性改進,從而增強Ling 2.5架構(gòu)的表達能力。


在此基礎(chǔ)上,模型激活參數(shù)規(guī)模從前代的51B提升至63B,并且在混合線性注意力架構(gòu)的支持下,其推理效率相比Ling 2.0仍實現(xiàn)大幅提升。

與僅具備32B激活參數(shù)的Kimi K2架構(gòu)相比,在1T總參數(shù)量下,Ling 2.5架構(gòu)在長序列推理任務(wù)中的吞吐表現(xiàn)優(yōu)勢顯著,且隨著生成長度增加,效率優(yōu)勢持續(xù)擴大。


▲在一臺配備8塊H20-3e GPU的機器上,批處理大小=64,比較不同生成長度下的解碼吞吐量


▲在一臺配備8塊H200 GPU的機器上,批處理大小=64,比較不同生成長度下的解碼吞吐量

結(jié)語:從短對話到復(fù)雜規(guī)劃,大模型需突破長文本瓶頸

隨著AI大模型應(yīng)用從短對話向長文檔處理、跨文件代碼理解、復(fù)雜任務(wù)規(guī)劃等場景擴展,Ring-2.5-1T可以緩解模型在長輸出場景下計算開銷高、推理速度慢的問題。

此前,傳統(tǒng)架構(gòu)在面對超長文本、多模態(tài)內(nèi)容、復(fù)雜業(yè)務(wù)流程時,普遍面臨算力成本高、響應(yīng)延遲大、部署難度高等問題,螞蟻百靈團隊此次通過底層架構(gòu)創(chuàng)新,或為行業(yè)提供一條兼顧性能、成本與擴展性的技術(shù)路徑。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中國球迷嘲諷赫伊森:體味太大香水都遮不住 皇馬隊友對手受不了

中國球迷嘲諷赫伊森:體味太大香水都遮不住 皇馬隊友對手受不了

念洲
2026-02-25 08:39:22
日本輿論如何看待20家實體被我國列為出口管制

日本輿論如何看待20家實體被我國列為出口管制

日觀研
2026-02-25 08:25:03
急!11歲上海男孩價值30余萬元人工耳蝸丟失,30多人打手電筒,一寸一寸翻找

急!11歲上海男孩價值30余萬元人工耳蝸丟失,30多人打手電筒,一寸一寸翻找

新民晚報
2026-02-24 14:55:43
鐘麗緹又老又胖

鐘麗緹又老又胖

動物奇奇怪怪
2026-02-24 19:43:26
乒乓球世界錦標賽:16強賽中王楚欽出局,國乒遭遇敗局

乒乓球世界錦標賽:16強賽中王楚欽出局,國乒遭遇敗局

兩兄弟養(yǎng)牛
2026-02-24 21:05:11
畸形審美?這4位男演員長相平平,卻總當(dāng)主角演帥哥,實在不理解

畸形審美?這4位男演員長相平平,卻總當(dāng)主角演帥哥,實在不理解

淚滿過眼
2026-02-25 05:03:57
官媒發(fā)文,63歲俞敏洪再破天花板,讓董宇輝和整個商界沉默了

官媒發(fā)文,63歲俞敏洪再破天花板,讓董宇輝和整個商界沉默了

小熊侃史
2026-02-24 17:59:27
歐冠前瞻|皇馬0-2本菲卡:穆帥決勝千里,自大皇馬出局

歐冠前瞻|皇馬0-2本菲卡:穆帥決勝千里,自大皇馬出局

體育世界
2026-02-25 09:12:52
為什么歐洲老人,基本上沒有臥床在病的,后來我終于懂了

為什么歐洲老人,基本上沒有臥床在病的,后來我終于懂了

領(lǐng)悟看世界
2026-02-25 02:08:25
俄烏犧牲士兵們的平凡愿望,如今只能在AI里實現(xiàn)了

俄烏犧牲士兵們的平凡愿望,如今只能在AI里實現(xiàn)了

網(wǎng)易新聞出品
2026-02-24 10:00:05
熊黛林這兩張照片一副生無可戀的炫耀 不知道郭富誠看后會不會哇噻

熊黛林這兩張照片一副生無可戀的炫耀 不知道郭富誠看后會不會哇噻

情感大頭說說
2026-02-24 22:52:44
鵝粉砸了重金的「俄羅斯娜娜」,原來是中國大媽,可她畢竟溫暖了多少人夜里難眠的心……

鵝粉砸了重金的「俄羅斯娜娜」,原來是中國大媽,可她畢竟溫暖了多少人夜里難眠的心……

家傳編輯部
2026-02-22 16:40:47
馬筱梅產(chǎn)后首露臉!用手指著兒子小臉蛋,汪大爺抱了一夜不肯放手

馬筱梅產(chǎn)后首露臉!用手指著兒子小臉蛋,汪大爺抱了一夜不肯放手

離離言幾許
2026-02-24 16:36:39
0比3慘敗震驚乒壇!王藝迪關(guān)鍵戰(zhàn)失利,狀態(tài)下滑引發(fā)熱議

0比3慘敗震驚乒壇!王藝迪關(guān)鍵戰(zhàn)失利,狀態(tài)下滑引發(fā)熱議

卿子書
2026-02-25 08:43:09
中國第一監(jiān)獄:關(guān)的幾乎全是高官,為防止泄密,牢房內(nèi)有特殊布置

中國第一監(jiān)獄:關(guān)的幾乎全是高官,為防止泄密,牢房內(nèi)有特殊布置

瓦倫西亞月亮
2026-02-20 17:37:18
廣東大外援終于要來了?朱芳雨深夜爆猛料:沖擊12冠真的穩(wěn)了?

廣東大外援終于要來了?朱芳雨深夜爆猛料:沖擊12冠真的穩(wěn)了?

籃球快餐車
2026-02-25 07:44:50
春節(jié)旅行,看完三亞賬單我沉默了:一家三口10天,燒掉一年血汗錢

春節(jié)旅行,看完三亞賬單我沉默了:一家三口10天,燒掉一年血汗錢

夜深愛雜談
2026-02-24 22:41:54
中國股市:開盤30分鐘判斷全天漲跌,后悔知道太晚了(建議收藏)

中國股市:開盤30分鐘判斷全天漲跌,后悔知道太晚了(建議收藏)

一方聊市
2026-02-24 15:15:05
Stein:獨行俠將讓米德爾頓自己決定買斷或留隊

Stein:獨行俠將讓米德爾頓自己決定買斷或留隊

北青網(wǎng)-北京青年報
2026-02-25 08:40:02
深圳一女子春節(jié)返程遇“高鐵超載”被迫下車,12306:因“買短乘長”人數(shù)太多導(dǎo)致超載

深圳一女子春節(jié)返程遇“高鐵超載”被迫下車,12306:因“買短乘長”人數(shù)太多導(dǎo)致超載

上游新聞
2026-02-24 14:25:37
2026-02-25 11:15:00
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
11250文章數(shù) 116979關(guān)注度
往期回顧 全部

科技要聞

蘋果MacBook Pro要加觸摸屏了,還帶靈動島

頭條要聞

媒體:中國開年對日本出"重拳" 反制手段根本性質(zhì)變

頭條要聞

媒體:中國開年對日本出"重拳" 反制手段根本性質(zhì)變

體育要聞

曝雄鹿計劃今夏追小卡 字母哥渴望與其并肩作戰(zhàn)

娛樂要聞

撒貝寧到沈陽跑親戚 老婆李白模特身材

財經(jīng)要聞

春節(jié)檔"開門黑" 電影票少賣了7000萬張

汽車要聞

方程豹首款轎車實車圖曝光 就等價格了?

態(tài)度原創(chuàng)

房產(chǎn)
數(shù)碼
親子
藝術(shù)
手機

房產(chǎn)要聞

330萬人涌入!春節(jié)全國樓市,第一個賣爆的區(qū)域出現(xiàn)了!

數(shù)碼要聞

松下證實將電視業(yè)務(wù)轉(zhuǎn)給創(chuàng)維:日系電視落幕!索尼/夏普/東芝電視業(yè)務(wù)早已轉(zhuǎn)手

親子要聞

上交壓歲錢的時候到了

藝術(shù)要聞

如果吳清源重生,他會如何與柯潔較量?

手機要聞

三星闊折疊Galaxy Z Fold Wide手機外觀圖曝光

無障礙瀏覽 進入關(guān)懷版