国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

萬億思考模型新速度!螞蟻開源Ring-2.5-1T

0
分享至

  • 克雷西 發(fā)自 凹非寺
    量子位 | 公眾號 QbitAI

來來來,狠角色來給春節(jié)AI大模型大戰(zhàn)升級了。

剛剛,螞蟻集團(tuán)正式發(fā)布了全球首個開源混合線性架構(gòu)萬億參數(shù)模型Ring-2.5-1T。

這次它在數(shù)學(xué)邏輯推理和長程自主執(zhí)行能力上都練就了一身本領(lǐng)。

具體來說,它在IMO拿到了35分的金牌水平,CMO更是轟出105分遠(yuǎn)超國家集訓(xùn)隊(duì)線;任務(wù)執(zhí)行方面,則在搜索、編碼這些復(fù)雜任務(wù)上都能獨(dú)當(dāng)一面。



而且這次發(fā)布,打破了業(yè)界長期以來關(guān)于深度思考必然要犧牲推理速度和顯存的“不可能三角”。

以前大家默認(rèn)模型要想邏輯嚴(yán)密、想得深,推理解碼就得慢成龜速,顯存開銷還得爆炸。

但Ring-2.5-1T靠架構(gòu)創(chuàng)新,成功實(shí)現(xiàn)在生成長度拉到32K以上時,讓訪存規(guī)模直接降到了1/10以下,同時生成吞吐量暴漲了3倍多。

所以它現(xiàn)在身上掛著兩個極具反差感的標(biāo)簽,既是“開源界最聰明”的奧數(shù)大神,又是“跑得最快”的萬億參數(shù)思考者。

目前它已適配Claude Code、OpenClaw這些主流智能體框架,模型權(quán)重和推理代碼也已經(jīng)在Hugging Face、ModelScope等平臺同步開放了。

混合架構(gòu)讓效率大幅提升

Ring-2.5-1T之所以能打破深度思考必然犧牲推理速度這一行業(yè)魔咒,主要是因?yàn)槠涞讓硬捎昧嘶旌暇€性注意力架構(gòu)。

這種架構(gòu)基于Ring-flash-linear-2.0技術(shù)路線演進(jìn)而來。具體來說,其采用了1:7的MLA(Multi-Head Latent Attention)配Lightning Linear Attention的混搭設(shè)計。



為了讓模型在保持強(qiáng)大推理能力的同時實(shí)現(xiàn)線性級的推理速度,團(tuán)隊(duì)在訓(xùn)練上采用了增量訓(xùn)練的方式。

他們先把一部分原本的GQA(分組查詢注意力)層直接轉(zhuǎn)化為Lightning Linear Attention,這部分專門負(fù)責(zé)在長程推理場景下把吞吐量拉滿;然后為了極致壓縮KV Cache,再把剩下的GQA層近似轉(zhuǎn)換為MLA。

但這還不夠,為了防止模型表達(dá)能力受損,研究團(tuán)隊(duì)又專門適配了QK Norm和Partial RoPE這些特性,確保模型性能不降級。

經(jīng)過這一番底層架構(gòu)的重構(gòu),Ring-2.5-1T直接利用線性時間復(fù)雜度的特性,完美解決了長窗口下顯存爆炸的難題。

改造后,Ring-2.5-1T的激活參數(shù)量從51B提升至63B,但其推理效率相比Ling 2.0仍實(shí)現(xiàn)了大幅提升。

這意味著長程推理不再是那種“燒錢又燒顯卡”的重資產(chǎn)操作,而是變得相當(dāng)輕量化,徹底解決了深度思考模型通常推理慢、成本高的痛點(diǎn)。



當(dāng)然,光跑得快沒用,邏輯還得嚴(yán)密。在思維訓(xùn)練上,Ring-2.5-1T引入了密集獎勵機(jī)制。

這就像老師改卷子時不能只看最后的得數(shù),還得死摳解題步驟里的每一個推導(dǎo)環(huán)節(jié),會重點(diǎn)考察思考過程的嚴(yán)謹(jǐn)性,這讓模型大幅減少了邏輯漏洞,高階證明技巧也顯著提升。

在此基礎(chǔ)上,螞蟻團(tuán)隊(duì)又給它上了大規(guī)模全異步Agentic RL訓(xùn)練,顯著提升了它在搜索、編碼這些長鏈條任務(wù)上的自主執(zhí)行能力,讓它從單純的“做題家”變成了能真正下場干活的實(shí)戰(zhàn)派。

Ring-2.5-1T實(shí)戰(zhàn)演練

接下來把Ring拉出來遛遛,我讓Gemini專門設(shè)計了一道能把人腦干燒的抽象代數(shù)證明題。

這道題目考察的是群論,要求模型在一個有限群里證明非交換群的階≥27,還得把中心階和正規(guī)子群的底細(xì)給摸清。



Ring-2.5-1T接招的姿勢也是相當(dāng)專業(yè)。它先是反手掏出Cauchy定理,接著就開始有條不紊地排雷,把階為1、3、9這些只能是交換群的坑全給避開了。

而且它在證明非交換性的時候,不僅沒被那種“3^k階群肯定交換”的直覺給帶偏,還直接把Heisenberg群甩出來當(dāng)反例,可以說很有邏輯敏感度了。

整個實(shí)測看下來,它的邏輯推導(dǎo)嚴(yán)絲合縫。模型不僅把高深定理給吃透了,在處理這種長達(dá)好幾步的邏輯鏈條時還沒出半點(diǎn)紕漏,特別是對反例的運(yùn)用直接把它的邏輯深度拉滿。



這足以證明密集獎勵訓(xùn)練確實(shí)讓模型長了腦子,它處理這類硬核邏輯任務(wù)時的表現(xiàn),完全是實(shí)戰(zhàn)派的水準(zhǔn)。

測完了硬核的數(shù)學(xué)難題,咱們再來看看這個實(shí)戰(zhàn)派選手在系統(tǒng)級編程上,到底穩(wěn)不穩(wěn)。

這道代碼實(shí)測題要求模型用Rust語言從零開始手寫一個高并發(fā)線程池,模型得在不用任何現(xiàn)成庫的情況下,靠Arc、Mutex和Condvar把任務(wù)分發(fā)邏輯給硬生生地搭出來。

不光得能跑,還得支持“優(yōu)雅關(guān)機(jī)”,意思就是主線程在退出的時侯,必須確保所有派發(fā)出去的活兒全干完,而且堅決不能出現(xiàn)死鎖這種低級錯誤。

另外還得加個監(jiān)控模塊,萬一哪天某個Worker線程直接崩潰了,模型得能自動發(fā)現(xiàn)并把線程重啟,而且還沒處理完的任務(wù)隊(duì)列一個都不能丟,這非??简?yàn)?zāi)P蛯?nèi)存安全和并發(fā)底層的理解。



來看Ring-2.5-1T給出的這份代碼,它的處理方式確實(shí)非常老練。它通過panic::catch_unwind精準(zhǔn)捕獲崩潰并配合一個獨(dú)立的監(jiān)控線程實(shí)現(xiàn)自動重啟,這種設(shè)計巧妙避開了初學(xué)者最容易掉進(jìn)去的死鎖陷阱。

代碼在所有權(quán)管理與異步通知上的邏輯清晰且老練,優(yōu)雅關(guān)機(jī)部分通過活動線程計數(shù)與信號量喚醒機(jī)制配合,完美達(dá)成了任務(wù)全部清空的目標(biāo)。



把統(tǒng)一模態(tài)做成可復(fù)用底座

除了在架構(gòu)和推理上的大動作,螞蟻集團(tuán)在通用人工智能基模領(lǐng)域保持多線并進(jìn),同期發(fā)布了擴(kuò)散語言模型LLaDA2.1和全模態(tài)大模型Ming-flash-omni-2.0。

LLaDA2.1采用了非自回歸并行解碼技術(shù),徹底改變了傳統(tǒng)模型逐詞預(yù)測的生成范式,推理速度達(dá)到了535tokens/s,在特定任務(wù)(如 HumanEval+編程任務(wù))上的吞吐量甚至達(dá)到了更驚人的892tokens/s。

這種架構(gòu)不僅大幅提升了吞吐效率,也讓模型具備了獨(dú)特的Token編輯與逆向推理能力。它可以直接在推理過程中對文本中間的特定Token進(jìn)行精準(zhǔn)修正,或者基于預(yù)設(shè)的邊界條件進(jìn)行反向邏輯追溯。

這種靈活性在處理需要高頻改寫或復(fù)雜邏輯回溯的任務(wù)時,展現(xiàn)出了比傳統(tǒng)自回歸模型更強(qiáng)的適配性。



全模態(tài)大模型Ming-flash-omni-2.0則是在視覺、音頻、文本的統(tǒng)一表征與生成上實(shí)現(xiàn)了重大突破。

它在技術(shù)底層打通了視覺、音頻與文本的邊界,通過全模態(tài)感知的強(qiáng)化與泛音頻統(tǒng)一生成框架,讓模型既具備博學(xué)的專家級知識儲備,又擁有沉浸式的音畫同步創(chuàng)作能力。

這種全能型架構(gòu),實(shí)現(xiàn)了極高響應(yīng)頻率下的實(shí)時感官交互。



這一大波技術(shù)更新背后的算盤很清楚,螞蟻inclusionAI是想把這些能力做成可復(fù)用底座。

這就是要給行業(yè)打個樣,給開發(fā)者提供一個統(tǒng)一的能力入口,以后想做多模態(tài)應(yīng)用不用再到處找模型拼湊了,直接調(diào)這個現(xiàn)成的底座就行。

據(jù)稱已經(jīng)明牌的是,接下來團(tuán)隊(duì)還會繼續(xù)死磕視頻時序理解、復(fù)雜圖像編輯和長音頻實(shí)時生成這幾個硬骨頭。

這些其實(shí)都是全模態(tài)技術(shù)規(guī)模化落地的最后幾道關(guān)卡,只要把長視頻邏輯看懂、把復(fù)雜修圖搞精、把音頻生成弄得更絲滑,全模態(tài)AI就能在各種干活場景里真正爆發(fā)了。

螞蟻這一套組合拳打下來,能感覺到他們在春節(jié)檔這波華山論劍里真不是來湊熱鬧的,這一本本厚實(shí)的成績單交出來,直接就把技術(shù)底蘊(yùn)給亮透了。

這種從底層邏輯到實(shí)戰(zhàn)執(zhí)行的全面爆發(fā),穩(wěn)穩(wěn)地證明了他們就是全球AI圈子里最頂尖的那一撥選手,展現(xiàn)出了第一梯隊(duì)的水平。

螞蟻現(xiàn)在的路數(shù),已經(jīng)跳出了單純炫技的層面,他們正把這些壓箱底的本事,變成大家能直接上手的底座方案。

大模型的華山論劍,門檻被螞蟻卷得更高了。

開源地址
GitHub:https://github.com/inclusionAI/Ring-V2.5
Huggingface:https://huggingface.co/inclusionAI/Ring-2.5-1T
ModelScope:https://www.modelscope.cn/models/inclusionAI/Ring-2.5-1T

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
新MacBook三千塊,這讓友商怎么賣

新MacBook三千塊,這讓友商怎么賣

劉奔跑
2026-02-24 23:56:35
4-3絕殺!斯諾克中國德比:趙心童險勝范爭一!下輪對手也確定了

4-3絕殺!斯諾克中國德比:趙心童險勝范爭一!下輪對手也確定了

球場沒跑道
2026-02-24 23:05:03
演員馬衛(wèi)軍:演了大半輩子日本人,和妻兒定居日本,67歲死在日本

演員馬衛(wèi)軍:演了大半輩子日本人,和妻兒定居日本,67歲死在日本

手工制作阿殲
2026-02-22 01:13:51
平山打女孩后續(xù):母親再度發(fā)聲,打人者有勢力,女孩現(xiàn)狀令人擔(dān)憂

平山打女孩后續(xù):母親再度發(fā)聲,打人者有勢力,女孩現(xiàn)狀令人擔(dān)憂

離離言幾許
2026-02-24 14:01:15
回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

就一點(diǎn)
2025-11-22 10:36:39
喬布斯誕辰日,蘋果公司召開股東大會:庫克并未接任董事長,也未釋放首款蘋果折疊屏手機(jī)相關(guān)信息

喬布斯誕辰日,蘋果公司召開股東大會:庫克并未接任董事長,也未釋放首款蘋果折疊屏手機(jī)相關(guān)信息

極目新聞
2026-02-25 08:38:15
西湖大學(xué)打了誰的臉?外籍學(xué)生學(xué)費(fèi)35萬一年,國內(nèi)學(xué)生僅6千元

西湖大學(xué)打了誰的臉?外籍學(xué)生學(xué)費(fèi)35萬一年,國內(nèi)學(xué)生僅6千元

妍妍教育日記
2026-02-24 18:35:18
電訊報評本賽季英超最佳引援Top10:姆伯莫居首,格伊第三

電訊報評本賽季英超最佳引援Top10:姆伯莫居首,格伊第三

懂球帝
2026-02-25 03:35:12
方媛拆三胎滿月宴禮物!小金鎖、小玉鐲都好可愛,孩子長大了不少

方媛拆三胎滿月宴禮物!小金鎖、小玉鐲都好可愛,孩子長大了不少

小娛樂悠悠
2026-02-25 10:35:24
陳坤之子陳尊佑生母真相11年前就已大白天下

陳坤之子陳尊佑生母真相11年前就已大白天下

錯過美好
2026-02-14 21:17:01
打破隊(duì)史紀(jì)錄!庫明加首秀27+7+4!勇士2換1交易虧麻了

打破隊(duì)史紀(jì)錄!庫明加首秀27+7+4!勇士2換1交易虧麻了

籃球教學(xué)論壇
2026-02-25 11:56:47
恐怖! 華人富商被女子約會引誘 慘遭綁架撕票埋尸荒野! 人財兩失

恐怖! 華人富商被女子約會引誘 慘遭綁架撕票埋尸荒野! 人財兩失

北國向錫安
2026-02-25 09:32:28
劉邦有啥突出才能,能成為皇帝?毛澤東:封建皇帝里最厲害的一個

劉邦有啥突出才能,能成為皇帝?毛澤東:封建皇帝里最厲害的一個

小莜讀史
2026-02-18 17:12:13
中鐵二十一局今年的年終獎工資單。。。

中鐵二十一局今年的年終獎工資單。。。

新浪財經(jīng)
2026-02-24 13:51:53
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
急!11歲上海男孩價值30余萬元人工耳蝸丟失,30多人打手電筒,一寸一寸翻找

急!11歲上海男孩價值30余萬元人工耳蝸丟失,30多人打手電筒,一寸一寸翻找

新民晚報
2026-02-24 14:55:43
90后男生上門喂貓,春節(jié)前后20多天賺16萬,最多1天跑55單只睡3小時,律師提醒:上門喂貓需提前明確責(zé)任

90后男生上門喂貓,春節(jié)前后20多天賺16萬,最多1天跑55單只睡3小時,律師提醒:上門喂貓需提前明確責(zé)任

瀟湘晨報
2026-02-18 16:28:53
小米連出六輛新車!雷軍震驚行業(yè)

小米連出六輛新車!雷軍震驚行業(yè)

銷售與管理
2026-02-24 17:32:08
南平服務(wù)區(qū)男童被撞身亡后續(xù):疑點(diǎn)重重!網(wǎng)友猜測為何二次加速

南平服務(wù)區(qū)男童被撞身亡后續(xù):疑點(diǎn)重重!網(wǎng)友猜測為何二次加速

冒泡泡的魚兒
2026-02-25 08:10:03
湖南開放部分高速公路應(yīng)急車道,有網(wǎng)友稱“不敢走”,交警詳解:這些情況下請放心行駛

湖南開放部分高速公路應(yīng)急車道,有網(wǎng)友稱“不敢走”,交警詳解:這些情況下請放心行駛

瀟湘晨報
2026-02-24 22:25:41
2026-02-25 12:43:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12196文章數(shù) 176392關(guān)注度
往期回顧 全部

科技要聞

蘋果MacBook Pro要加觸摸屏了,還帶靈動島

頭條要聞

牛彈琴:美伊大戰(zhàn)若還不打 全世界都會看特朗普的笑話

頭條要聞

牛彈琴:美伊大戰(zhàn)若還不打 全世界都會看特朗普的笑話

體育要聞

曝雄鹿計劃今夏追小卡 字母哥渴望與其并肩作戰(zhàn)

娛樂要聞

撒貝寧到沈陽跑親戚 老婆李白模特身材

財經(jīng)要聞

春節(jié)檔"開門黑" 電影票少賣了7000萬張

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

時尚
健康
手機(jī)
本地
房產(chǎn)

普通人穿衣別太老氣橫秋!這些穿搭給你靈感,保暖耐看兩不誤

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

手機(jī)要聞

新一代豆包手機(jī) 努比亞官宣MWC推出AI新物種

本地新聞

津南好·四時總相宜

房產(chǎn)要聞

330萬人涌入!春節(jié)全國樓市,第一個賣爆的區(qū)域出現(xiàn)了!

無障礙瀏覽 進(jìn)入關(guān)懷版