国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

小米突發(fā)新模型,主打“極致性價(jià)比”,羅福莉:“這只是我們AGI圖線路上的第二步”

0
分享至

11個(gè)小時(shí)前,小米深夜“突襲式”發(fā)布并開源了其最新的專家混合架構(gòu)(MoE)大語(yǔ)言模型MiMo-V2-Flash。該模型總參數(shù)量達(dá)3090億,活躍參數(shù)為150億,采用對(duì)開發(fā)者友好的MIT開源協(xié)議,基礎(chǔ)版權(quán)重也已經(jīng)在Hugging Face上發(fā)布。


小米MiMo團(tuán)隊(duì)負(fù)責(zé)人羅福莉(Fuli Luo)在社交平臺(tái)上明確表示:“MiMo-V2-Flash已經(jīng)上線。這只是我們AGI路線圖上的第二步?!?/strong>這一表態(tài)凸顯了小米在AI領(lǐng)域的長(zhǎng)遠(yuǎn)規(guī)劃和技術(shù)雄心。


從市場(chǎng)影響來(lái)看,MiMo-V2-Flash的入局可能攪動(dòng)現(xiàn)有開源AI模型的競(jìng)爭(zhēng)格局。其官方公布的每百萬(wàn)輸入token 0.1美元、輸出token 0.3美元的極低成本,結(jié)合高達(dá)150 tokens/秒的推理速度,為開發(fā)者和企業(yè)提供了極具吸引力的選擇,或?qū)⒓铀俑咝阅蹵I技術(shù)在更廣泛場(chǎng)景的應(yīng)用和普及,尤其是對(duì)其龐大的“手機(jī) x AIoT”生態(tài)系統(tǒng)形成強(qiáng)大賦能。


性能媲美DeepSeek-V3.2,并且“極具性價(jià)比”

MiMo-V2-Flash在多個(gè)權(quán)威基準(zhǔn)測(cè)試中展現(xiàn)了強(qiáng)大的實(shí)力,其性能表現(xiàn)足以和部分頂尖的開源及閉源模型同臺(tái)競(jìng)技。

根據(jù)小米官方公布的數(shù)據(jù),在衡量編程能力的SWE-bench Verified測(cè)試中,MiMo-V2-Flash取得了73.4%的得分,超越了所有已知的開源模型,并接近頂級(jí)閉源模型的水平。

在AIME 2025數(shù)學(xué)競(jìng)賽和GPQA-Diamond科學(xué)知識(shí)測(cè)試等考驗(yàn)推理能力的項(xiàng)目中,該模型也位列開源模型前兩名。摩根士丹利的研報(bào)圖表亦顯示,MiMo-V2-Flash在綜合性能上與DeepSeek-V3.2等主流大模型相比具有競(jìng)爭(zhēng)力。



在愈發(fā)重要的智能體(Agent)任務(wù)上,MiMo-V2-Flash同樣表現(xiàn)出色。數(shù)據(jù)顯示,其在τ2-Bench分類得分中,通信、零售、航空等多個(gè)類別均獲得高分,證明其具備理解復(fù)雜任務(wù)邏輯和執(zhí)行多輪交互的能力。

小米方面表態(tài)現(xiàn)實(shí),該模型的高性能與150 tokens/秒的推理速度,加上極低的運(yùn)營(yíng)成本,使其成為現(xiàn)有最高性價(jià)比的高性能模型之一。目前,該模型已在API平臺(tái)限時(shí)免費(fèi)開放,并以MIT開源協(xié)議在Hugging Face上發(fā)布了基礎(chǔ)版權(quán)重。


“極致性價(jià)比”背后的技術(shù)創(chuàng)新:解鎖效率與長(zhǎng)文本能力

MiMo-V2-Flash之所以能在保持高性能的同時(shí)實(shí)現(xiàn)低成本和高效率,得益于其在模型架構(gòu)和訓(xùn)練方法上的多項(xiàng)關(guān)鍵技術(shù)創(chuàng)新。

首先,是“混合滑動(dòng)窗口注意力機(jī)制”(Hybrid Sliding Window Attention)。小米采用了一種5:1的混合比例,即每5層滑動(dòng)窗口注意力(SWA)搭配1層全局注意力,將KV緩存(一種用于存儲(chǔ)中間結(jié)果的內(nèi)存)的存儲(chǔ)量減少了近6倍,同時(shí)依然支持高達(dá)256k的超長(zhǎng)上下文窗口。

羅福莉(Fuli Luo)在其X帖子中分享了工程細(xì)節(jié):“我們最終選擇了混合SWA。它簡(jiǎn)單、優(yōu)雅,并且在我們的內(nèi)部基準(zhǔn)測(cè)試中,其長(zhǎng)上下文推理能力優(yōu)于其他線性注意力變體?!彼貏e指出一個(gè)反直覺的發(fā)現(xiàn),即128個(gè)token的窗口大小是“最佳選擇”,盲目擴(kuò)大到512反而會(huì)導(dǎo)致性能下降,并強(qiáng)調(diào)“sink values是不可或缺的”。


其次,是輕量級(jí)多Token預(yù)測(cè)(Lightweight Multi-Token Prediction, MTP)。該技術(shù)使模型能一次并行預(yù)測(cè)多個(gè)token,而非傳統(tǒng)的逐字生成,從而將推理速度提升2至2.6倍。

羅福莉透露:“通過(guò)3層MTP,我們觀察到平均接受token數(shù)超過(guò)3個(gè),編碼任務(wù)速度提升約2.5倍?!彼a(bǔ)充說(shuō),這項(xiàng)技術(shù)有效解決了GPU的空閑時(shí)間問(wèn)題,盡管因項(xiàng)目周期緊張此次未能完全整合進(jìn)強(qiáng)化學(xué)習(xí)(RL)循環(huán),但小米已將3層MTP開源,供開發(fā)者使用。

今年11月,曾效力DeepSeek的羅福莉在X上高調(diào)宣布正式加入小米,出任MiMo團(tuán)隊(duì)負(fù)責(zé)人。小米MiMo是小米推進(jìn)大模型研發(fā)的核心招牌,隨著羅福莉的官宣,小米MiMo也被一并明確,劍指最前沿——空間智能。


訓(xùn)練“黑科技”:1/50算力實(shí)現(xiàn)性能對(duì)齊

在訓(xùn)練階段,小米采用了業(yè)界領(lǐng)先的技術(shù)以最大化效率。模型在預(yù)訓(xùn)練階段使用了FP8混合精度技術(shù),在27萬(wàn)億token的數(shù)據(jù)上完成訓(xùn)練。

更具突破性的是在后訓(xùn)練階段引入的多教師在線策略蒸餾(Multi-teacher Online Policy Distillation, MOPD)框架。據(jù)小米介紹,該方法借鑒了Thinking Machine的On-Policy Distillation思路,讓學(xué)生模型在訓(xùn)練時(shí)能從多個(gè)專家教師模型處獲得密集的獎(jiǎng)勵(lì)信號(hào)。其最顯著的優(yōu)勢(shì)在于效率,僅需傳統(tǒng)SFT(監(jiān)督微調(diào))與強(qiáng)化學(xué)習(xí)相結(jié)合方法的1/50算力,就能讓學(xué)生模型達(dá)到教師模型的性能峰值。


羅福莉指出,這一框架為構(gòu)建一個(gè)“自我強(qiáng)化循環(huán)系統(tǒng)”奠定了基礎(chǔ),即今天的學(xué)生模型在進(jìn)化后可以成為明天更強(qiáng)的教師模型,從而實(shí)現(xiàn)模型的持續(xù)、高效迭代。

小米的AI版圖:從手機(jī)到AGI

MiMo-V2-Flash的發(fā)布,并非一次孤立的技術(shù)展示,而是小米AI戰(zhàn)略的重要組成部分。正如羅福莉所言,這只是其AGI路線圖的“第二步”,暗示了后續(xù)將有更深入的布局。

此舉清晰地表明了小米正全力將AI打造為其核心競(jìng)爭(zhēng)力之一。據(jù)摩根士丹利發(fā)布的研報(bào)觀點(diǎn)稱,此舉“展示了小米對(duì)AI研發(fā)的承諾”,并預(yù)計(jì)該公司未來(lái)將在云端AI和邊緣AI兩方面取得更多實(shí)質(zhì)性進(jìn)展。而強(qiáng)大的自研AI底層能力,將為其手機(jī)、IoT設(shè)備乃至新能源汽車等硬件產(chǎn)品帶來(lái)獨(dú)特的智能化體驗(yàn),構(gòu)筑更深的生態(tài)護(hù)城河。

摩根士丹利認(rèn)為,MiMo-V2-Flash的推出,不僅可能重塑開源AI模型市場(chǎng)格局,更揭示了小米意圖通過(guò)自研AI技術(shù)深度賦能其“人車家”全生態(tài)的戰(zhàn)略野心。

十四年前,小米手機(jī)以1999元的價(jià)格重新定義了旗艦智能手機(jī)市場(chǎng)。如今,小米似乎希望通過(guò)MiMo-V2-Flash,以其卓越的性能和顛覆性的成本,為開源AI領(lǐng)域帶來(lái)一個(gè)新的“小米時(shí)刻”。


體驗(yàn)?zāi)P涂纱粒篽ttps://aistudio.xiaomimimo.com/#/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
北京醫(yī)院院長(zhǎng)送給老人4句話:很多病都不算病,只是衰老罷了

北京醫(yī)院院長(zhǎng)送給老人4句話:很多病都不算病,只是衰老罷了

徐云流浪中國(guó)
2025-12-20 16:05:09
吳錫昌接受紀(jì)律審查和監(jiān)察調(diào)查

吳錫昌接受紀(jì)律審查和監(jiān)察調(diào)查

吉刻新聞
2025-12-20 13:14:46
“不要再查了,再查我怕過(guò)兩天南京博物院庫(kù)房就要著火了!”

“不要再查了,再查我怕過(guò)兩天南京博物院庫(kù)房就要著火了!”

迷世書童H9527
2025-12-18 10:00:25
刀郎:祝賀徐子堯老師首秀圓滿成功

刀郎:祝賀徐子堯老師首秀圓滿成功

手工制作阿殲
2025-12-20 10:42:58
絲芭傳媒再發(fā)文:要求鞠婧祎方立刻停止侵權(quán)抹黑,將就其和關(guān)聯(lián)人涂某某等涉嫌嚴(yán)重經(jīng)濟(jì)犯罪行為,向相關(guān)監(jiān)管機(jī)構(gòu)實(shí)名舉報(bào)

絲芭傳媒再發(fā)文:要求鞠婧祎方立刻停止侵權(quán)抹黑,將就其和關(guān)聯(lián)人涂某某等涉嫌嚴(yán)重經(jīng)濟(jì)犯罪行為,向相關(guān)監(jiān)管機(jī)構(gòu)實(shí)名舉報(bào)

極目新聞
2025-12-18 11:17:51
CBA官方首周收視戰(zhàn)報(bào):抖音平臺(tái)累計(jì)觀看人次4.36億,累計(jì)觀看人數(shù)8502萬(wàn)

CBA官方首周收視戰(zhàn)報(bào):抖音平臺(tái)累計(jì)觀看人次4.36億,累計(jì)觀看人數(shù)8502萬(wàn)

懂球帝
2025-12-20 18:24:15
島內(nèi)掀起“彈劾賴清德”浪潮,臺(tái)媒:背后是臺(tái)灣民眾對(duì)“臺(tái)獨(dú)”亂政徹底失望

島內(nèi)掀起“彈劾賴清德”浪潮,臺(tái)媒:背后是臺(tái)灣民眾對(duì)“臺(tái)獨(dú)”亂政徹底失望

環(huán)球網(wǎng)資訊
2025-12-20 07:09:34
【2025.12.20】扒醬料不停:那些你不知道的八卦一二三

【2025.12.20】扒醬料不停:那些你不知道的八卦一二三

娛樂(lè)真爆姐
2025-12-20 23:20:15
向佐秀恩愛翻車,修圖誤傷老婆臉,網(wǎng)友:這比精修照有趣多了

向佐秀恩愛翻車,修圖誤傷老婆臉,網(wǎng)友:這比精修照有趣多了

鋒哥與八卦哥
2025-12-18 14:54:44
范迪塞爾官宣!C羅加盟,巨石強(qiáng)森回歸,《速度與激情11》要爆了

范迪塞爾官宣!C羅加盟,巨石強(qiáng)森回歸,《速度與激情11》要爆了

娛樂(lè)圈十三太保
2025-12-19 16:48:24
從屠龍少年到惡龍——洪森的前世今生

從屠龍少年到惡龍——洪森的前世今生

細(xì)雨中的呼喊
2025-12-20 18:37:18
連場(chǎng)轟20+!中國(guó)女籃26歲2米王牌閃耀:升聯(lián)盟第2,宮帥招她嗎?

連場(chǎng)轟20+!中國(guó)女籃26歲2米王牌閃耀:升聯(lián)盟第2,宮帥招她嗎?

李喜林籃球絕殺
2025-12-20 16:09:28
窩闊臺(tái)家族與拖雷家族的較量:在絕對(duì)的實(shí)力面前,計(jì)謀的作用不大

窩闊臺(tái)家族與拖雷家族的較量:在絕對(duì)的實(shí)力面前,計(jì)謀的作用不大

阿光的技巧課堂
2025-12-17 21:48:01
普京嚴(yán)肅警告歐洲:沒收俄資產(chǎn)后果很嚴(yán)重

普京嚴(yán)肅警告歐洲:沒收俄資產(chǎn)后果很嚴(yán)重

參考消息
2025-12-19 21:29:13
中國(guó)特使訪柬推動(dòng)柬泰?;?>
    </a>
        <h3>
      <a href=參考消息
2025-12-20 20:45:43
第二個(gè)李登輝出現(xiàn)?她是民進(jìn)黨臥底,要繼承王金平衣缽害殘國(guó)民黨

第二個(gè)李登輝出現(xiàn)?她是民進(jìn)黨臥底,要繼承王金平衣缽害殘國(guó)民黨

近史博覽
2025-12-20 07:06:14
終于行動(dòng)!傳遼籃進(jìn)行陣容調(diào)整 楊鳴目標(biāo)明確 鋒線補(bǔ)強(qiáng)勢(shì)在必行

終于行動(dòng)!傳遼籃進(jìn)行陣容調(diào)整 楊鳴目標(biāo)明確 鋒線補(bǔ)強(qiáng)勢(shì)在必行

胖子噴球
2025-12-20 11:39:12
左右腦互搏,媒體曝新國(guó)標(biāo)銷售暴增8倍,多家媒體報(bào)道不一,為啥

左右腦互搏,媒體曝新國(guó)標(biāo)銷售暴增8倍,多家媒體報(bào)道不一,為啥

你食不食油餅
2025-12-18 03:12:53
回國(guó)后我才敢說(shuō):越南是我去過(guò)的所有國(guó)家中,最被低估的

回國(guó)后我才敢說(shuō):越南是我去過(guò)的所有國(guó)家中,最被低估的

李健政觀察
2025-12-18 09:49:21
名記:戴琳已將欠的錢還給已故球迷的父母 并且多給了5000多元

名記:戴琳已將欠的錢還給已故球迷的父母 并且多給了5000多元

818體育
2025-12-20 22:49:43
2025-12-21 00:03:00
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國(guó)領(lǐng)先的金融商業(yè)信息提供商
139164文章數(shù) 2651880關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時(shí)刻"還未到來(lái)

頭條要聞

印度官員:若"臺(tái)灣有事" 印度不太可能像西方那樣回應(yīng)

頭條要聞

印度官員:若"臺(tái)灣有事" 印度不太可能像西方那樣回應(yīng)

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂(lè)要聞

2026央視跨年晚會(huì)陣容曝光,豪華陣仗

財(cái)經(jīng)要聞

求解“地方財(cái)政困難”

汽車要聞

嵐圖推進(jìn)L3量產(chǎn)測(cè)試 已完成11萬(wàn)公里實(shí)際道路驗(yàn)證

態(tài)度原創(chuàng)

親子
旅游
數(shù)碼
教育
健康

親子要聞

邊牧和德牧帶娃在外面挖坑,三個(gè)小朋友加起來(lái)800個(gè)心眼子!

旅游要聞

虹口新春“五必”榜單來(lái)啦!一季度“樂(lè)購(gòu)樂(lè)游”攻略輕松拿捏!

數(shù)碼要聞

50歲了!長(zhǎng)虹第一臺(tái)彩電入駐中國(guó)國(guó)家博物館

教育要聞

調(diào)查發(fā)現(xiàn):影響孩子成績(jī)的三大主要因素,居然沒有補(bǔ)習(xí)班

這些新療法,讓化療不再那么痛苦

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版