国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

小米突然發(fā)布新模型:媲美 DeepSeek-V3.2,把手機(jī)的性?xún)r(jià)比卷到 AI

0
分享至


開(kāi)源模型再次迎來(lái)一位重磅選手,就在剛剛,小米正式發(fā)布并開(kāi)源新模型 MiMo-V2-Flash。

MiMo-V2-Flash 總參數(shù) 3090 億,活躍參數(shù) 150 億,采用專(zhuān)家混合架構(gòu) (MoE),性能還能和 DeepSeek-V3.2、Kimi-K2 這些頭部開(kāi)源模型掰掰手腕。


此外,MiMo-V2-Flash 采用 MIT 開(kāi)源協(xié)議,基礎(chǔ)版權(quán)重也已經(jīng)在 Hugging Face 上發(fā)布,除了開(kāi)源,新模型真正的殺手锏在于架構(gòu)設(shè)計(jì)上的激進(jìn)創(chuàng)新,把推理速度拉到了 150 tokens/秒,成本壓到了每百萬(wàn) token 輸入 0.1 美元、輸出 0.3 美元,主打一個(gè)超絕性?xún)r(jià)比。


從官方提供的頁(yè)面來(lái)看,MiMo-V2-Flash 支持深度思考和聯(lián)網(wǎng)搜索功能,這意味著它不僅能寫(xiě)代碼、解數(shù)學(xué)題,還能實(shí)時(shí)獲取最新信息。


附上AI Studio 體驗(yàn)地址:
http://aistudio.xiaomimimo.com

開(kāi)源模型新標(biāo)桿,SWE-Bench 霸榜開(kāi)源第一

老規(guī)矩,咱們先來(lái)看看 MiMo-V2-Flash 的跑分環(huán)節(jié)。

在數(shù)學(xué)推理方面,AIME 2025 數(shù)學(xué)競(jìng)賽和 GPQA-Diamond 科學(xué)知識(shí)測(cè)試中,MiMo-V2-Flash 都排在開(kāi)源模型前兩名。

編程能力更是亮眼,SWE-bench Verified 得分 73.4%,超越所有開(kāi)源模型,直逼 GPT-5-High。做個(gè)簡(jiǎn)單科普,這個(gè)測(cè)試是讓 AI 去修真實(shí)世界的軟件 bug,73.4% 的成功率意味著它能搞定大部分實(shí)際編程問(wèn)題。


多語(yǔ)言編程基準(zhǔn)測(cè)試 SWE-Bench Multilingual 解決率 71.7%,智能體任務(wù)上,MiMo-V2-Flash 在τ2-Bench 分類(lèi)得分中,通信類(lèi) 95.3 分,零售類(lèi) 79.5 分,航空類(lèi) 66.0 分。

BrowseComp 搜索代理得分 45.4,啟用上下文管理后直接飆到 58.3。

這些數(shù)據(jù)說(shuō)明,MiMo-V2-Flash 不僅會(huì)寫(xiě)代碼,還能真正理解復(fù)雜任務(wù)邏輯,執(zhí)行多輪智能體交互。長(zhǎng)文本能力也沒(méi)拉胯,實(shí)測(cè)表現(xiàn)甚至超越了體量更大的 Kimi-K2 Thinking,證明混合滑動(dòng)窗口注意力架構(gòu)的長(zhǎng)程建模能力確實(shí)強(qiáng)悍。


寫(xiě)作質(zhì)量也接近頂級(jí)閉源模型,這意味著 MiMo-V2-Flash 不只是個(gè)工具,還能當(dāng)個(gè)靠譜的日常助手。

長(zhǎng)文本性能不打折,成本降 6 倍的秘密

MiMo-V2-Flash 最核心的創(chuàng)新是混合滑動(dòng)窗口注意力。

傳統(tǒng)大模型處理長(zhǎng)文本時(shí),全局注意力機(jī)制會(huì)導(dǎo)致計(jì)算量二次爆炸,存儲(chǔ)中間結(jié)果的 KV 緩存也跟著飆升。小米這次采用了 5 比 1 的激進(jìn)比例,5 層滑動(dòng)窗口注意力搭配 1 層全局注意力交替使用,滑動(dòng)窗口只看 128 個(gè) token。

(考慮到有朋友不太了解 AI,簡(jiǎn)單科普一下:「token」(中文常譯作「詞元」)在大模型/自然語(yǔ)言處理里,指的是模型讀入和輸出文字時(shí)使用的最小計(jì)數(shù)單位。模型并不是按「一個(gè)漢字=1、一個(gè)英文單詞=1」這樣固定地?cái)?shù),而是把文本切成一段段 token 來(lái)處理。)

簡(jiǎn)單說(shuō)就是,模型不用每次都看全部?jī)?nèi)容,只看最近 128 個(gè) token,偶爾看一次全局,這樣計(jì)算量和存儲(chǔ)都能大幅下降。這種設(shè)計(jì)讓 KV 緩存存儲(chǔ)量直接減少了近 6 倍,但長(zhǎng)文本能力卻沒(méi)打折扣,最長(zhǎng)支持 256k 上下文窗口。


關(guān)鍵是小米還整了個(gè)「可學(xué)習(xí)的注意力匯入偏置」,其的用是讓模型即使在這么激進(jìn)的窗口設(shè)置下,照樣能穩(wěn)住長(zhǎng)文本性能。

羅福莉在社交平臺(tái)上特別強(qiáng)調(diào),窗口大小 128 被證明是「最佳數(shù)值」,而 512 反而會(huì)導(dǎo)致性能下降。這個(gè)發(fā)現(xiàn)挺反直覺(jué)的,你會(huì)覺(jué)得窗口越大越好,但實(shí)際測(cè)下來(lái) 128 才是甜點(diǎn)。另外,sink 值(attention sink values)必不可少,絕對(duì)不要省略它們。

另一個(gè)黑科技是輕量級(jí)多 Token 預(yù)測(cè) (MTP)。

傳統(tǒng)模型生成文本時(shí)一次只能吐一個(gè) token,就像打字員一個(gè)字一個(gè)字敲。MiMo-V2-Flash 通過(guò)原生集成的 MTP 模塊,能并行預(yù)測(cè)多個(gè) token,一次性猜出接下來(lái)好幾個(gè) token。

實(shí)測(cè)平均能接受 2.8 到 3.6 個(gè) token,推理速度直接提升 2 到 2.6 倍,不僅在推理時(shí)管用,訓(xùn)練階段也能加速采樣,減少 GPU 空轉(zhuǎn),屬于一箭雙雕。


羅福莉提到,在三層 MTP 設(shè)置下,他們觀察到平均接受長(zhǎng)度超過(guò) 3,編碼任務(wù)速度提升約 2.5 倍。它有效解決了小批量 On-Policy 強(qiáng)化學(xué)習(xí)中「長(zhǎng)尾樣本」帶來(lái)的 GPU 空閑時(shí)間浪費(fèi)問(wèn)題。

啥叫長(zhǎng)尾樣本?就是那些特別難、特別慢的任務(wù),拖著其他任務(wù)一起等,GPU 就在那干瞪眼。MTP 把這個(gè)問(wèn)題給解了,效率直接起飛。

不過(guò)羅福莉也坦誠(chéng),這次因?yàn)闀r(shí)間緊迫沒(méi)能把 MTP 完整集成進(jìn) RL 訓(xùn)練循環(huán),但它與該流程高度契合。小米已經(jīng)把三層 MTP 開(kāi)源了,方便大家在自己的項(xiàng)目中使用與開(kāi)發(fā)。

算力只用 1/50,性能如何不打折?

預(yù)訓(xùn)練階段,新模型使用 FP8 混合精度,在 27 萬(wàn)億 token 數(shù)據(jù)上完成訓(xùn)練,原生支持 32k 序列長(zhǎng)度。

FP8 混合精度是一種壓縮數(shù)值表示的技術(shù),能在保持精度的同時(shí)減少顯存占用和加速訓(xùn)練。這種訓(xùn)練方式在業(yè)界并不常見(jiàn),需要對(duì)底層框架進(jìn)行深度優(yōu)化。

而在后訓(xùn)練階段,小米整了個(gè)大活,提出了多教師在線(xiàn)策略蒸餾 (MOPD)。

傳統(tǒng)的監(jiān)督微調(diào)加強(qiáng)化學(xué)習(xí)管線(xiàn),不僅訓(xùn)練不穩(wěn)定,算力消耗還賊高。MOPD 的思路是讓學(xué)生模型在自己的策略分布上采樣,然后由多個(gè)專(zhuān)家教師在每個(gè) token 位置提供密集的獎(jiǎng)勵(lì)信號(hào)。


通俗點(diǎn)說(shuō)就是,學(xué)生模型自己寫(xiě)作業(yè),老師在每個(gè)字上都給評(píng)分,不用等寫(xiě)完整篇才打分。這樣一來(lái),學(xué)生模型能快速?gòu)慕處熌抢飳W(xué)到精髓,而且訓(xùn)練過(guò)程穩(wěn)定得多。

最夸張的是效率提升,MOPD 只需要傳統(tǒng)方法 1/50 的算力,就能讓學(xué)生模型達(dá)到教師性能峰值。這意味著小米能用更少的資源,更快地迭代模型。

而且 MOPD 支持靈活接入新教師,學(xué)生模型成長(zhǎng)后還能反過(guò)來(lái)當(dāng)教師,形成「教與學(xué)」的閉環(huán)自我進(jìn)化。今天的學(xué)生,明天的老師,后天又能教出更強(qiáng)的學(xué)生,套娃玩法屬實(shí)有點(diǎn)東西。

用羅福莉的話(huà)來(lái)說(shuō),他們借鑒 Thinking Machine 的 On-Policy Distillation 方法,將多個(gè)強(qiáng)化學(xué)習(xí)模型進(jìn)行融合,結(jié)果帶來(lái)了驚人的效率提升。這為構(gòu)建一個(gè)自我強(qiáng)化循環(huán)系統(tǒng)奠定了基礎(chǔ),學(xué)生模型可以逐步進(jìn)化,最終成為更強(qiáng)的教師模型。


在智能體強(qiáng)化學(xué)習(xí)擴(kuò)展上,小米 MiMo-V2-Flash 研究團(tuán)隊(duì)基于真實(shí) GitHub issue 構(gòu)建了超過(guò) 10 萬(wàn)個(gè)可驗(yàn)證任務(wù),自動(dòng)化流水線(xiàn)跑在 Kubernetes 集群上,并發(fā)能開(kāi) 10000 多個(gè) Pod,環(huán)境部署成功率 70%。

針對(duì)網(wǎng)頁(yè)開(kāi)發(fā)任務(wù),還專(zhuān)門(mén)搞了個(gè)多模態(tài)驗(yàn)證器,通過(guò)錄制視頻而非靜態(tài)截圖來(lái)驗(yàn)證代碼執(zhí)行結(jié)果,直接減少視覺(jué)幻覺(jué),確保功能正確。

對(duì)于開(kāi)發(fā)者而言,MiMo-V2-Flash 能與 Claude Code、Cursor、Cline 等主流開(kāi)發(fā)環(huán)境無(wú)縫配合,256k 的超長(zhǎng)上下文窗口支持?jǐn)?shù)百輪智能體交互與工具調(diào)用。

256k 是什么概念? 大概相當(dāng)于一本中等篇幅的小說(shuō),或者幾十頁(yè)技術(shù)文檔。這意味著開(kāi)發(fā)者可以把 MiMo-V2-Flash 直接融入現(xiàn)有工作流,不需要額外適配,拿來(lái)就用。

小米還把所有推理代碼貢獻(xiàn)給了 SGLang,并在 LMSYS 博客分享了推理優(yōu)化經(jīng)驗(yàn)。

技術(shù)報(bào)告公開(kāi)了完整模型細(xì)節(jié),模型權(quán)重 (包括 MiMo-V2-Flash-Base) 在 Hugging Face 上以 MIT 許可協(xié)議發(fā)布。這種全面開(kāi)源的態(tài)度,在國(guó)內(nèi)大廠里屬實(shí)少見(jiàn)。

目前 MiMo-V2-Flash 已經(jīng)在 API Platform 限時(shí)免費(fèi)開(kāi)放,開(kāi)發(fā)者可以直接上手體驗(yàn)。


小米的 AI 野心,不止于手機(jī)助手

MiMo-V2-Flash 的發(fā)布,標(biāo)志著小米在 AI 賽道上的全面發(fā)力。

羅福莉在社交平臺(tái)上透露了更多信息,「MiMo-V2-Flash 已正式上線(xiàn)。這只是我們 AGI 路線(xiàn)圖上的第二步?!沟诙骄鸵呀?jīng)這么猛了,那后面還有啥大招?想想就有點(diǎn)期待。

當(dāng)然,小米在技術(shù)報(bào)告中也坦誠(chéng),MiMo-V2-Flash 與最強(qiáng)的閉源模型相比仍有差距。但他們的計(jì)劃很明確,通過(guò)擴(kuò)大模型規(guī)模與訓(xùn)練算力來(lái)縮小差距,同時(shí)繼續(xù)探索更穩(wěn)健、更高效的智能體架構(gòu)。

MOPD 框架下教師模型與學(xué)生模型的迭代共進(jìn)化,也為未來(lái)的能力提升留足了空間。

把視角拉高來(lái)看,背后是小米對(duì)整個(gè) AI 生態(tài)的一次戰(zhàn)略押注。手機(jī)、IoT、汽車(chē),小米的硬件生態(tài)需要一個(gè)強(qiáng)大的 AI 底座,MiMo-V2-Flash 顯然就是小米為全硬件生態(tài)準(zhǔn)備的那塊基石。

就像十年前小米手機(jī)用 1999 元重新定義了旗艦機(jī)的價(jià)格標(biāo)準(zhǔn),如今 MiMo-V2-Flash 正在用 0.1 美元/百萬(wàn) token 的成本、73.4% 的 SWE-Bench 得分,重新定義開(kāi)源大模型的性能標(biāo)準(zhǔn)。

這一次,屬于開(kāi)源模型的「小米時(shí)刻」真的來(lái)了。

HuggingFace 模型地址:
http://hf.co/XiaomiMiMo/MiMo-V2-Flash
技術(shù)報(bào)道地址:
http://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
回天乏術(shù)!衛(wèi)星圖像證實(shí)俄潛艇遭重創(chuàng):碼頭現(xiàn)9米混凝土彈坑!

回天乏術(shù)!衛(wèi)星圖像證實(shí)俄潛艇遭重創(chuàng):碼頭現(xiàn)9米混凝土彈坑!

軍迷戰(zhàn)情室
2025-12-17 21:26:46
不要做“精神芬蘭人”,哪怕他們坐商務(wù)艙

不要做“精神芬蘭人”,哪怕他們坐商務(wù)艙

觀察者網(wǎng)
2025-12-18 13:55:08
網(wǎng)傳宋丹丹年輕時(shí)曾追求過(guò)許亞軍,端著飯盒追,卻還是被對(duì)方拒絕

網(wǎng)傳宋丹丹年輕時(shí)曾追求過(guò)許亞軍,端著飯盒追,卻還是被對(duì)方拒絕

小徐講八卦
2025-12-19 12:08:43
社會(huì)主義中國(guó)不能允許如此大規(guī)模當(dāng)?shù)?>
    </a>
        <h3>
      <a href=凱利經(jīng)濟(jì)觀察
2025-12-18 09:35:23
足協(xié)一抓就差!U15東亞杯從4-2到0-3:恒大足校含金量嗖嗖往上升

足協(xié)一抓就差!U15東亞杯從4-2到0-3:恒大足校含金量嗖嗖往上升

足球大腕
2025-12-18 20:30:12
奔馳搭載吉利發(fā)動(dòng)機(jī) 中國(guó)動(dòng)力首次搭上德系車(chē)

奔馳搭載吉利發(fā)動(dòng)機(jī) 中國(guó)動(dòng)力首次搭上德系車(chē)

中車(chē)網(wǎng)評(píng)
2025-12-18 08:42:48
日本當(dāng)紅女星深田恭子,婚前背叛富豪男友,出軌著名導(dǎo)演共度春宵

日本當(dāng)紅女星深田恭子,婚前背叛富豪男友,出軌著名導(dǎo)演共度春宵

我真的服
2025-12-19 15:16:10
出嫁前3天彩禮漲到28.8萬(wàn)后續(xù):男方堅(jiān)持退婚,女子曝光已社死

出嫁前3天彩禮漲到28.8萬(wàn)后續(xù):男方堅(jiān)持退婚,女子曝光已社死

千言?shī)蕵?lè)記
2025-12-13 18:34:13
雷達(dá)數(shù)據(jù)顯示美軍戰(zhàn)機(jī)在委內(nèi)瑞拉首都附近空域活動(dòng)

雷達(dá)數(shù)據(jù)顯示美軍戰(zhàn)機(jī)在委內(nèi)瑞拉首都附近空域活動(dòng)

極目新聞
2025-12-19 12:40:19
照片曝光!尹錫悅曾修建“秘密通道”掩蓋“上班遲到”,此前他多次被批“上班遲到下班卡點(diǎn)”、一個(gè)月曾遲到10次

照片曝光!尹錫悅曾修建“秘密通道”掩蓋“上班遲到”,此前他多次被批“上班遲到下班卡點(diǎn)”、一個(gè)月曾遲到10次

極目新聞
2025-12-19 10:33:43
印度首富300斤兒子款待梅西,邀球星去動(dòng)物園,漂亮妻胯是真寬

印度首富300斤兒子款待梅西,邀球星去動(dòng)物園,漂亮妻胯是真寬

觀察鑒娛
2025-12-18 09:33:39
黃牛加價(jià),排隊(duì)5小時(shí)!二三十塊一個(gè)面包貴不貴?

黃牛加價(jià),排隊(duì)5小時(shí)!二三十塊一個(gè)面包貴不貴?

揚(yáng)子晚報(bào)
2025-12-19 15:20:32
2026年慢病新規(guī)!對(duì)60/80歲以上老人開(kāi)藥有精準(zhǔn)傾斜

2026年慢病新規(guī)!對(duì)60/80歲以上老人開(kāi)藥有精準(zhǔn)傾斜

慧眼看世界哈哈
2025-12-17 05:55:37
僅26歲帥哥睡夢(mèng)中離世,開(kāi)奔馳家境好,媽媽含淚:8點(diǎn)發(fā)現(xiàn)人沒(méi)了

僅26歲帥哥睡夢(mèng)中離世,開(kāi)奔馳家境好,媽媽含淚:8點(diǎn)發(fā)現(xiàn)人沒(méi)了

鋭娛之樂(lè)
2025-12-19 08:16:38
搶手!中國(guó)男足4大悍將轉(zhuǎn)會(huì),1人曾打服日本球隊(duì),如今成自由球員

搶手!中國(guó)男足4大悍將轉(zhuǎn)會(huì),1人曾打服日本球隊(duì),如今成自由球員

國(guó)足風(fēng)云
2025-12-19 16:00:14
全家移民真相大白2年,享正師級(jí)待遇的潘長(zhǎng)江,已走上另一條大道

全家移民真相大白2年,享正師級(jí)待遇的潘長(zhǎng)江,已走上另一條大道

以茶帶書(shū)
2025-08-07 19:42:40
米體:國(guó)米已前往沙特,小因扎吉希望與國(guó)米球員及管理層會(huì)面

米體:國(guó)米已前往沙特,小因扎吉希望與國(guó)米球員及管理層會(huì)面

懂球帝
2025-12-18 20:11:26
真正厲害的女人,一生“三不管”:不管男人、不管閑事、不管過(guò)往

真正厲害的女人,一生“三不管”:不管男人、不管閑事、不管過(guò)往

真實(shí)人物采訪
2025-12-17 21:00:03
21號(hào)就是冬至了!為什么說(shuō)今年的冬至可不一般,60年一遇?

21號(hào)就是冬至了!為什么說(shuō)今年的冬至可不一般,60年一遇?

阿天愛(ài)旅行
2025-12-17 00:16:32
6位鑒定專(zhuān)家均過(guò)世,南博事件陷入死結(jié)

6位鑒定專(zhuān)家均過(guò)世,南博事件陷入死結(jié)

梳子姐
2025-12-19 13:01:25
2025-12-19 17:28:49
愛(ài)范兒 incentive-icons
愛(ài)范兒
消費(fèi)科技第一媒體
38193文章數(shù) 2600419關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

美批準(zhǔn)對(duì)臺(tái)逾111億美元軍售 國(guó)防部回應(yīng)

頭條要聞

美批準(zhǔn)對(duì)臺(tái)逾111億美元軍售 國(guó)防部回應(yīng)

體育要聞

“惡龍”埃托奧,正在毀滅喀麥隆足球

娛樂(lè)要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財(cái)經(jīng)要聞

非法集資911億!"金融大鱷"終審被判無(wú)期

汽車(chē)要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

時(shí)尚
健康
本地
親子
公開(kāi)課

女友BELLA+封面 | Jimmy&Ohm:人生拼圖

這些新療法,讓化療不再那么痛苦

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

親子要聞

金寶貝獲“2025年度綜合實(shí)力兒童教育品牌”引領(lǐng)科學(xué)早教創(chuàng)新實(shí)踐

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版