国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

羅福莉首秀前,小米突然發(fā)布!代碼全球最強,總體媲美DeepSeek-V3.2【附實測】

0
分享至


智東西
作者 程茜
編輯 李水青

智東西12月17日報道,今天,小米發(fā)布并開源了最新MoE大模型MiMo-V2-Flash,總參數(shù)309B,激活參數(shù)15B。今日上午,小米2025小米人車家全生態(tài)合作伙伴大會上,Xiaomi MiMO大模型負責人羅福莉將首秀并發(fā)布主題演講。


該模型專為推理、編碼和Agent場景構建,支持混合思維模式,允許用戶切換模型是“思考”還是即時回答。它能一鍵生成功能齊全的HTML網頁,并與Claude Code、Cursor和Cline等氛圍編碼框架協(xié)同。該模型提供256k上下文窗口,能夠完成數(shù)百輪Agent交互和工具調用的任務。

基準測試結果顯示,MiMo-V2-Flash的性能基本與DeepSeek-V3.2相當,僅在不使用任何工具輔助的“人類最后一場考試”和創(chuàng)意文本生成評估ARENA-HARD中略遜色于DeepSeek-V3.2,但時延更小。


MiMo-V2-Flash能以每秒150個token的速度實現(xiàn)極其快速的推理,價格方面,其每百萬輸入token 0.7元、每百萬輸出token 2.1元。


小米已經開源了MiMo-V2-Flash所有內容,并向開發(fā)者社區(qū)SGLang貢獻了所有推理代碼,API限時免費。目前,用戶可以在網頁端免費體驗MiMo-V2-Flash。

開源地址:https://t.co/4Etm0yZKTL

體驗地址:https://aistudio.xiaomimimo.com/#/

技術報告:https://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf

一、能寫長文、做精美網頁,但實測尚不穩(wěn)定

智東西先實測了下MiMo的網頁開發(fā)能力。

首先,智東西讓其生成了一個電商頁面,需要包含商品主圖輪播、規(guī)格選擇、價格、庫存等要素。代碼生成后,MiMo會在右側顯示預覽界面,除查看商品大圖功能需要在完整版使用,其他元素幾乎和真實的線上購物沒有差別。


然后加大難度,智東西讓其生成了一個網頁版迷宮闖關小游戲,需要包含四個難度,能通過鼠標和鍵盤控制。在生成的網頁里,MiMo還增加了提示、積分、計時等功能,整個交互體驗更加完整。


智東西還讓其生成了“圣誕樹裝飾”交互網頁。網頁左側有彩燈、鈴鐺、星星、禮物盒、蝴蝶結,可以拖動這些物品裝飾到右側的圣誕樹上,也可以一鍵清空或者直接生成隨機裝飾。整個畫面會不斷飄落雪花,還可以播放背景音樂。


對于聊天能力,智東西先讓MiMo“用程序員的語氣安慰一只失戀的貓”,MiMo會讓小貓“清理緩存”忘掉不開心的事,還讓小貓“升級硬件”,順便幫小米打了波廣告。


最后智東西讓MiMo生成了一部科幻懸疑題材的AI短劇劇本。一上來,MiMo就給出了深潛記憶提取頭盔、真理之環(huán)AI倫理防火墻兩個關鍵要素,通過檢索發(fā)現(xiàn),MiMo在后續(xù)劇情中將這兩大物體融入進去,直接作為推動劇情發(fā)展的關鍵。


此外,小米在官方博客也放出了不少案例。

首先是網頁生成能力上,其第一個官方案例是“用HTML生成一個漂亮、可用的macOS模擬操作系統(tǒng)”。在最終的生成界面中,包含了基本的macOS風格桌面圖標,還可以切換背景、打開Finder。


其次是,打造“豪華互動圣誕樹”高保真3D網頁應用,并要求視覺效果奢華,MiMo的生成結果能切換圣誕樹和混沌狀態(tài),支持手勢交互等。


第三個演示是用HTML創(chuàng)建交互式太陽系探測器。當用戶點擊每個球體就會出現(xiàn)行星的簡介。


智東西也讓MiMo“用HTML創(chuàng)建一個教育性的交互式太陽系探索器”,不過最后的結果并不如官方演示的質感。其第一次生成時行星無法選擇,重新生成后可選擇行星下面的選項直接不見了。


聊天能力方面,MiMo既能回答“大語言模型擁有知識嗎”這類硬核科普類知識。


MiMo還可以回答“要不要吃長生不老藥丸”,MiMo還會站在人類視角分析要不要吃、可能有哪些條件。


此外,該模型還具備長文本撰寫能力,其可以“寫一個關于誤送信件的憂郁愛情故事”。


MiMo還能寫深刻的非虛構作品,如以一位獨居老人為中心,以他一周內收到的郵件為主,探討現(xiàn)代社會中的孤獨。


二、專為推理、編碼和Agent構建,與K2 Thinking和DeepSeek V3.2 Thinking相當

在數(shù)學競賽AIME 2025和科學知識基準GPQA-Diamond中,MiMo-V2-Flash的表現(xiàn)是開源模型中前二。在軟件工程能力的SWE驗證與多語言基準測試中,MiMo-V2-Flash在所有開源模型中位列第一,與全球頂尖閉源模型齊名。

從總的基準測試結果來看,MiMo-V2-Flash在大多數(shù)推理基準測試中的性能可與K2 Thinking和DeepSeek V3.2 Thinking相當,同時保持高質量開放式回答的競爭力。

在長上下文評估中,MiMo的模型超過了K2 Thinking。


在Agent任務中,MiMo-V2-Flash在SWE-Bench Verified中超越所有開源競爭對手,性能接近 GPT-5-High。在SWE-Bench多語版本中,MiMo-V2-Flash解決了71.7%的問題。

在搜索Agent評估方面,MiMo-V2-Flash在BrowseComp上得分為45.4,配合上下文管理進一步提升至58.3。


小米已經共享所有推理代碼至SGLang并開源,社區(qū)實測單機結果如下:

在Prefill單機吞吐約50000 toks/s的條件下,不同Context Length都取得了優(yōu)越的TTFT性能。


得益于3層MTP,在16K的Context Length情況下,Decode可以做到單機吞吐5000 ~ 15000 toks/s的同時達到151~115 toks/s的單請求吞吐。


三、引入MTP訓練,后訓練階段提出MOPD

MiMo-V2-Flash的效率提升是因為其為高通量推理設計了創(chuàng)新架構進步。

該模型全局注意力(GA)和滑動窗口注意力(SWA)的1:5混合結構。小米MiMo研究團隊大量的實證結果表明,SWA簡單、高效且易于使用,在通用任務、長上下文負載和推理方面整體表現(xiàn)優(yōu)于線性注意力。


它還提供固定大小的KV緩存,便于與現(xiàn)有的訓練和推理基礎設施集成。

研究人員重新定義了并行解碼,以實現(xiàn)極高的輸出token吞吐量:通過引入多詞元預測(MTP)訓練,提升了基礎模型的能力,并在推理過程中并行驗證了MTP。


MiMo-V2-Flash利用MTP作為原生草稿模型進行自我推測解碼,實現(xiàn)了實際部署加速。

大語言模型的解碼過程本質上受限于內存,這是由其低運算密度特性決定的。業(yè)界通常采用批量級并行技術提升前饋網絡(FFN)的運算密度,但該方法對注意力計算環(huán)節(jié)并無增益,原因在于每個推理請求都需維護獨立的KV cache。

相比之下,MTP技術通過一次性生成多個草稿token,同步提升了前饋網絡(FFN)與注意力機制的運算密度,后續(xù)主模型可對這些草稿token進行并行驗證。這種方案能夠實現(xiàn)token級并行計算,且不會增加KV cache的輸入輸出開銷。

在MiMo-V2-Flash模型中,MTP模塊采用稠密前饋網絡來控制參數(shù)量,同時使用滑動窗口注意力機制,從而降低KV cache與注意力計算的成本。

實測數(shù)據(jù)顯示,3層結構的MTP模塊可達到2.8-3.6個token的有效接受長度,并實現(xiàn)2.0-2.6倍的推理速度提升。


MiMo-V2-Flash預訓練使用FP8混合精度和原生32k序列長度,使用27T token進行訓練。

在后訓練階段,為高效拓展強化學習的計算規(guī)模,同時增強模型的推理能力與智能體自主決策能力,研究人員提出了多教師在線策略蒸餾(MOPD)。

該范式先通過監(jiān)督微調(SFT)或強化學習(RL)技術得到各領域的專家教師模型,再讓學生模型基于自身的策略分布進行采樣,并利用多個教師模型提供的稠密型token級獎勵信號完成優(yōu)化。

MOPD訓練只需不到傳統(tǒng)SFT+RL流程的1/50計算資源,即可匹配教師模型的峰值表現(xiàn)。

此外,MOPD采用解耦設計,支持新教師與ORM(教學與學習)的靈活整合,自然實現(xiàn)“教學與學習”閉環(huán)迭代,精煉學生模式可演變?yōu)楦鼜姷慕處煟瑢崿F(xiàn)持續(xù)自我提升的能力。


結語:小米大模型研發(fā)踩下油門

小米憑借混合注意力機制與MOPD等技術創(chuàng)新,大幅優(yōu)化大模型的研發(fā)成本與運行效率;同時開源全部相關成果,有效降低行業(yè)研發(fā)門檻。此外,近幾個月以來,Xiaomi MiMo大模型團隊踩下油門,發(fā)布數(shù)篇論文并開源多個模型。

12月5日,小米集團合伙人、總裁盧偉冰透露,公司AI大模型業(yè)務過去四個季度投入環(huán)比增速超50%,目前進展“已超出董事會預期”,并宣布將AI與“現(xiàn)實世界深度結合”列為未來十年核心戰(zhàn)略。同時,小米正式啟動全球人才招募計劃,單崗位薪酬上限開至千萬元級別,目標“在最短時間內補齊大模型尖端人才缺口”。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“灣里”今天試營業(yè)!最全交通攻略請查收→

“灣里”今天試營業(yè)!最全交通攻略請查收→

首都之窗
2025-12-19 17:52:36
一種讓你變老又頭禿的飲料,很多人天天在喝!

一種讓你變老又頭禿的飲料,很多人天天在喝!

貓大夫醫(yī)學科普
2025-12-19 06:47:52
幾十萬港人涌入廣東買社保!釋放重要信號,背后真相不簡單

幾十萬港人涌入廣東買社保!釋放重要信號,背后真相不簡單

毒sir財經
2025-12-18 23:38:22
福建艦進入臺灣海峽,臺軍方下令:若遭遇突襲,無需命令即可作戰(zhàn)

福建艦進入臺灣海峽,臺軍方下令:若遭遇突襲,無需命令即可作戰(zhàn)

博覽歷史
2025-12-18 18:19:16
普京:俄方愿在烏克蘭選舉期間暫時停止打擊

普京:俄方愿在烏克蘭選舉期間暫時停止打擊

新京報
2025-12-19 21:48:02
警報拉響!澤連斯基曝俄軍接正式命令:正將2026年定為“戰(zhàn)爭年”

警報拉響!澤連斯基曝俄軍接正式命令:正將2026年定為“戰(zhàn)爭年”

科普100克克
2025-12-19 17:24:10
如果他活著,世上本無大明朝,一代梟雄為何竟然死于小人之手?

如果他活著,世上本無大明朝,一代梟雄為何竟然死于小人之手?

長風文史
2025-12-18 16:25:38
新冷空氣馬上到!廣州只降溫,不下雨

新冷空氣馬上到!廣州只降溫,不下雨

廣州交通電臺
2025-12-19 13:19:23
年輕就是最大的資本,拜仁17歲小將卡爾身價暴漲至6000萬歐元!

年輕就是最大的資本,拜仁17歲小將卡爾身價暴漲至6000萬歐元!

田先生籃球
2025-12-19 21:34:01
破紀錄!武漢人度過65年來12月中旬最暖的一天!今晚起氣溫滿20-10,今冬最冷時段即到!

破紀錄!武漢人度過65年來12月中旬最暖的一天!今晚起氣溫滿20-10,今冬最冷時段即到!

極目新聞
2025-12-19 19:01:05
25年能量人物評選來了,孫穎莎票數(shù)暴跌至第二,王楚欽僅300萬

25年能量人物評選來了,孫穎莎票數(shù)暴跌至第二,王楚欽僅300萬

好賢觀史記
2025-12-19 17:26:20
澤連斯基:美一開始就沒答應烏加入北約

澤連斯基:美一開始就沒答應烏加入北約

財聯(lián)社
2025-12-19 18:37:37
注意!河南一地多區(qū)縣發(fā)布煙花爆竹禁燃禁放公告

注意!河南一地多區(qū)縣發(fā)布煙花爆竹禁燃禁放公告

大象新聞
2025-12-19 09:17:01
日媒:對于日本是否會修改“無核三原則”,小泉進次郎在追問下宣稱“不排除任何選項”

日媒:對于日本是否會修改“無核三原則”,小泉進次郎在追問下宣稱“不排除任何選項”

環(huán)球網資訊
2025-12-19 19:21:07
男女互相惦記的8個信號,出現(xiàn)3個就是雙向心動,看看你中了幾個!

男女互相惦記的8個信號,出現(xiàn)3個就是雙向心動,看看你中了幾個!

朗威談星座
2025-12-19 12:54:39
山西省委原書記胡富國同志簡歷

山西省委原書記胡富國同志簡歷

社評
2025-12-18 16:47:11
1月日子不再苦,貴人也來提攜,幸福降臨,運勢走上上簽

1月日子不再苦,貴人也來提攜,幸福降臨,運勢走上上簽

人閒情事
2025-12-19 20:53:17
實錘了!龐萊臣捐贈藏品果然被拍賣了,一幅畫2014年被拍賣230萬

實錘了!龐萊臣捐贈藏品果然被拍賣了,一幅畫2014年被拍賣230萬

火山詩話
2025-12-19 14:26:47
并非迷信!明日冬月初一,牢記:1不早、2不做、3不搬、4不吃

并非迷信!明日冬月初一,牢記:1不早、2不做、3不搬、4不吃

阿龍美食記
2025-12-19 15:14:19
大鵬回憶與師父趙本山往事:曾幫自己向張朝陽爭取收入

大鵬回憶與師父趙本山往事:曾幫自己向張朝陽爭取收入

快科技
2025-12-19 14:36:09
2025-12-19 22:23:00
智東西 incentive-icons
智東西
聚焦智能變革,服務產業(yè)升級。
10945文章數(shù) 116929關注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

普京:西方“通過烏克蘭的手”同俄作戰(zhàn)

頭條要聞

普京:西方“通過烏克蘭的手”同俄作戰(zhàn)

體育要聞

“惡龍”埃托奧,正在毀滅喀麥隆足球

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔心的事還是發(fā)生

財經要聞

日元加息,恐慌來了?貨幣三國殺

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

數(shù)碼
手機
藝術
家居
軍事航空

數(shù)碼要聞

TCL首款基于開源鴻蒙的智慧健康空調小藍翼P7 Ultra發(fā)布

手機要聞

別掙扎了!小屏旗艦注定無法“沸騰”

藝術要聞

諸樂三的寫意花鳥

家居要聞

高端私宅 理想隱居圣地

軍事要聞

媒體:美方官宣史上對臺單筆最大軍售 野心藏不住了

無障礙瀏覽 進入關懷版