国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

我們拷打了小米最新大模型:全模態(tài)很驚艷,但聯網檢索仍是短板

0
分享至

4月23日,小米MiMo V2.5系列模型開啟公測。根據官方介紹,該系列模型具有更強的推理能力、更穩(wěn)定的Agent。

另外,它還有多模態(tài)感知能力,不僅能看懂文本,還能理解圖片、音頻等信息。而且,在Artificial Analysis榜單中,Xiaomi MiMo-V2.5-Pro綜合智能指數位列全球開源大模型第一。



(圖源:小米)

既然小米這款大模型能力這么強,我們就來實際測試一下,看看它在哪些場景下有出色的表現,同時又有哪些要改進的地方。

MiMo V2.5實測:模型能力很強,聯網檢索稍弱

目前,MiMo V2.5系列已經開放公測,所有小米用戶都能在MiMo官網直接體驗MiMo V2.5、MiMo V2.5 Pro等模型產品。

網頁端這種使用場景不能百分百發(fā)揮出大模型的潛力,但作為摸底考試來說問題不大。我們結合日常實際使用習慣,通過五個具體案例,來看看MiMo V2.5的真實實力。

案例一:文章總結

長文概括總結基本是當下主流大模型的基礎能力,作為這次實測的開胃菜再合適不過了。

我們把雷科技(ID:leitech)最近寫的一篇關于ChatGPT Images 2.0評測的圖文內容鏈接丟給它分析, MiMo V2.5 Pro的反應很迅速,2秒鐘就生成了結果。它對文章內容的概括非常準確,把文章中針對ChatGPT Images 2.0的優(yōu)缺點評價都提煉了出來。



(圖源:雷科技)

當然,這只是基本功,主流大模型一般都能比較好地完成這項任務,接下來我們就要加大力度了。

案例二:盤點一下小米2025年發(fā)布過的手機型號

這個問題主要考驗的是MiMo-V2.5 Pro的信息聯網檢索能力,坦率說,它表現得比較一般。

首先,MiMo-V2.5 Pro羅列出的小米15系列是2024年發(fā)布的,并不是2025年的機型。



(圖源:雷科技)

查看其信息來源后,我們發(fā)現它是被一篇博客文章誤導了,這篇博文羅列了多款小米手機發(fā)布時間,但很多是錯的,甚至很有可能本身也是AI生成的。



(顯示錯誤信息的網頁,圖源:雷科技)

其次,不少機型被遺漏了,比如最重要的小米17系列。另外,它還出現了一些錯誤,MiMo-V2.5 Pro在檢索了早期的爆料信息后,誤以為小米15S Pro還沒發(fā)布,但實際上它就是一款2025年發(fā)布的機型。



(圖源:雷科技)

當然,圍繞這個問題,其他大模型的表現也都很難稱得上完美。公認聯網搜索能力很強的Gemini 3.1 Pro就翻車了,它出現嚴重幻覺,居然虛構出了小米16系列。而DeepSeek反而是表現相對較好的,把小米和紅米機型基本都盤點全了,還顧及到了很多大模型忽略的海外品牌POCO,當然它也遺漏了小米15S Pro。



(圖源:雷科技)

案例三:去洗車店洗車應該走路去還是開車去?

這是之前非常經典的「忽悠」大模型的問題,曾經ChatGPT等知名模型都翻車了,它主要考驗的就是模型本身的邏輯推理能力。一個在真人看來很簡單的邏輯題,但對沒有針對性做過訓練的大模型來說,就很容易掉坑里。

面對這個問題,MiMo V2.5 Pro沒有被繞進去,而是直接了當地指出了關鍵:要洗的是車,不是人,洗車的前提是車必須得過去。



(圖源:雷科技)

案例四:幫我看看醫(yī)院的檢驗報告

MiMo V2.5有一個重要亮點就是支持多模態(tài),根據官方介紹,它在文本和代碼之外,還支持圖像、視頻和語音(MiMo V2.5 Pro暫不支持)。所以,我們可以以圖片等多媒體文件的形式進行輸入。實際體驗中,我找了一張醫(yī)院檢查的圖片給它,MiMo V2.5很快識別出了是哪項檢查,并且結合獲取到的數據,給出了具體的結論和建議。



(圖源:雷科技)

另外,普通的照片也能丟給它,比如我塞給它一張很模糊的、logo被遮擋的Switch圖片,MiMo-V2.5準確識別出了它是Switch,并且表示是OLED版。

這項功能放在具體的終端設備上的話,可以進一步拓展使用場景,比如手機打開相機就能把畫面實時交給AI分析、導航時根據相機識別出用戶所在的精準坐標等。



(圖源:雷科技)

案例五:做一個瀏覽器能運行的小游戲

一直以來,大模型的代碼能力都很被看重。作為一個編程小白,我更關心的是它能不能根據我的需求生成一個能直接運行的程序,不用再做任何額外的工作。

首先,我提了一個基礎編程課上的簡單案例:生成一個解一元二次方程的程序。MiMo-V2.5 Pro很快就開始寫代碼了,馬上做出了一個可以在瀏覽器上直接運行的HTML文件。我只要在程序界面填入對應的數字,它就能算出結果。



(圖源:雷科技)

然后,我們加大了難度,讓它寫一個圍棋的程序,它的代碼更加復雜,還要圍繞UI設計做很多工作。MiMo-V2.5 Pro處理這項任務也毫無壓力,將它生成的代碼直接運行,就能在圍棋程序里面下棋了。



(圖源:雷科技)

MiMo Claw來了,小米「龍蝦」好用嗎?

伴隨著MiMo-V2.5系列的發(fā)布,小米還同步上線了MiMo Claw。不過,這款龍蝦目前還處于測試階段,通過在網頁端運行的模式提供給用戶使用。

它的單次體驗限時1小時,超時后原有的數據會被銷毀,用戶可以重新創(chuàng)建一個Claw項目再次體驗。我們通過新聞抓取、財報分析和文檔優(yōu)化三個場景來測試這款龍蝦的實際表現。

場景一:新聞抓取

我給MiMo Claw出了一個不大不小的難題:搜索當天的科技要聞,并且按照指定的懷舊風格生成一張海報。這主要考驗它的兩個能力,一是信息檢索,二是作圖。

從實測結果來看,作為一款還在公測的「龍蝦」,它的表現還可以,至少模仿90年代雜志風格這方面做得挺不錯的,而且排版基本沒出現大問題。

當然,還是老問題,它的信息聯網檢索能力一般,搜集了一些舊聞,時效性差點意思。但整體來說,這個效果已經很好了,效率也比人工高。



(圖源:雷科技)

場景二:財報分析

很多海外大公司發(fā)布的財報文件,篇幅很長、數據很多,而且基本是英文,國內投資者要看懂看透,難度不小。我們嘗試把一份28頁的蘋果財報PDF文件丟給MiMo Claw,讓它來分析和總結。



(圖源:雷科技)

MiMo Claw的表現很給力,比較精準地概括了這份財報數據的重點,并且給出了結論:

1. iPhone 是絕對功臣
2. 研發(fā)投入暴增31.7%
3. 服務業(yè)務穩(wěn)健增長但增速放緩
4. Mac和可穿戴拖后腿
5. 現金流極其充沛



(圖源:雷科技)

在查看MiMo Claw的工作流時,我們發(fā)現,它首先會把PDF文件中的文本信息全部提取出來,在云端以TXT文件保存,再將這份文檔進行翻譯、分析,最后歸納總結。不過,由于它是基于網頁端運行的,所以實際體驗沒能和主流的網頁端大模型拉開很大的差距。

場景三:文檔優(yōu)化

對于MiMo Claw的能力,小米官方提到了它與金山生態(tài)達成了合作,在Office文檔處理方面會有優(yōu)勢。我個人一直都是PPT苦手,難點不在于內容填充,主要是排版。畢竟,PPT給人的第一印象往往是由版面美觀度決定的。

為了「拷打」MiMo Claw,我特意找了個排版風格非常陳舊的大學課件,這個PPT一打開,完全是90年代的風格,而且毫無排版設計可言。



(圖源:雷科技)

我們將這個PPT喂給MiMo Claw,并且要求它著重美化排版,具體參考科技公司的Keynote。坦率說,我對最后的成品沒有抱太多期待,主要是因為PPT美化的難度比純粹修改文本高很多,需要龍蝦工具在模型、智能體和Skills方面都有很強的能力。

然后,從MiMo Claw最后生成的PPT文件來看,整體排版效果好了非常多,至少字體顏色比原版正常很多,看著更舒服。別的不說,原版PPT那種陳舊毫無美觀度可言的版面,總算消失了。



(圖源:雷科技)

終端品牌入局大模型,小米有長遠打算

由于還在公測階段,MiMo-V2.5系列大模型以及MiMo Claw在實際使用中自然還會存在一些問題,但我們已經能感受它較為出色的模型和Agent能力。

同時,這次的大規(guī)模公測,大量用戶的實測和反饋,也能給小米提供一些改進的方向。從小米的規(guī)劃來看,MiMo-V2.5系列不僅面向普通用戶,更面向廣大開發(fā)者。伴隨這次公測,小米MiMo-V2.5系列的Token付費服務也一并上線。

當然,我們也認為,對于小米而言,不遺余力地迭代大模型,絕不僅僅是為了在發(fā)布會上秀技術肌肉和賺點服務費,其真正的野心在于深度賦能旗下龐大的消費核心業(yè)務。

就拿我們最熟悉的小愛同學來說,如果融入MiMo-V2.5系列的全模態(tài)能力,它將迎來一次跨越式的進化。固有印象中的小愛同學,更多是一個被動的指令執(zhí)行工具,用戶發(fā)號施令,它按部就班地開關電器或是定鬧鐘。

但在全模態(tài)大模型的加持下,它正在轉型成為一位真正的超級管家。它不僅能直接看懂用戶手機或平板屏幕上的內容并進行深度交互,更能敏銳地聽懂家庭場景中那些模糊的自然語言,理解背后復雜的真實意圖。



(圖源:小米)

小米自家的AI技術,不僅能應用到手機這類單品中,還能廣泛融入小米的「人車家」生態(tài)中,為更多產品、更多應用場景提供支持?梢灶A見的是,小米未來的產品藍圖肯定不局限于智能家居和汽車,還將包括人形機器人、其他形式的AI硬件等。

可以說,如今的大模型已經徹底跳出了發(fā)布會上那些干巴巴跑分和技術指標,成長為真正打通并盤活各種智能場景生態(tài)的核心大腦。從更行業(yè)視角來看,這不僅是小米一家的戰(zhàn)略,更是整個智能終端賽道的共識。

小米正依托大模型不斷深化其人車家全生態(tài),而榮耀等廠商也在掌舵人李建的帶領下,加速推進底層AI的全面重構,榮耀的人形機器人剛在馬拉松賽道上奪冠,就是這一證明。這標志著曾經單純卷硬件參數的手機廠商們,都在默契地跨越傳統(tǒng)的邊界,從終端硬件品牌全面向AI生態(tài)品牌轉型。

2026第十九屆北京國際汽車展覽會將于4月24日至5月3日在北京?中國國際展覽中心(順義館)和首都國際會展中心(新國展二期)舉行,本屆車展以“領時代·智未來”為主題,集中展現汽車工業(yè)的更多黑科技。
比亞迪、小米、鴻蒙智行(問界等)、小鵬、蔚來、嵐圖等頭部品牌集結,多款重磅新車首秀;地平線、Momenta、卓馭等供應商集體秀肌肉,AI大模型深度賦能,高階智駕、動力電池、超快充技術等前沿科技集中亮相,看點拉滿!
雷科技旗下「電車通」將派出報道團直擊現場,以“關注電動車,更懂智能化”的專業(yè)視角,帶來一線獨家報道,敬請關注!



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
阿瑙托維奇:因疫情在中國隔離至抑郁,最終選擇重返歐洲

阿瑙托維奇:因疫情在中國隔離至抑郁,最終選擇重返歐洲

懂球帝
2026-04-23 08:32:10
比亞迪在馬來西亞的東盟首個整車基地已全面停工,項目陷入僵局

比亞迪在馬來西亞的東盟首個整車基地已全面停工,項目陷入僵局

流蘇晚晴
2026-04-22 19:05:45
斯諾克世錦賽16強對陣!丁俊暉戰(zhàn)趙心童時間曝光,吳宜澤PK塞爾比

斯諾克世錦賽16強對陣!丁俊暉戰(zhàn)趙心童時間曝光,吳宜澤PK塞爾比

曹說體育
2026-04-23 11:39:25
伊朗艦艇護送一散貨船進入領海

伊朗艦艇護送一散貨船進入領海

財聯社
2026-04-24 06:46:03
穩(wěn)居前四卻埋滿雷!北京男籃的季后賽,真的懸了!

穩(wěn)居前四卻埋滿雷!北京男籃的季后賽,真的懸了!

林子說事
2026-04-24 07:34:54
有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
中國09IIIB新型核潛艇或已服役,水下垂發(fā)鷹擊18導彈畫面首次公開

中國09IIIB新型核潛艇或已服役,水下垂發(fā)鷹擊18導彈畫面首次公開

奧字侃劇
2026-04-24 07:15:55
在小公司上班是什么體驗?網友:可以避免自己有創(chuàng)業(yè)的想法

在小公司上班是什么體驗?網友:可以避免自己有創(chuàng)業(yè)的想法

帶你感受人間冷暖
2026-04-23 22:06:26
劃清界限!高云翔憔悴發(fā)聲撇清張婉婷,不留情面,一句話暗含深意

劃清界限!高云翔憔悴發(fā)聲撇清張婉婷,不留情面,一句話暗含深意

阿握聊事
2026-04-24 00:23:37
切爾西慘敗,球迷呼吁穆帥第3次執(zhí)教藍軍,切爾西管理層無動于衷

切爾西慘敗,球迷呼吁穆帥第3次執(zhí)教藍軍,切爾西管理層無動于衷

福醬的小時光
2026-04-24 08:00:53
何潔參加婚禮,無修圖下好黑,個子不高腿粗,翹著二郎腿太拽了!

何潔參加婚禮,無修圖下好黑,個子不高腿粗,翹著二郎腿太拽了!

小娛樂悠悠
2026-04-24 09:20:33
世上最失敗4大工程:損失慘重,中國占倆!卻說有意料之外效果?

世上最失敗4大工程:損失慘重,中國占倆!卻說有意料之外效果?

三毛看世界
2026-04-17 16:43:17
竄訪取消后,賴清德無能狂怒,馬達加斯加表態(tài),民進黨徹底破防

竄訪取消后,賴清德無能狂怒,馬達加斯加表態(tài),民進黨徹底破防

影孖看世界
2026-04-22 23:28:19
一夜3大消息!湖人重大利好,衛(wèi)冕冠軍遭打擊,杜蘭特又添新傷

一夜3大消息!湖人重大利好,衛(wèi)冕冠軍遭打擊,杜蘭特又添新傷

體壇小李
2026-04-24 07:27:51
3歲男童在游樂中心遭陌生男子襲擊致下體受傷,縫合6針,警方已立案;涉事店家:疑因小朋友爭執(zhí)引發(fā)家長傷人,已墊付醫(yī)藥費并配合調查

3歲男童在游樂中心遭陌生男子襲擊致下體受傷,縫合6針,警方已立案;涉事店家:疑因小朋友爭執(zhí)引發(fā)家長傷人,已墊付醫(yī)藥費并配合調查

都市快報橙柿互動
2026-04-24 08:01:43
死了這條心!人民日報攤牌:中國不會救菲律賓,馬科斯投機到頭了

死了這條心!人民日報攤牌:中國不會救菲律賓,馬科斯投機到頭了

諦聽骨語本尊
2026-04-23 23:15:34
恩情還不完!員工病重想辭職 G胖當場拒批:帶薪養(yǎng)病

恩情還不完!員工病重想辭職 G胖當場拒批:帶薪養(yǎng)病

游民星空
2026-04-21 11:51:12
吃相越來越難看,終于引起公憤了!

吃相越來越難看,終于引起公憤了!

胖胖說他不胖
2026-04-23 09:00:33
沙特媒:迪拜國民全隊仍在沙特等待亞足聯回復;球隊申訴重賽

沙特媒:迪拜國民全隊仍在沙特等待亞足聯回復;球隊申訴重賽

懂球帝
2026-04-24 01:59:08
孫楊張豆豆相處太累,男方要人哄女方不撒嬌,網友直言二人不適合

孫楊張豆豆相處太累,男方要人哄女方不撒嬌,網友直言二人不適合

萌神木木
2026-04-23 17:20:57
2026-04-24 09:52:49
雷科技 incentive-icons
雷科技
專注AI硬科技
36918文章數 812047關注度
往期回顧 全部

數碼要聞

超級直播神器!華為隨行WiFi X獲UFCS認證:快充不挑充電器

頭條要聞

用了16年的學位證"失效"男子舉報自己 高校最新通報

頭條要聞

用了16年的學位證"失效"男子舉報自己 高校最新通報

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

19家企業(yè)要"鋁代銅",格力偏不

科技要聞

凌晨突發(fā)!GPT-5.5正式上線:跑分更猛

汽車要聞

預售30.29萬起 嵐圖泰山X8配896線激光雷達

態(tài)度原創(chuàng)

家居
手機
數碼
公開課
軍事航空

家居要聞

浪漫協(xié)奏 法式風格

手機要聞

2026年最后一款不加價的旗艦!OPPO Find X9s Pro首銷:5299元起

數碼要聞

重磅回歸!當貝超級盒子正式開啟預約 4月27日全網開售

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美伊陷入互相封鎖僵局

無障礙瀏覽 進入關懷版