
4 月 23 日,小米 MiMo V2.5 系列模型开启公测。根据官方介绍,该系列模型具有更强的推理能力、更稳定的 Agent。
另外,它还有多模态感知能力,不仅能看懂文本,还能理解图片、音频等信息。而且,在 Artificial Analysis 榜单中,Xiaomi MiMo-V2.5-Pro 综合智能指数位列全球开源大模型第一。

既然小米这款大模型能力这么强,我们就来实际测试一下,看看它在哪些场景下有出色的表现,同时又有哪些要改进的地方。
MiMo V2.5 实测:
模型能力很强,联网检索稍弱
目前,MiMo V2.5 系列已经开放公测,所有小米用户都能在 MiMo 官网直接体验 MiMo V2.5、MiMo V2.5 Pro 等模型产品。
网页端这种使用场景不能百分百发挥出大模型的潜力,但作为摸底考试来说问题不大。我们结合日常实际使用习惯,通过五个具体案例,来看看 MiMo V2.5 的真实实力。
案例一:文章总结
长文概括总结基本是当下主流大模型的基础能力,作为这次实测的开胃菜再合适不过了。
我们把雷科技(ID:leitech)最近写的一篇关于 ChatGPT Images 2.0 评测的图文内容链接丢给它分析, MiMo V2.5 Pro 的反应很迅速,2 秒钟就生成了结果。它对文章内容的概括非常准确,把文章中针对 ChatGPT Images 2.0 的优缺点评价都提炼了出来。

当然,这只是基本功,主流大模型一般都能比较好地完成这项任务,接下来我们就要加大力度了。
案例二:盘点一下小米 2025 年发布过的手机型号
这个问题主要考验的是 MiMo-V2.5 Pro 的信息联网检索能力,坦率说,它表现得比较一般。
首先,MiMo-V2.5 Pro 罗列出的小米 15 系列是 2024 年发布的,并不是 2025 年的机型。

其次,不少机型被遗漏了,比如最重要的小米 17 系列。另外,它还出现了一些错误,MiMo-V2.5 Pro 在检索了早期的爆料信息后,误以为小米 15S Pro 还没发布,但实际上它就是一款 2025 年发布的机型。


这是之前非常经典的「忽悠」大模型的问题,曾经 ChatGPT 等知名模型都翻车了,它主要考验的就是模型本身的逻辑推理能力。一个在真人看来很简单的逻辑题,但对没有针对性做过训练的大模型来说,就很容易掉坑里。
面对这个问题,MiMo V2.5 Pro 没有被绕进去,而是直接了当地指出了关键:要洗的是车,不是人,洗车的前提是车必须得过去。

MiMo V2.5 有一个重要亮点就是支持多模态,根据官方介绍,它在文本和代码之外,还支持图像、视频和语音(MiMo V2.5 Pro 暂不支持)。所以,我们可以以图片等多媒体文件的形式进行输入。实际体验中,我找了一张医院检查的图片给它,MiMo V2.5 很快识别出了是哪项检查,并且结合获取到的数据,给出了具体的结论和建议。

这项功能放在具体的终端设备上的话,可以进一步拓展使用场景,比如手机打开相机就能把画面实时交给 AI 分析、导航时根据相机识别出用户所在的精准坐标等。

一直以来,大模型的代码能力都很被看重。作为一个编程小白,我更关心的是它能不能根据我的需求生成一个能直接运行的程序,不用再做任何额外的工作。
首先,我提了一个基础编程课上的简单案例:生成一个解一元二次方程的程序。MiMo-V2.5 Pro 很快就开始写代码了,马上做出了一个可以在浏览器上直接运行的 HTML 文件。我只要在程序界面填入对应的数字,它就能算出结果。


小米「龙虾」好用吗?
伴随着 MiMo-V2.5 系列的发布,小米还同步上线了 MiMo Claw。不过,这款龙虾目前还处于测试阶段,通过在网页端运行的模式提供给用户使用。
它的单次体验限时 1 小时,超时后原有的数据会被销毁,用户可以重新创建一个 Claw 项目再次体验。我们通过新闻抓取、财报分析和文档优化三个场景来测试这款龙虾的实际表现。
场景一:新闻抓取
我给 MiMo Claw 出了一个不大不小的难题:搜索当天的科技要闻,并且按照指定的怀旧风格生成一张海报。这主要考验它的两个能力,一是信息检索,二是作图。
从实测结果来看,作为一款还在公测的「龙虾」,它的表现还可以,至少模仿 90 年代杂志风格这方面做得挺不错的,而且排版基本没出现大问题。
当然,还是老问题,它的信息联网检索能力一般,搜集了一些旧闻,时效性差点意思。但整体来说,这个效果已经很好了,效率也比人工高。

很多海外大公司发布的财报文件,篇幅很长、数据很多,而且基本是英文,国内投资者要看懂看透,难度不小。我们尝试把一份 28 页的苹果财报 PDF 文件丢给 MiMo Claw,让它来分析和总结。

1. iPhone 是绝对功臣
2. 研发投入暴增 31.7%
3. 服务业务稳健增长但增速放缓
4. Mac 和可穿戴拖后腿
5. 现金流极其充沛

场景三:文档优化
对于 MiMo Claw 的能力,小米官方提到了它与金山生态达成了合作,在 Office 文档处理方面会有优势。我个人一直都是 PPT 苦手,难点不在于内容填充,主要是排版。毕竟,PPT 给人的第一印象往往是由版面美观度决定的。
为了「拷打」MiMo Claw,我特意找了个排版风格非常陈旧的大学课件,这个 PPT 一打开,完全是 90 年代的风格,而且毫无排版设计可言。

然后,从 MiMo Claw 最后生成的 PPT 文件来看,整体排版效果好了非常多,至少字体颜色比原版正常很多,看着更舒服。别的不说,原版 PPT 那种陈旧毫无美观度可言的版面,总算消失了。

小米有长远打算
由于还在公测阶段,MiMo-V2.5 系列大模型以及 MiMo Claw 在实际使用中自然还会存在一些问题,但我们已经能感受它较为出色的模型和 Agent 能力。
同时,这次的大规模公测,大量用户的实测和反馈,也能给小米提供一些改进的方向。从小米的规划来看,MiMo-V2.5 系列不仅面向普通用户,更面向广大开发者。伴随这次公测,小米 MiMo-V2.5 系列的 Token 付费服务也一并上线。
当然,我们也认为,对于小米而言,不遗余力地迭代大模型,绝不仅仅是为了在发布会上秀技术肌肉和赚点服务费,其真正的野心在于深度赋能旗下庞大的消费核心业务。
就拿我们最熟悉的小爱同学来说,如果融入 MiMo-V2.5 系列的全模态能力,它将迎来一次跨越式的进化。固有印象中的小爱同学,更多是一个被动的指令执行工具,用户发号施令,它按部就班地开关电器或是定闹钟。
但在全模态大模型的加持下,它正在转型成为一位真正的超级管家。它不仅能直接看懂用户手机或平板屏幕上的内容并进行深度交互,更能敏锐地听懂家庭场景中那些模糊的自然语言,理解背后复杂的真实意图。

可以说,如今的大模型已经彻底跳出了发布会上那些干巴巴跑分和技术指标,成长为真正打通并盘活各种智能场景生态的核心大脑。从更行业视角来看,这不仅是小米一家的战略,更是整个智能终端赛道的共识。
小米正依托大模型不断深化其人车家全生态,而荣耀等厂商也在掌舵人李建的带领下,加速推进底层 AI 的全面重构,荣耀的人形机器人刚在马拉松赛道上夺冠,就是这一证明。这标志着曾经单纯卷硬件参数的手机厂商们,都在默契地跨越传统的边界,从终端硬件品牌全面向 AI 生态品牌转型。
2026 第十九届北京国际汽车展览会将于 4 月 24 日至 5 月 3 日在北京中国国际展览中心(顺义馆)和首都国际会展中心(新国展二期)举行,本届车展以 " 领时代 · 智未来 " 为主题,集中展现汽车工业的更多黑科技。
比亚迪、小米、鸿蒙智行(问界等)、小鹏、蔚来、岚图等头部品牌集结,多款重磅新车首秀;地平线、Momenta、卓驭等供应商集体秀肌肉,AI 大模型深度赋能,高阶智驾、动力电池、超快充技术等前沿科技集中亮相,看点拉满!
雷科技旗下「电车通」将派出报道团直击现场,以 " 关注电动车,更懂智能化 " 的专业视角,带来一线独家报道,敬请关注!

欢迎扫码添加小雷微信
记得备注想进群的手机品牌哦
跟小雷一起畅聊数码与 AI 科技
另外小雷建了很多粉丝群,欢迎扫码加入!
大家伙一块聊聊天,分享玩机技巧~


