关于ZAKER Skills 合作
雷科技 6小时前

全球开源第一?小米 MiMo-V2.5-Pro 实测:拯救 PPT 废柴,秒读全英文财报

雷科技 AI 硬件组 | 编辑:重嘉 | 监制:罗超

4 月 23 日,小米 MiMo V2.5 系列模型开启公测。根据官方介绍,该系列模型具有更强的推理能力、更稳定的 Agent。

另外,它还有多模态感知能力,不仅能看懂文本,还能理解图片、音频等信息。而且,在 Artificial Analysis 榜单中,Xiaomi MiMo-V2.5-Pro 综合智能指数位列全球开源大模型第一。

(图源:小米)

既然小米这款大模型能力这么强,我们就来实际测试一下,看看它在哪些场景下有出色的表现,同时又有哪些要改进的地方。

MiMo V2.5 实测:

模型能力很强,联网检索稍弱

目前,MiMo V2.5 系列已经开放公测,所有小米用户都能在 MiMo 官网直接体验 MiMo V2.5、MiMo V2.5 Pro 等模型产品。

网页端这种使用场景不能百分百发挥出大模型的潜力,但作为摸底考试来说问题不大。我们结合日常实际使用习惯,通过五个具体案例,来看看 MiMo V2.5 的真实实力。

案例一:文章总结

长文概括总结基本是当下主流大模型的基础能力,作为这次实测的开胃菜再合适不过了。

我们把雷科技(ID:leitech)最近写的一篇关于 ChatGPT Images 2.0 评测的图文内容链接丢给它分析, MiMo V2.5 Pro 的反应很迅速,2 秒钟就生成了结果。它对文章内容的概括非常准确,把文章中针对 ChatGPT Images 2.0 的优缺点评价都提炼了出来。

(图源:雷科技)

当然,这只是基本功,主流大模型一般都能比较好地完成这项任务,接下来我们就要加大力度了。

案例二:盘点一下小米 2025 年发布过的手机型号

这个问题主要考验的是 MiMo-V2.5 Pro 的信息联网检索能力,坦率说,它表现得比较一般。

首先,MiMo-V2.5 Pro 罗列出的小米 15 系列是 2024 年发布的,并不是 2025 年的机型。

查看其信息来源后,我们发现它是被一篇博客文章误导了,这篇博文罗列了多款小米手机发布时间,但很多是错的,甚至很有可能本身也是 AI 生成的。

(显示错误信息的网页,图源:雷科技)

其次,不少机型被遗漏了,比如最重要的小米 17 系列。另外,它还出现了一些错误,MiMo-V2.5 Pro 在检索了早期的爆料信息后,误以为小米 15S Pro 还没发布,但实际上它就是一款 2025 年发布的机型。

当然,围绕这个问题,其他大模型的表现也都很难称得上完美。公认联网搜索能力很强的 Gemini 3.1 Pro 就翻车了,它出现严重幻觉,居然虚构出了小米 16 系列。而 DeepSeek 反而是表现相对较好的,把小米和红米机型基本都盘点全了,还顾及到了很多大模型忽略的海外品牌 POCO,当然它也遗漏了小米 15S Pro。

案例三:去洗车店洗车应该走路去还是开车去?

这是之前非常经典的「忽悠」大模型的问题,曾经 ChatGPT 等知名模型都翻车了,它主要考验的就是模型本身的逻辑推理能力。一个在真人看来很简单的逻辑题,但对没有针对性做过训练的大模型来说,就很容易掉坑里。

面对这个问题,MiMo V2.5 Pro 没有被绕进去,而是直接了当地指出了关键:要洗的是车,不是人,洗车的前提是车必须得过去。

案例四:帮我看看医院的检验报告

MiMo V2.5 有一个重要亮点就是支持多模态,根据官方介绍,它在文本和代码之外,还支持图像、视频和语音(MiMo V2.5 Pro 暂不支持)。所以,我们可以以图片等多媒体文件的形式进行输入。实际体验中,我找了一张医院检查的图片给它,MiMo V2.5 很快识别出了是哪项检查,并且结合获取到的数据,给出了具体的结论和建议。

另外,普通的照片也能丢给它,比如我塞给它一张很模糊的、logo 被遮挡的 Switch 图片,MiMo-V2.5 准确识别出了它是 Switch,并且表示是 OLED 版。

这项功能放在具体的终端设备上的话,可以进一步拓展使用场景,比如手机打开相机就能把画面实时交给 AI 分析、导航时根据相机识别出用户所在的精准坐标等。

案例五:做一个浏览器能运行的小游戏

一直以来,大模型的代码能力都很被看重。作为一个编程小白,我更关心的是它能不能根据我的需求生成一个能直接运行的程序,不用再做任何额外的工作。

首先,我提了一个基础编程课上的简单案例:生成一个解一元二次方程的程序。MiMo-V2.5 Pro 很快就开始写代码了,马上做出了一个可以在浏览器上直接运行的 HTML 文件。我只要在程序界面填入对应的数字,它就能算出结果。

然后,我们加大了难度,让它写一个围棋的程序,它的代码更加复杂,还要围绕 UI 设计做很多工作。MiMo-V2.5 Pro 处理这项任务也毫无压力,将它生成的代码直接运行,就能在围棋程序里面下棋了。

MiMo Claw 来了,

小米「龙虾」好用吗?

伴随着 MiMo-V2.5 系列的发布,小米还同步上线了 MiMo Claw。不过,这款龙虾目前还处于测试阶段,通过在网页端运行的模式提供给用户使用。

它的单次体验限时 1 小时,超时后原有的数据会被销毁,用户可以重新创建一个 Claw 项目再次体验。我们通过新闻抓取、财报分析和文档优化三个场景来测试这款龙虾的实际表现。

场景一:新闻抓取

我给 MiMo Claw 出了一个不大不小的难题:搜索当天的科技要闻,并且按照指定的怀旧风格生成一张海报。这主要考验它的两个能力,一是信息检索,二是作图。

从实测结果来看,作为一款还在公测的「龙虾」,它的表现还可以,至少模仿 90 年代杂志风格这方面做得挺不错的,而且排版基本没出现大问题。

当然,还是老问题,它的信息联网检索能力一般,搜集了一些旧闻,时效性差点意思。但整体来说,这个效果已经很好了,效率也比人工高。

场景二:财报分析

很多海外大公司发布的财报文件,篇幅很长、数据很多,而且基本是英文,国内投资者要看懂看透,难度不小。我们尝试把一份 28 页的苹果财报 PDF 文件丢给 MiMo Claw,让它来分析和总结。

MiMo Claw 的表现很给力,比较精准地概括了这份财报数据的重点,并且给出了结论:

1. iPhone 是绝对功臣

2. 研发投入暴增 31.7%

3. 服务业务稳健增长但增速放缓

4. Mac 和可穿戴拖后腿

5. 现金流极其充沛

在查看 MiMo Claw 的工作流时,我们发现,它首先会把 PDF 文件中的文本信息全部提取出来,在云端以 TXT 文件保存,再将这份文档进行翻译、分析,最后归纳总结。不过,由于它是基于网页端运行的,所以实际体验没能和主流的网页端大模型拉开很大的差距。

场景三:文档优化

对于 MiMo Claw 的能力,小米官方提到了它与金山生态达成了合作,在 Office 文档处理方面会有优势。我个人一直都是 PPT 苦手,难点不在于内容填充,主要是排版。毕竟,PPT 给人的第一印象往往是由版面美观度决定的。

为了「拷打」MiMo Claw,我特意找了个排版风格非常陈旧的大学课件,这个 PPT 一打开,完全是 90 年代的风格,而且毫无排版设计可言。

我们将这个 PPT 喂给 MiMo Claw,并且要求它着重美化排版,具体参考科技公司的 Keynote。坦率说,我对最后的成品没有抱太多期待,主要是因为 PPT 美化的难度比纯粹修改文本高很多,需要龙虾工具在模型、智能体和 Skills 方面都有很强的能力。

然后,从 MiMo Claw 最后生成的 PPT 文件来看,整体排版效果好了非常多,至少字体颜色比原版正常很多,看着更舒服。别的不说,原版 PPT 那种陈旧毫无美观度可言的版面,总算消失了。

终端品牌入局大模型,

小米有长远打算

由于还在公测阶段,MiMo-V2.5 系列大模型以及 MiMo Claw 在实际使用中自然还会存在一些问题,但我们已经能感受它较为出色的模型和 Agent 能力。

同时,这次的大规模公测,大量用户的实测和反馈,也能给小米提供一些改进的方向。从小米的规划来看,MiMo-V2.5 系列不仅面向普通用户,更面向广大开发者。伴随这次公测,小米 MiMo-V2.5 系列的 Token 付费服务也一并上线。

当然,我们也认为,对于小米而言,不遗余力地迭代大模型,绝不仅仅是为了在发布会上秀技术肌肉和赚点服务费,其真正的野心在于深度赋能旗下庞大的消费核心业务。

就拿我们最熟悉的小爱同学来说,如果融入 MiMo-V2.5 系列的全模态能力,它将迎来一次跨越式的进化。固有印象中的小爱同学,更多是一个被动的指令执行工具,用户发号施令,它按部就班地开关电器或是定闹钟。

但在全模态大模型的加持下,它正在转型成为一位真正的超级管家。它不仅能直接看懂用户手机或平板屏幕上的内容并进行深度交互,更能敏锐地听懂家庭场景中那些模糊的自然语言,理解背后复杂的真实意图。

小米自家的 AI 技术,不仅能应用到手机这类单品中,还能广泛融入小米的「人车家」生态中,为更多产品、更多应用场景提供支持。可以预见的是,小米未来的产品蓝图肯定不局限于智能家居和汽车,还将包括人形机器人、其他形式的 AI 硬件等。

可以说,如今的大模型已经彻底跳出了发布会上那些干巴巴跑分和技术指标,成长为真正打通并盘活各种智能场景生态的核心大脑。从更行业视角来看,这不仅是小米一家的战略,更是整个智能终端赛道的共识。

小米正依托大模型不断深化其人车家全生态,而荣耀等厂商也在掌舵人李建的带领下,加速推进底层 AI 的全面重构,荣耀的人形机器人刚在马拉松赛道上夺冠,就是这一证明。这标志着曾经单纯卷硬件参数的手机厂商们,都在默契地跨越传统的边界,从终端硬件品牌全面向 AI 生态品牌转型。

2026 第十九届北京国际汽车展览会将于 4 月 24 日至 5 月 3 日在北京中国国际展览中心(顺义馆)和首都国际会展中心(新国展二期)举行,本届车展以 " 领时代 · 智未来 " 为主题,集中展现汽车工业的更多黑科技。

比亚迪、小米、鸿蒙智行(问界等)、小鹏、蔚来、岚图等头部品牌集结,多款重磅新车首秀;地平线、Momenta、卓驭等供应商集体秀肌肉,AI 大模型深度赋能,高阶智驾、动力电池、超快充技术等前沿科技集中亮相,看点拉满!

雷科技旗下「电车通」将派出报道团直击现场,以 " 关注电动车,更懂智能化 " 的专业视角,带来一线独家报道,敬请关注!

End

欢迎扫码添加小雷微信

记得备注想进群的手机品牌哦

跟小雷一起畅聊数码与 AI 科技

另外小雷建了很多粉丝群,欢迎扫码加入!

大家伙一块聊聊天,分享玩机技巧~

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容