马维斯（Marvis）实测：他给了我一些可以独处的时间

文 | AI 唱反调

最近这两天，微信朋友圈被一个名叫「马维斯」（Marvis）的 AI 助手刷屏了。

这是腾讯应用宝团队推出的新产品，官方给它的定位很激进——「操作系统层级」的 AI 助手。什么意思？它不再满足于像 ChatGPT、Claude 那样只在浏览器里陪你聊天，而是直接扎根在你的 Windows 系统里，拥有调用本地文件、修改系统设置、启动应用程序、甚至跨屏操作手机 App 的权限。

官方宣传稿的标题很直白：「装上就有 6 个 AI 牛马帮你干活」。

作为一个每天被选题、写稿包围的媒体人，我对这种 " 全能型数字助理 " 毫无抵抗力，正好借机梳理下工作流。于是我下载，开始了这场 48 小时的真实测试，看看 Marvis 能不能成为我的真实生产力。

以下所有体验，均为纯个人真实操作记录。

当 " 明确要求 " 遇上 " 执行偏差 "

做自媒体，选题是核心，而选题的前提是信息收集。

所以，和平时使用其他 AI 模型一样，我先让 Marvis 帮我搭建一个 "AIHOT" 的资讯追踪任务，准备从热点中找找创作灵感。

任务创建很顺畅，Marvis 很快通知我已生成文件。但当我满怀期待地打开输出文档时，映入眼帘的却是满屏乱码。

说实话，这是我用过这么多大模型和 AI 工具以来，第一次遇到输出文件乱码的情况。我随即在对话框里指出问题，Marvis 的响应倒是很快——它立刻 " 意识到 " 了问题所在，并告诉我：任务说明里已经明确要求了 UTF-8 编码，乱码通常是因为写入文件时编码未显式指定导致的。

但这里有个值得细究的细节：写入指令里明明是明确要求了 UTF-8 的，执行环节却 " 漏 " 掉了这一步。

这让我想到一个更深层的问题：当 AI 助手拥有直接操作系统文件的权限时，" 理解指令 " 和 " 严格执行指令 " 之间，其实还隔着一道执行的鸿沟。Marvis 能听懂你要什么，但在调用底层系统 API 写入文件时，那个 " 编码参数 " 的传递出现了断层。好在指出后它迅速修正，任务恢复正常。

系统级 AI 的第一次考验，不是 " 能不能做 "，而是 " 能不能稳定、不出错地做 "。

第一印象并不美好，但好在自己勘误能力还算 ok 。

AI 的 " 时间感知 " 竟然会翻车？

写完一段稿子，我想让 Marvis 帮我定个闹钟，劳逸结合提醒我一会起来活动活动。没想到，这个最简单的指令，却上演了一出 " 四幕剧 "。

第一幕：时间幻觉（9:40 → 设 10:00 闹钟）

当时时间是 9:40，我让 Marvis 设一个 10 点的闹钟。结果它 " 自圆其说 " 地告诉我：10 点已经过了，于是给我创建了明天 10 点的闹钟。

我当场震惊。9:40 到 10:00 明明还有 20 分钟，Marvis 是怎么判断 " 时间已过 " 的？这个 bug 暴露了一个问题：AI 对 " 当前系统时间 " 的感知，在某些场景下会出现逻辑漂移。

仔细思考下这个逻辑漂移问题，有可能是 agent 调用了错误的工具导致抓取错误，也有可能是模型返回的具体时间有问题，短期看还好，如果长期使用，稳定性一定是生产力中的关键要点，基础信息的判断，Marvis 确实还有待加强。

第二幕：正常发挥（10:30 闹钟）

不死心，我重新测试，设了一个 10:30 的闹钟。这次没有任何停顿，任务立刻创建成功。

第三幕：保守策略（8:00 闹钟）

我故意选了一个已经过去的时间（8:00）。这次它没有再犯 " 时间幻觉 " 的错误，而是切换到了另一种交互模式：弹出手动确认窗口，要求我在系统层面亲自确认。

这种 " 拿不准就交给人 " 的策略，虽然慢了一步，但起码不犯错，好评。

第四幕：进化自查（10:08 闹钟）

第四次，我设了一个 10:08 的闹钟。这一次，Marvis 的表现完全不同了——它开始自查：先核对当前时间，再确认目标时间是否合理，最后才执行创建。

这之后我又反复测试了几次，均没有再出现问题，任务创建变得及时且便捷。

这四次闹钟测试，几乎浓缩了 AI 产品迭代的典型路径，从幻觉犯错，到保守兜底，再到自查修正。Marvis 的学习和纠错速度，比我想象中快。

图片生成与识别，仍是短板

稿件准备得差不多了，需要配图。我尝试用 Marvis 生成图片，结果质量确实有点拉胯，画面模糊、风格不统一。

随后我又测试了它的 " 找图 " 能力，特别是人物识别。我让它找某位公众人物的照片，讲道理，这是属于自家生态的强势领域，我对他是有期待的。但结果基本对不上号。

更尴尬的是，我反过来拿着它找到的图片问 " 这是谁 "，它也只能给出泛泛的描述，无法准确说出人名。

后来研究了才发现：Marvis 目前没有人脸生物识别比对的权限和能力。 这不是技术做不到，而是涉及隐私合规的边界问题——一个能自由操作你电脑的 AI，如果再拥有精准的人脸识别能力，安全争议会指数级上升。所以还好，业内共有的问题不是问题。

不过 " 小马 " 还是给了我一个小惊喜，就是他的 " 本地知识库 "。在选图的时候我发现，他会把我本地的图片和文档纳入一个整体的库里，形成一个全局图库。要知道，媒体人的桌面，一般都是这样的。

图片仅供参考，实际更乱

对于文档类的内容还好，但是图片类的信息真的是存进电脑几乎就再也找不到了。而这个本地知识库就可以支持我用模糊语意去寻找固定内容了，给我提效不少。

在图片生成和人物识别这两个维度上，Marvis 目前还不能替代专业工具。它的优势不在 " 创作视觉内容 "，而在 " 帮你调用和管理视觉内容 "。

批量操作才是 " 系统级 AI" 的真正主场

文章写完后，进入最枯燥的环节：多平台同步。我手里有一个 Excel 表格，里面存着微信公众号、知乎、头条号、微博等所有平台的发布链接。

以前这个流程是这样的：找到表格→ 打开 → 逐个复制链接 → 粘贴到浏览器 → 登录 → 发布。全程手动，至少折腾十几分钟。

这次我让 Marvis 直接读取桌面上的表格文件，打开里面所有网址。我原本以为会卡顿，甚至做好等三五分钟的心理准备。结果不到一分钟，我眼看着它依次完成：读取桌面文件→ 解析表格 → 启动浏览器 → 逐个打开平台网址。浏览器里的标签页瞬间拉满，效率提升肉眼可见。

后面我还让它整理了电脑里散落的旧稿件，统一梳理命名规则。这些 " 体力活 " 它都完成得干净利落。

创作间隙，我随手让它 " 打开网易云，放首歌 "，它也能秒响应。甚至最后，我让它扫描了一遍电脑里可卸载的 App 和陈年图片。它不仅分析得很快，对卸载建议还说得头头是道；那些藏在磁盘深处、我自己都忘了的老照片，也被它翻出来整整齐齐理了一遍。

看着老照片，听着 " 网抑云 "，独属于我的时刻，降临了。反正今天的活儿，Marvis 也帮我干了不少，那么就进入今日 Emo 时刻吧。

Marvis 的真正价值，在于把 " 重复性、流程化、跨应用 " 的脏活累活自动化。它不是替代你的大脑，而是替代你的手指。

为什么它总在 " 确认 "？

在整个测试过程中，我注意到 Marvis 有一个非常鲜明的交互特征：频繁确认。

删除文件前确认、修改设置前确认、执行可能影响系统的操作前确认……几乎每一步涉及 " 写操作 " 的环节，它都会停下来问你：" 确定要这样做吗？"

Marvis 的 " 过度确认 "，究竟是 AI 没有完全释放其便捷性？还是开发者刻意把最终决定权牢牢握在用户手中，划定一条 " 不越界 " 的安全线？

我的看法是：在系统级权限面前，" 保守 " 比 " 激进 " 更负责任。 一个能删你文件、改你设置、操作你应用的 AI，如果太 " 果断 "，风险是不可逆的。Marvis 的多次确认，本质上是一种权限敬畏——它知道自己的能力边界，也知道你的数据边界。

当然，这也带来一个体验上的 trade-off：有时候你会觉得 " 有点啰嗦 "。如何在 " 安全 " 和 " 流畅 " 之间找到更好的平衡点，是 Marvis 下一步需要优化的方向。

它还不是 " 终极形态 "，但方向对了

48 小时体验下来，我的总体感受是：

Marvis 目前更像一个 " 高级实习生 "，它不能替你思考选题、不能帮你写出爆款标题、不能生成惊艳的配图，但它能帮你把 " 找资料、整文件、开网页、定提醒、清内存 " 这些琐事扛起来。

它的优势非常明确：系统级整合能力、跨应用调度能力、本地文件操作能力。 这些恰恰是传统云端 AI 助手做不到的。

它的短板也很清晰：时间感知偶发幻觉、图片生成与识别能力弱、高频确认影响操作流畅度。

最后必须诚实地说：我个人使用的时间还太短，很多功能（比如手机 App 跨屏操作、复杂工作流编排）完全没有深入测试。以上体验，仅限于一个自媒体人日常工作中真实接触到的场景。

如果你也厌倦了在十几个应用之间来回切换、被琐碎操作吃掉大量时间，Marvis 值得一试。它未必能让你立刻拥有 "6 个 AI 牛马 "，但至少，第一个愿意帮你干脏活累活的 " 数字助理 "，已经坐在你的电脑里了。

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

马维斯（Marvis）实测：他给了我一些可以独处的时间

宙世代

一起剪

相关阅读

外媒建议暂缓购买iPhone 18 Pro 2027款将迎20周年大更新

法拉利纯电首秀变谍战片！保密协议违约金474万 ：无一张偷跑图

AI短剧，正在抢走全球游戏用户

三星靠内存涨价赚了太多钱 给友商开了个坏头：台积电直言学不了

应三星电子要求 韩国化学企业PKC拟将半导体氯气产能扩大50%

科大讯飞林会杰：预期一两年内AI眼镜品类会迎来爆发

具身智能首次独立成馆 2026世界智能产业博览会今日开幕

主频3.1GHz！华为麒麟2026芯片已流片成功：等效达3nm水平

AMD发布三款新处理器：尺寸缩小27%、性能提升5倍

华为芯片女王揭秘“韬定律”诞生背后：当年一夜之间被打回“原始社会” 远比想象残酷

国产AI编程冲上全球第二！实测五大模型，谁才是Vibe Coding神器

华为今年秋季将发布首个完整韬芯片 为新款麒麟手机芯片

小红书宣布拿下2026世界杯转播权：App、网页、手机投屏免费看球

到手269元 小米蓝牙音箱C发布：全新氛围灯环、18W强劲音效

车内太吵终于有人管了 ！国内首个汽车静谧评价体系发布：38类场景全覆盖

最新评论

钛媒体

热门推荐

企业资讯

法拉利纯电首秀变谍战片！保密协议违约金474万：无一张偷跑图

三星靠内存涨价赚了太多钱给友商开了个坏头：台积电直言学不了

应三星电子要求韩国化学企业PKC拟将半导体氯气产能扩大50%

华为今年秋季将发布首个完整韬芯片为新款麒麟手机芯片

到手269元小米蓝牙音箱C发布：全新氛围灯环、18W强劲音效

车内太吵终于有人管了！国内首个汽车静谧评价体系发布：38类场景全覆盖