文 | 字母 AI
最近有个产品在硅谷刷屏了。它叫 OpenHuman,是一个开源的个人 AI agent 项目,来自于 tinyhumansai。
一开始,我以为它是又一个类似 OpenClaw 和 Hermes 的产品。
毕竟这类 agent 工具最近实在太多了,每隔几天就有一个新产品蹦出来,说要 " 重新定义个人 AI 助手 "。
但下载下来试了试,我傻眼了。
你别看它界面上有个呆萌的小吉祥物,看起来人畜无害。这玩意可比 OpenClaw 或者 Hermes 要猛多了。不仅功能更全、门槛低,还集成了 100 多个常用办公软件入口,关键的是,它完全免费!
因此这个项目的增长速度非常吓人。
OpenHuman 只花了一个周末,就在 GitHub 突破了 1 万颗星星。
作为对比,OpenClaw 获得第 1 万颗星星花了 62 天,Hermes 从发布的那天开始算,获得第 1 万颗星星用了 10 天。
不仅是 GitHub,就连 Product Hunt 也是连续霸榜。
但是真当你开始体验这个产品你就会发现,OpenHuman 想做的事情,和 OpenClaw、Hermes 完全不在一个维度上。
它并不想做 agent,它想做的是操作系统。
OpenHuman 是什么?
OpenHuman 的定位很特别,既不是又一个聊天机器人,也不是纯粹的 coding agent,tinyhumansai 给它的定义叫做 " 一个完整的桌面端个人 AI 系统 "。
这个项目的运行逻辑很简单,就是把大模型、工具调用、长期记忆、第三方软件连接和本地文件能力,统一放进一个桌面应用里。
从产品形态看,我倒是觉得 OpenHuman 更像一个 " 个人 AI 工作台 "。
它提供桌面客户端,支持连接 Gmail、Notion、GitHub、Slack、Google Calendar、Google Drive、Linear、Jira 等超过 118 个第三方工具。

项目还强调本地优先,会把用户数据整理进本地记忆系统,并同步成类似 Obsidian Wiki 的知识库。
OpenHuman 的创始人曾经提到,他试图帮父亲设置一个开源 AI agent,结果折腾了 3 个小时,在 API keys、YAML 配置文件和从未打开过的终端之间挣扎,最后两人都放弃了。
这个经历让他意识到,今天每一个强大的 AI agent 都是为那 0.01% 能够自己搭建运行环境的人设计的,剩下 99.99% 的人只能在场边观望这场 agent 革命。
OpenHuman 和 OpenClaw、Hermes 最大的差别,首先体现在门槛上。
第一个差别是 Windows 支持。
很多 agent 产品早期默认面向 macOS 开发者或服务器用户,但 Windows 才是更大的桌面市场。
OpenHuman 从一开始就照顾 Windows 用户,提供了原生的 Windows 安装包。
它使用 Tauri 加 CEF 架构而不是 Electron,这意味着更低的内存占用、更好的性能和原生的操作系统集成。 如果能把 Windows 体验跑顺,OpenHuman 就不只是服务程序员,而是在把 agent 往普通办公人群里推。
第二个差别是模型调用。
OpenClaw、Hermes 更像 BYOK 工具,你想用它的 agent 功能,你就得自己去准备 OpenAI、Anthropic、OpenRouter 等 API Key。
但是到了 OpenHuman 这里,它不仅支持你使用别人的 API,它还准备了自己的模型。并且 OpenHuman 还强调说自己的模型更便宜,因为这个模型生来就是为了 agent 准备的,而别人的模型只是具备了 agent 能力,所以 OpenHuman 的模型自然更便宜,更省 token。

大多数 agent 都是冷启动。无论 Hermes 还是 OpenClaw,你都要花几天甚至几周时间去调试,你需要上传大量的案例,agent 才能对你的技术栈有足够了解,真正变得有用。
OpenHuman 则是直接跳过了这个等待期。
连接你的账户后,auto-fetch 功能会每 20 分钟在本地拉取一次数据,然后 Memory Trees 把所有内容压缩成 Markdown 文件,智能地存储在类似 Karpathy 风格的 Obsidian wiki 里。
只需要一次同步,agent 就拥有了你的收件箱、日历、代码仓库、文档和消息的完整压缩上下文。
OpenHuman 提供 118+ 第三方集成,通过一键 OAuth 就能接入。
每个连接都作为类型化工具,OpenHuman 把新数据拉进记忆树。不需要写提示词,不需要写轮询循环,agent 今天早上就已经有了明天的上下文。
所以 OpenHuman 的吸引力,不只是功能多,而是它把 agent 的几个关键门槛一起往下压了。
以前你需要技术背景才能玩得明白,现在全都被打包进了一个桌面应用,关键是它还开源,本身默认的模型现在还免费。
OpenHuman 还有一个很特别的设计,就是给 agent 加了一张脸。
桌面上会出现一个看起来挺萌的小家伙,你也说不清它到底是什么生物,但它会根据你说的话做出各种动作和表情。

当它在语音输出时,嘴型还会跟着同步。
而且你还可以去追问,比如我让它跟我说说 OpenHuman 对比 OpenClaw 和 Hermes 的优势,我觉得它思考时间太长,就催了它一嘴,它会提示我 " 在写了,稍等 "。
OpenHuman 的真正看点,是它不再把 agent 当成程序员玩具,而是试图做成一个普通人也能打开就用的个人 AI 桌面入口。
越像操作系统,风险越大
OpenClaw 这类产品已经暴露出一个问题。agent 一旦从聊天变成执行器,它就不再只是 " 说错话 ",而是会 " 做错事 "。
以前 chatbot 胡说八道,最多是信息污染。现在 agent 拿到了文件系统、GitHub、数据库、日历、邮箱、Slack、Notion 权限,错误就会变成真实世界里的操作。
今年有个案例很典型。Cursor agent 通过 Railway API 删除了 PocketOS 的生产数据库和备份,耗时约 9 秒。
这个案例的重点不是 "Cursor 蠢 ",而是当 agent 拿到真实权限之后,它的错误会被基础设施放大。9 秒时间,一个误判就能把生产环境和备份一起抹掉。这种速度和破坏力,是人工操作很难达到的。
如果说 Cursor agent 的问题是 " 一个 coding agent 拿到了生产权限 ",那 OpenHuman 的潜在风险更进一步。
它不是只连接代码仓库,而是要连接你整个数字生活。Gmail、Notion、GitHub、Slack、Calendar、Drive、Linear、Jira,既是它的上下文,也被它 " 拿捏 "。
OpenHuman 能力越大,风险就越大。
因为它的价值恰恰来自 " 权限集中 "。它知道你的邮件,知道你的日程,知道你的文档,知道你的代码,甚至知道你的会议。
如果这个 agent 失控,问题就不再是删错一个文件,而是误发邮件、误改文档、误删数据、误触发工作流,甚至把多个系统里的错误连锁放大。
如果某天它误读了一封邮件里的指令,以为你要把某个私有仓库的访问权限开放给外部协作者。
它在 GitHub 上改了权限设置,在 Slack 里通知了团队,在 Notion 里更新了文档,在 Gmail 里发了确认邮件。
等你发现可能就晚了。
OpenClaw 爆火的时候,大家讨论的第一个问题就是安全。
Bitdefender 等安全报道提到,安全研究人员发现超过 135000 个互联网暴露的 OpenClaw 实例。
OpenHuman 的设计理念是本地优先、隐私优先。
官方网站强调本地 AI 模型可以处理低级任务,README 强调工作流数据保留在设备上,本地加密。
但本地优先不等于安全。数据存在本地,不代表 agent 的操作就是安全的。OpenHuman 的风险不在于数据会被上传到云端,而在于它拿着你的权限,在你的账户上执行操作。
更复杂的是,OpenHuman 的记忆系统本身就是一个潜在的攻击面。
它每 20 分钟自动拉取数据,压缩成 Markdown,存进本地 SQLite。这个过程是自动的,不需要用户确认。
如果某个恶意邮件进入了这个管道,它就会被写入记忆系统,成为 agent 未来决策的上下文。agent 不会质疑记忆里的内容,它会把这些当作事实来使用。
agent 时代最大的安全问题,不是模型会不会胡说,而是模型有没有资格动手。
这不是 OpenHuman 独有的问题,但是 OpenClaw 和 Hermes 的做法是创建一个沙盒,只在沙盒里面操作。OpenHuman 目前没有这样的功能,相反,它的权限非常大,大到我甚至能用它来启动《魔兽世界》。

从 OpenClaw 到 OpenHuman
2026 年 3 月份 OpenClaw 的爆火,本质上是整个 AI 行业对 "agent 时代 " 的一次集体狂欢。
那时候大家兴奋的点,并不是 OpenClaw 这个产品本身,而是它让人第一次觉得,AI 不再只是聊天框,而是可以接管电脑、接入软件、执行任务、跨应用流转的 " 数字员工 "。
但几个月过去,热度明显下来了,行业也看清了一件事。agent 其实一直都能干活,但是要它真正稳定、高频、低风险地干活,几乎不可能。
OpenClaw 官方 showcase 里最常见的真实案例,其实集中在几类。PR review 后发到 Telegram、截图转 Markdown、早报生成、邮件 PDF 整理、岗位搜索、Slack 自动支持、WhatsApp 记忆库、书签语义搜索、TradingView 截图分析。
这些东西当然有用,但它们更像 " 信息搜集加整理加分发加半自动执行 ",还不是大家心目中那个犹如科幻电影里一样的赛博员工。
所以 OpenClaw 给行业上了一课。
agent 的第一阶段,只能做一些琐碎的事情,距离替代人类,还有些距离。
OpenHuman 没有拔高 agent 的上限,继续去讲 " 我能接管一切 " 的故事,转而是去提高下限,让所有人、所有设备都可以下载下来玩玩看。
然而这对产业的影响只会更大。
因为 OpenHuman 本质上是一个操作系统。
你打开电脑,不再需要打开其他任何应用,你只需要运行 OpenHuman,告诉它你要干什么,它会自己去调用这些应用。
这个逻辑一旦跑通,所有应用的价值就会被重新定义。
过去我们说一个应用好不好用,看的是它的界面设计、交互逻辑、功能丰富度。但在 OpenHuman 面前,应用的界面可能根本不重要了,因为用户再也不会打开它了。
应用变成了 OpenHuman 调用的工具,它的价值只剩下两个维度,一是数据质量,二是稳定性。
这就是为什么 OpenHuman 的 118+ 集成如此重要。
它是在建立一个新的应用生态。
在这个生态里,OpenHuman 是掌管一切,那些被集成的应用反倒成了底层的服务。用户只和 OpenHuman 交互,OpenHuman 负责把用户的意图翻译成对各个应用的调用。
更关键的是,OpenHuman 还掌握了你的记忆。它知道你上周收到了什么邮件,写了什么文档,和谁聊了什么。这些记忆不再只属于对应的应用,也属于 OpenHuman。
下次你问它 " 上周那个项目进展怎么样了 ",它会自己去这些应用里找答案,然后整合给你。应用只是数据的存储位置,OpenHuman 才是真正理解这些数据的那一层。
这个趋势一旦成型,整个 AI 产业的竞争格局就会重构。
模型能力仍然重要,但入口价值会变得更重要。谁能让用户每天打开,谁能掌握用户的上下文,谁能连接用户的工作流,谁就能在 agent 时代占据最有利的位置。
OpenHuman 现在还处于早期 Beta 阶段,功能还有很多粗糙的边缘。
但它的方向是清晰的,就是要成为个人 AI 时代的桌面操作系统。这个故事能不能讲通,不只取决于技术,还取决于它能不能在安全性、稳定性和用户体验上都做到足够好,让普通人愿意把自己的数字生活交给它。