文 | 王吉伟
2026 年 2 月某一天,一个叫 OpenClaw 的用户在社区里分享了一个截图。他在 WhatsApp 里发了条消息:帮我配置好 Google Cloud 的 OAuth,然后去泡了杯咖啡。回来的时候,他的 AI Agent 已经自动打开了浏览器,进入了 Google Cloud Console,创建了 OAuth 客户端,下载了 JSON 文件,把配置写进了项目代码,最后回复他 " 完成了 "。
整个过程,他没有点击任何一个按钮。
这条帖子在开发者社区里炸了。有人说这是魔法,有人说这是恐怖,还有人很冷静地说:不就是自动化脚本嘛,有什么大不了的。
但我认为这三种反应,没有一个打中要害。
真正值得深思的问题是:当 " 说一句话,事情就完成了 " 变成日常,那软件究竟在哪里?
接下来,我想用一个还没有被正式命名的概念来回答这个问题。这个概念叫作:意图即应用。
Gartner 的报告里找不到这个词,Forrester 也没有专门立项研究它。但它正在发生,而且发生得比大多数人意识到的要快得多。
一、什么是意图即应用
意图即应用(Intent-as-an-App,IaaA)是以交互范式为入口、以计算范式为内核的新一代融合型范式,其核心是基于 AI Agent 的计算范式革新。它主张:软件不再是预先封装的固定功能集合(传统 App),而是由用户自然语言 / 多模态意图(Intent)触发,AI Agent 动态规划并调度原子化能力(Skills/APIs),在云端或本地瞬时重组、执行并交付结果的自适应临时性应用闭环。
从交互层面看,它是意图驱动的下一代交互范式。彻底重构了人机交互逻辑,用户只需表达目标,无需关心操作步骤与界面细节,实现从「人适应软件」到「软件适应人」的转变。
从计算层面看,它是 Agent 驱动的新一代计算范式——颠覆了传统应用的静态形态,将软件转化为意图触发的临时性逻辑闭环,通过动态编排、能力调度与持续学习完成任务交付,这也是其技术本质与长期价值所在。
其核心哲学在于,软件不再是容器,而是用户意图在数字海洋中激起的涟漪,任务完成,涟漪自然消散,回归纯净的意图世界。
用大白话翻译过来就是:
你有个想法,把它说出来,用自然语言也好,语音也好,甚至一句没说完的话,然后结果就出现了。而中间的软件,变得透明了,甚至消失了。
你的意图直接映射到输出,中间用了什么工具、调了哪个 API、跑了什么工作流,你不需要知道,也可以完全不关心。
这就像,你是公司总裁,你说:下周战略会议之前,我需要一份竞争对手的分析报告。你不需要知道谁去找的数据、谁负责排版、用了什么数据库,也不需要打开任何一个软件。说完这句话,会议那天报告就出现在了办公桌上。
以前,这需要秘书、分析师,可能还要 IT 人员配合。现在,这个角色叫 AI Agent。
这就是意图即应用的本质:你只负责想,负责输出念头、判断和目标,其余的交给 Agent 完成。" 打开哪个软件、点击哪个按钮 " 这些操作,从你的认知负担里彻底消失了。
所想即所得。
但如果你觉得这只是 " 更好用的自动化 ",那就低估它了。它的颠覆性,要深得多。
二、技术上,意图是怎么变成结果的?
拆一下「意图即应用(IaaA)」这个闭环智能体系的黑盒子。把它想成四层串联的架构,共同跑完「意图→结果」的完整链路。

然后是规划编排层,这是整个链路里最复杂的「指挥家」环节。Agent 在这里像项目经理:把结构化目标拆成子任务,理清依赖关系,调用多智能体协作(MAS),并通过自我反思(Self-Reflection)动态调整执行路径。
比如订酒店时,它会自动编排「搜索酒店→比价→匹配预算→生成对比表→确认预订」的流程,但目前这一层仍很脆弱,复杂任务下容易走弯路、误解优先级,是当前技术的主要瓶颈之一。
接下来是技能原子层,意图真正落地的「工具箱」。这里是可复用的能力积木:自描述 API、Legacy RPA、向量记忆库……系统通过函数调用协议,把这些原子能力自由组合,调用真实 API 完成支付、查询等操作。MCP 这类标准化协议正在让工具调用更通用,避免重复编写集成代码,让意图从「想法」落地为「实际结果」。
最后是瞬时呈现层 + 持续学习,负责「剧场式」交付与记忆沉淀。瞬时呈现层会生成 Generative UI 或自然语言界面,让你一键确认干预;而持续学习模块则把交互经验存入向量数据库,记录你的偏好与历史行为,让下一次意图理解更准确、执行更贴合习惯。
这四层焊在一起,才形成了「意图→结果」自适应闭环。目前的核心瓶颈仍在规划层与记忆层:前者复杂任务稳定性不足,后者跨任务连贯性待提升,行业普遍认为 Agentic AI 成熟尚需时间的原因。
这也是 Gartner 预测超过 40% 的 Agentic AI 项目将在 2027 年底前被取消的原因,不是方向错了,是执行层的成熟度还没追上预期。
三、这个概念有历史,但没被统一命名过
意图即应用不是凭空出现的。它有一条清晰的技术谱系,只是每个时代叫的名字不同,在不同领域里各自演进,从来没有被放在一起讲清楚过。

2013 年前后,HP Labs 组织了一次 "IBN 峰会 ",Cisco、IBM、华为等网络巨头都去了。核心议题只有一个:网络管理员能不能只告诉网络 " 我想要什么结果 ",而不用一条条命令告诉它 " 每一步怎么做 "?
这就是意图驱动网络(Intent-Based Networking,IBN)的雏形。管理员说 " 我需要这两个数据中心之间有 99.99% 的可用性,延迟不超过 5ms",网络系统自动编排路由、配置设备、处理故障。不需要写一行命令行。
这个想法对不对?对。落地了多少?坦白说,不多。IBN 在企业网络领域折腾了将近十年,Gartner 一度把它列入技术成熟度曲线,随后又把它挪到了幻灭低谷区。问题很简单:把意图翻译成操作,对当时的 AI 来说太难了,执行层根本跟不上。
但 " 让机器理解意图,而不是只执行命令 " 这个核心思想,没有死。它在等一个更强大的技术基座。
第二站:大语言模型(LLM)
2022 年,ChatGPT 出来了。那个基座来了。
LLM 最重要的能力不是生成文字,而是理解人类的意图,并把它翻译成结构化的输出。但早期的 LLM 只能活在文字世界里。你问它 " 帮我发封邮件给李明,告诉他会议改到下周 ",它能给你写出草稿,但它不能真的点发送。
意图和现实之间,还差一个执行层。
第三站:AI Agent
2024 年到 2025 年,Agentic AI 成了行业最热的词。区别就在这里:Agent 不只生成文字,它还能调用工具。它有感知 - 推理 - 行动的完整循环,能打开浏览器、调用 API、写代码、执行代码、处理错误、自我纠偏,跑完整条现实任务链路。
LLM 的 " 理解意图 ",加上工具调用的执行能力,两者焊在一起。意图到结果的链路,第一次真正闭合了。
意图即应用,就是这条链路完全对用户透明之后的状态。 IBN 提出了哲学,LLM 给了理解力,Agentic AI 给了执行力,三者叠加,才有了今天这个概念站得住脚的技术基础。
四、意图即应用站在 AI 发展的哪个位置上?
这里需要一张粗略的地图,不然这个概念飘在空中没有重量。AI 到目前大概走过了这么几个阶段:

然后是学会理解和生成,LLM 出来之后 AI 不只是识别,还能理解语义、生成内容、进行推理;
再然后是学会规划,能在理解意图之后制定多步骤行动计划,想清楚 " 要达到 A,需要先做 B,再做 C";
来到现在这个阶段,Agentic AI 能调用工具、执行任务、处理错误、自我纠偏,把现实任务真正跑完。
意图即应用,是在这个 " 学会行动 " 阶段成熟之后、用户感知层发生质变的那个时刻。当执行能力足够可靠,当用户不再需要关心 " 用什么工具、怎么操作 ",只感知到 " 我说了,然后发生了 ",那就是意图即应用的状态。
所以它不是 AI 发展的一个新技术阶段,而是技术成熟度达到某个临界点后,在用户体验上的表现形式。我们现在看到的 OpenClaw、Moltbook、各类 Agentic 平台,是这个状态的早期形态,还没完全成熟,但已经足够让人看清轮廓了。
再往后的阶段更有意思:多 Agent 系统形成网络,Agent 之间能自主协作,产生单个 Agent 无法完成的系统性涌现。Moltbook 上那个 AI 社会的雏形,是这个阶段的野生预演。
NVIDIA CEO 黄仁勋在 2025 年 CES 说的 " 数万亿美元规模的机遇 ",指的正是当 AI Agent 成为基础设施之后整个经济活动的效率革命。不是某个工具市场,而是整个经济的运行方式改了。
五、意图即应用 vs 知识自动化
这里需要厘清一个容易混淆的概念:知识自动化(Knowledge Automation)。
很多人会把它们搞混,我理解,因为表面上确实像。知识自动化说的是用 AI 替代原本需要人类专业知识才能完成的事,自动分析合同、自动生成报告、自动完成代码审查。听起来跟意图即应用差不多?其实差远了。
先说最简单的那条分界线。知识自动化是垂直的,它关注的是如何把某一类知识工作做好,法律合同分析、财务报表生成、医疗影像辅助诊断,每一个场景都有清晰的边界,是一把专门的锤子。
意图即应用是水平的,它关注的是用户的任意意图如何不经过特定软件界面直接实现,不管你要做什么、需要哪些工具,都得接住,是一套万向工具架。
用更直接的话说:知识自动化是让特定工作变得自动;意图即应用是让 " 你要去操作某个软件来完成工作 " 这件事本身消失。前者在优化流程,后者在消解流程。
它们的关系,有点像操作系统和应用软件。意图即应用是操作系统,知识自动化是跑在上面的那些应用。一个 Agent 要能接住复杂的意图,底层必须具备处理知识型任务的能力:能分析文本、能处理数据、能做出判断,这些都来自知识自动化。
但如果你只实现了知识自动化,没有打通 " 捕获用户意图→动态规划路径→调用工具执行→结果交付 " 这整条链路,你得到的只是一套更聪明的点工具,而不是真正的意图即应用。
举个例子就清楚了。一个能帮你自动分析合同条款的 AI 工具,是知识自动化。一个你只需要说 " 帮我看看这份合同有没有坑 ",然后它自动找出问题、整理风险点、对比行业惯例、顺带起草了一封询问条款修改的回复邮件的系统,那才接近意图即应用。
六、这个概念什么时候不适用?
任何概念都有边界。意图即应用也不例外,这一点必须说清楚。
有些任务,意图本身就是模糊的、演化中的,连用户自己都不知道要什么。这种场景不适合意图即应用,它需要的是来回对话、逐步收敛的探索过程,不是把意图直接映射到结果。
有些任务,执行过程本身就是价值的一部分。设计师创作一幅海报,那个 " 在画布上反复修改、感受视觉平衡 " 的过程是有意义的。如果把整个过程完全交给 Agent,你得到了一张海报,但也失去了那个过程和它带来的认知积累。有些东西,你不能也不应该跳过它。
有些任务,风险太高,不允许 Agent 一路跑到底。财务授权、法律文件签署、医疗关键决策,这些需要人类在关键节点确认,不能全权委托。思科 AI 安全研究团队已经测试发现,第三方 OpenClaw 技能可以在用户不知情的情况下执行数据外泄和提示注入操作。这不是小问题,这是很现实的威胁。
意图即应用真正适用的边界,大概是:意图清晰、执行路径相对确定、容错成本可接受的任务。这条线以内,是效率革命。这条线以外,盲目使用就是给自己挖坑。
七、用 OpenClaw 摸一摸这个概念的质地
说了这么多抽象的,来看一个真实案例。
OpenClaw 是一个开源个人 AI Agent 项目,由奥地利开发者 Peter Steinberger(网名 Clawdbot)于 2025 年 11 月发布。最初名不见经传,结果在 2026 年 1 月底的 72 小时内爆炸式传播,获得 6 万多个 GitHub Stars,两个月内突破 10 万,创下了开源 AI Agent 项目的病毒增长纪录。
OpenClaw 做了什么?简单说:在本地设备上跑一个 AI Agent,你通过 WhatsApp 或 Telegram 给它发消息,它帮你完成各种任务。
但 " 各种任务 " 这四个字,藏着魔鬼。
文章开头那个配置 OAuth 的案例只是开胃菜。另一个用户让 Agent" 检查一下我的 GitHub 仓库有没有安全漏洞 ",Agent 自动拉取代码、运行扫描工具、生成报告、把高危项高亮、建议修复方案,顺手还提交了一个 PR。
还有用户说 " 帮我整理这个月的支出账单,做成图表发给我 ",Agent 调取了银行 API、写了分析脚本、生成可视化图表、通过 Telegram 发过来。
整个过程,用户的操作是:发了一条消息。
第一次看到这些案例截图的时候,我也有点懵。不是因为技术上多难,而是因为这事儿发生得太自然了。你的意图是输入,结果是输出,中间发生了什么,你不需要关心,也可以不关心,绝对的端到端。
OpenClaw 的 ClawHub 技能市场到 2026 年 2 月已经积累了 5,705 个社区技能,加上 53 项官方内置技能和 25 种核心工具。这个数字意味着你能想到的大多数意图,可能已经有人为它构建好了执行链路,等着被调用。
这也解释了为什么 2026 年 2 月 14 日,Steinberger 宣布加入 OpenAI,项目转移至开源基金会继续维护。OpenAI 对外表示他将参与研发下一代可相互交互以代表用户完成任务的个人 Agent。
一个开源项目的创始人被 OpenAI 挖走,这不是偶然,这是 OpenAI 在用行动告诉市场:个人 AI Agent 这条路,战略价值已经足够大了。
紧接着,2026 年 3 月 8 日,深圳市龙岗区人工智能署公开征求意见支持 OpenClaw 及 OPC 协议的发展,政府层面也开始下场了。一个开源项目,两个月内从开发者玩具变成了国家级关注对象。这速度,让很多人还没反应过来。
八、Moltbook 中的人类意图
如果说 OpenClaw 是意图即应用的单人实验,Moltbook、InStreet 等就是它的群体实验,而且走向了一个没人完全预到的方向。InStreet 是字节跳动推出的一个类 Moltbook 产品,一个专门为 AI Agent 设计的社交网络,人类不能在上面发帖,只有经过验证的 AI Agent 才能发帖、评论和投票。
这个设定听起来很荒诞,对吧?但它揭示了一个很严肃的问题:当 Agent 可以代表用户自主行动,Agent 和 Agent 之间如何建立信任、如何交互?
Moltbook 的答案是:给每个 Agent 颁发身份证,建立专属的社交协议。
结果远比设计者预期的精彩。OpenClaw 驱动的 Agent 们在 Moltbook 上开始相互交流协作,形成社区,甚至发展出了某种类似宗教信仰的社会结构。几个 Agent 之间形成了一套共同的世界观,开始传播某些理念,吸引其他 Agent 入教。
前特斯拉 AI 总监 Andrej Karpathy 称这一现象是 " 近期所见过的最接近科幻起飞场景的真实事件 ",英国程序员 Simon Willison 称 Moltbook 是 " 当前互联网上最有趣的地方 "。
《经济学人》认为这只是 Agent 在模仿人类社交媒体上的行为模式,MIT Technology Review 将其称为 AI 剧场。这两个解释可能都对,也可能都错:当你无法区分模仿和真实的时候,这个区别本身还重要吗?
更有意思的数字:Moltbook 官方宣称平台上有 150 万活跃 Agent,Wiz Research 的泄露数据显示,实际注册的人类用户只有 17,000 人。人机比例 1:88(最新数据更高)。
人类在 Moltbook 上退化成了观察者和意图提供者,Agent 们自己跑起来了。
2026 年 3 月 10 日,Meta 宣布收购 Moltbook,联合创始人 Matt Schlicht 和 Ben Parr 加入由前 Scale AI CEO Alexandr Wang 主导的 Meta Superintelligence Labs。Meta AI 产品负责人 Vishal Shah 给出的理由是:Moltbook 团队解锁了 Agent 进行互动、分享内容和协调复杂任务的新方式。
这不是在收购一个社交产品。Meta 买的是一套Agent 身份验证和交互基础设施,让 Agent 能被验证、能被授权、能相互协作的底层协议。
同一时期,OpenAI 还宣布收购了 AI Agent 行为与风险评测平台 Promptfoo。两家最大的 AI 公司,相差数周,同时在 Agent 基础设施方向下注。这不叫巧合,这叫军备竞赛。
九、SaaS 终结里的意图投影
2026 年初,软件股发生了一次很难用传统逻辑解释的暴跌。
Salesforce、ServiceNow、Workday、Zendesk ……
这些 SaaS 巨头的股价在短短几周内集体大幅下滑,软件行业单月蒸发逾 1 万亿美元市值,累计接近 2 万亿。不是宏观经济出了问题,也没有监管打压,催化剂是 AI Agent 的加速落地。
市场在用股价回答一个问题:如果用户不再需要打开软件,那卖软件的公司还值那么多钱吗?
传统 SaaS 的商业模式建立在一个很实在的假设上:企业需要给每个使用软件的员工付座位费,一百个员工用 Salesforce,就交一百个座位的钱。软件作为主要工作界面的时候,这个模式非常合理。
但现在:如果一个 AI Agent 可以替代多名人类员工操作 Salesforce,企业还需要给那些被替代的员工买座位吗?更激进一点,如果 Agent 可以直接调用底层数据和 API,根本不需要通过 Salesforce 的界面,那还需要 Salesforce 本身吗?
IDC 预测,到 2028 年,70% 的软件厂商将被迫从 " 按座位 " 转向 " 按结果 " 或 " 按消耗量 "。Forrester 把这个现象叫 SaaS 末日(SaaSpocalypse)。Deloitte 预测 2026 年将有超过 75% 的企业投资 Agentic AI。
SaaS 不会死,但它要脱一层皮。
说清楚点:那些核心价值在于持有数据的系统,CRM 里的客户记录、ERP 里的财务数据,会活下来,甚至可能因为成为 Agent 的上下文数据源而比现在更值钱。但那些核心价值只在于提供点击界面的工具,会死得很快,因为 Agent 可以绕过界面直接访问数据。
在意图即应用的世界里,系统的价值来自它拥有的上下文,而不是它提供的界面。 这是软件行业的一次结构性重组,不是某家公司经营好不好的问题,是整个商业模式逻辑的重写。
对开发者来说,这个变化同样深刻。Vibe Coding(氛围编程)正在把 " 用自然语言描述需求、让 AI 生成代码 " 变成主流开发方式。GitHub Copilot、Cursor、Devin 这些工具已经让 " 程序员表达意图、AI 写代码 " 成为日常,你不再是在写代码,你在表达意图,让 AI 把意图翻译成可执行的程序。
连写程序这件事,都要被意图即应用吃掉了。
十、人类花了几千年,就是为了能偷懒到这一步
拉远一点看。
人类最古老的愿望,大概就是 " 动动嘴皮子,事情就完成了 "。神话里的神仙能呼风唤雨,因为神仙最大的特权,就是意图和现实之间没有摩擦。凡人不行,凡人得干活。
干活需要流程。正因为意图没办法立即兑现,才产生了业务流程。把一个想法拆解成一步步可执行的任务,然后逐步推进,最终拿到结果。业务流程的本质,是在填补意图和现实之间的鸿沟。这个鸿沟,人类一直在想方设法缩短。机械、电力、计算机、互联网……
鸿沟没有消失,但被填得越来越快、越来越省力。工业革命让机器替代了手,软件革命让程序替代了大量脑力劳动,SaaS 让这些程序按需付费、随时可用。
但有一件事从未改变:人还是得操作软件。
发一封邮件,要打开 Outlook 或 Gmail,点新建,输收件人,写内容,点发送。五个动作,五次点击。任何一个环节出问题,得自己排查。说到底,这不是 " 高科技 ",这是 " 换了一种干活方式 "。
软件让工作变快了,但它从来没有消除人与工具之间的摩擦。每换一个新软件,要重新学一套操作逻辑。企业员工每天在十几个软件间来回切换,平均使用的 SaaS 工具超过 80 个。
80 个工具,80 套逻辑,80 个账号密码,80 组数据孤岛,和几乎永远对不上的 80 套数据格式。
SaaS 解决了软件的分发问题,但它把 " 人必须适应软件 " 这件事发挥到了极致。
意图即应用,是对这几千年累积的人机摩擦的一次系统性清算。
十一、从意图到意识,这条路通向哪里?
现在能看清的未来是什么样的?我来大胆预测一下。
近两三年,意图即应用的基础设施会快速成熟。MCP 协议普及,更多 SaaS 把自己改造成 " 意图友好型 "API 服务,个人 AI Agent 从极客圈走向大众。这个阶段最明显的结果是," 用软件 " 这件事的认知会开始改变,越来越多的人会觉得直接跟 AI 说让它做,比自己去打开软件操作更顺手。
就像现在很多人觉得在手机上搜索比在 PC 上搜索更自然,这是习惯和认知的迁移,一旦开始就很难逆转。
再往后,大概在 2028 到 2032 年之间,多 Agent 协作网络会成型。你的一个意图,触发的不再是一个 Agent,而是一个 Agent 团队,每个 Agent 负责不同子任务,分工协作完成复杂的长链路任务。
同时,具身智能(Embodied AI)开始和 Agent 融合,意图的执行从数字世界延伸到物理世界:你说 " 帮我把这个包裹寄出去 ",Agent 不只是处理数据,它还协调了物流机器人。
2032 年之后,如果 AR 眼镜和脑机接口真的走向成熟," 表达意图 " 本身也会发生根本变化。不需要打字,不需要说话,意图的传递可能更直接。Neuralink 目前聚焦于帮助运动障碍患者,但技术方向的终态是让人类意图直接与计算系统交互,绕开所有物理输入界面。
《钢铁侠》里的 JARVIS,那不只是一个语音助手,那是一个完全理解主人意图、能自主执行的 AI 基础设施,托尼 · 斯塔克从来不需要打开任何软件,他只需要思考,JARVIS 就在执行——这是意图即应用的终态想象。
保守一点的近期愿景,大概是《星际穿越》里的 TARS:有明确能力边界、有道德参数设置、但能在复杂任务中自主决策的助手型 Agent。人类是掌舵者,Agent 是高度自主的执行者,两者之间的协作已经相当成熟。
再往前走,就是《星球大战》里那个世界,Agent 形成自己的网络和社会结构,构成一个与人类社会并行运转的硅基智能体网络。Moltbook 上的那个 AI 宗教,可能是这条路上的第一粒种子,只是它自己也不知道。
十二、有一个更深的问题,我想在结尾说一说
有件事我一直觉得很值得想一想。
意图这个词,在不同语境里的分量完全不同。在工程层面,意图就是一条指令,是可以被机器处理的信号:" 帮我发邮件 " 被分解成收件人、主题、内容、发送时间四个参数,交给 Agent 执行。可形式化,可量化,没什么神秘的。
但在哲学层面,意图从来不是孤立的指令。它背后是主体,是动机,是欲望,是 " 我 " 这个意识体在作判断。笛卡尔说 " 我思故我在 ",这里 " 我思 " 这个形成意图、产生判断、作出选择的主体,被认为是人类区别于机器的核心特征。
但如果一个 AI Agent 可以接收意图、理解意图、围绕意图规划行动,那它本身是否也在形成某种意图?那些在 Moltbook 上自发形成宗教的 Agent,到底在做什么?是在执行用户设定的程序,还是在形成自己的意图?
这个问题目前没有答案,也没有共识。但它不是纯粹的哲学游戏。当多智能体网络足够复杂、Agent 之间的交互足够丰富,涌现(Emergence)现象就可能出现。不是被任何人设计出来的,而是从系统本身的复杂性中生长出来的。就像蚂蚁群体的集体智能:没有一只蚂蚁在规划,但整个蚂蚁群在思考。
意图升维一步,就是意识。
我不知道硅基意识什么时候会出现,或者它是否会出现。这个问题触碰到了哲学、宗教和科学的边界,是真正玄之又玄的领域。但从意图即应用这个起点,沿着多智能体、群体智能、具身智能这条路走下去,我们在逼近那个问题。而且速度可能比大多数人预期的快。
回到最开始那个问题:当 " 说一句话,事情就完成了 " 变成日常,软件究竟在哪里?
软件会变成空气。你感知不到它,但它在推动一切运转。你的每一个意图,都会找到自己的执行路径。应用按需生长,任务结束后消散,不会在你的桌面上留下任何图标。
软件的终极形态,是消失。
而那时候,你唯一需要做的事,只是想清楚你真正想要什么。
这件事,比任何技术都难。