文 | 窄播,作者|李威
对于 AI 领域而言,本周是重量级消息不断爆出的一周。从黄仁勋重新定义 AI PC,到微软 Build 2026 喊出「Agent 优先」,OpenAI 宣布合并 ChatGPT 和 Codex,再到微信 Agent 进展曝光、千问开始接入第三方 Skill、豆包回应付费传闻、美团财报会上强调服务 AI Agent 正变得越来越重要。
此前有人在问曾经爆火的 OpenClaw 怎么没人提了?本周传出的这些消息用实际行动回答了这个问题——大家不再提 OpenClaw,是因为Coding Agent 成为一种执行任务的通用方案,并与 Chatbot 走向融合,同时与之相匹配的 Skill 和 Agent 生态也开始建设,新的付费探索也正在进行中。
大厂在将 OpenClaw 带来的启发转化为真实的业务进展。这个过程中,OpenClaw 以及我们现在看到的产品,可能都不会是 AI 产品的最终形态。就像腾讯首席 AI 科学家姚顺雨在 2026 腾讯云 AI 产业应用大会上所说,一场长周期的变革才刚刚开始,真正的产品形态、商业机会和使用方式,都还远没有被充分发明出来。
我们能确定的是,Agent 正在成为大厂 AI 的核心战场,而这场竞争的形态,正在沿着四条主线不断演变:谁能拓展更多生产力场景的用户;谁能更深度打通内部产品;谁能建立起足够丰富的 Skill、Agent 生态;谁能积累足够的上下文。
「同事」成为 Agent 的竞争焦点
「同事」是当下描述 Agent 时最常被提及的词汇。微软的 Scout 被设计成「像同事一样」工作;扣子 3.0 强调让人和 AI 团队一起协作;OpenAI 推出的 Agent 插件则被形容为「已办完入职、懂全套流程的新同事」。
这些表述意味着,生产力场景已经成为大厂 Agent 的竞争焦点。
微软推出的 Scout,是基于 OpenClaw 框架打造的 Agent,常驻 Microsoft 365,可在 Teams 中运行,能与 Outlook、OneDrive 等办公应用协同,浏览邮件、日历、工作消息,自动处理会议冲突、起草回复、推进任务。同时,微软还推出了 Agent 365,为企业统一管理 Agent 的身份、权限、策略和风险。
OpenAI 则把发布会的主题直接定为「Intelligence at Work」。在这场发布会上,OpenAI 为 Codex 进行了三项核心升级:推出可定制能力的 Agent 插件;将局部批注修改能力从代码和网页,拓展到文档、表格和 PPT 上;通过生成网站来进行产出汇报的能力。
同时,豆包在针对付费功能的回应中提到,针对专业人群的生产力需求,豆包计划推出豆包专业版,将包含软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究等专业服务。

OpenAI 发布的数据显示,今年 2 月以来,Codex 的周活增长了 6 倍,达到 500 万,其中知识工作者的增速是开发者的 3 倍。Anthropic 第二季度的收入预计将增长逾一倍,达到 109 亿美元,并可能实现 5.59 亿美元的营业利润,其收入大多来自企业和初创公司。
内部产品的整合与连接在不断深化
产品的更新与迭代,对应的是更深层的产品架构重组。一方面,目前大厂基本都布局了 Chatbot 和一个或多个 Agent 产品,现在针对这些产品的整合已经开始。其中最激进的就是 OpenAI 对 ChatGPT 和 Codex 的整合。
OpenAI 想要让 ChatGPT 从单纯的对话入口,升级成为协同 Agent 工作的主界面,而 Codex 则会升级为能够满足办公、科研、企业流程、数据分析、业务运营等多场景工作需求的通用 Agent 平台,其内核是对 Coding Agent 的使用场景泛化。通过这场整合,OpenAI 期待将 Codex 推广向 ChatGPT 的庞大用户群体,扩大付费用户基数。
还有消息显示,OpenAI 计划让 AI 浏览器 Atlas 也参与到这场超级 AI 应用的整合中。
另一方面的整合,是大厂原有的互联网产品能力和服务,在快速以 Skill 或 Agent 的形式被整合到 AI 产品中。阿里为千问增加点外卖、打车、淘宝购物的能力,是比较早期的探索。现在,我们可以看到字节、美团、腾讯都在做类似的工作。
字节在给豆包打通抖音商城之后,又在增加美食、电影票、民宿等本地生活服务的门店及团购套餐推荐。美团在财报会上表示,AI 助手「小团」嵌入了美团 APP,五一期间服务了过亿人次用户,覆盖吃喝玩乐、出行、问诊等场景。腾讯文档也将过去所积累的文档处理能力变成 Skill,被 WorkBuddy 调用。
腾讯集团高级执行副总裁汤道生在 2026 腾讯云 AI 产业应用大会期间表示,过去很多传统应用的功能,要转换成可被智能体调用的能力,才能够把过去多年积累下来的价值进一步释放出来。所以今年企业微信在把原来的一些数据能力通过接口、通过 Skill 开放出来,让其他智能体可以调用。这种开放的趋势是越来越明显的。
第三方生态建设开始提上日程
Agent 与此前产品的一个核心差异是,它具备工具调用的能力。这就要求 Agent 背后能够有一个足够丰富的工具生态。即便是大厂,也很难凭一己之力去构建起这个生态。这就需要第三方的 Skill 或 Agent 生态建设。
现在这个生态的建设已经提上了日程。
千问在完成对阿里内部第一方产品、服务的整合之后,宣布将向第三方 Agent、Skill 全面开放,让所有企业均可在千问运营自己的品牌 Agent。本周,瑞幸、肯德基、蜜雪冰城、东方航空已经在千问上线了 Skill。随后企业还能够在千问中自定义 Agent 人设与具体服务。
腾讯则一方面在将美团的小美接入到元宝中,为用户提供外卖点餐、配送等服务;另一方面在加速微信 Agent 生态的建设。
媒体报道显示,微信的 Agent 已完成原型测试,最快将于本月启动公开上线前的合规审批流程。这个 Agent 能调度微信小程序,实现点餐、打车、订票、购物及本地生活等复合服务。
此外,微信还在尝试与荣耀、小米等手机厂商建立 Agent to Agent 的连接,让自己的基础能力能够被手机厂商的 Agent 调用。也就是说,手机厂商也将成为微信 Agent 生态的新入口,形成多个入口共用一套 Agent 生态的架构。
OpenAI 的 Agent 插件,则能够一次性打包岗位所需的工具、知识和技能。比如,创意生产插件可以根据 brief 生成 campaign board、展示广告变体、产品生活方式图和电商图集,并能够调用 Figma、Canva、Shutterstock、Picsart、Fal 等工具。简单理解,这就是一套为 Agent 准备的职业传承体系。
目前 Codex 的 Agent 插件覆盖了 62 个热门应用和 110 项技能。后续,OpenAI 希望把插件生态开放给合作伙伴,让第三方直接在 Codex 和 ChatGPT 中创建并部署自己的插件。
上下文变得更为重要
姚顺雨表示,模型越来越擅长把复杂输入变成输出,但前提是它能拿到足够好的输入。这就需要在用户端能够为模型和 Agent 提供足够详实、有用的信息,让模型和 Agent 能理解「你是谁」「你正在做什么」「什么答案对你有价值」等能锚定正确路径的问题。
在开发端,围绕 AI 产品开发,也需要有充分的上下文沟通。姚顺雨和汤道生在上述活动的对谈中提到,AI 产品开发需要从产品反馈中去确定模型应该奖励什么、惩罚什么,什么回答算好,什么行为算差。这意味着,模型团队和产品团队需要通过一个上下文共享的过程,完成 Co-Design,共同创造出更好的体验。
因此,AI 产品在用户端要连接和积累多源的上下文信息,然后通过辨别什么信息该给,什么信息不该给,来与 Agent 对齐任务意图;在开发端则要建立顺畅的反馈机制,将模型团队与产品团队的开发目标进行对齐,加速体验优化。
无论是用户端上下文的积累,还是开发端上下文的共享,都不仅是开发问题,更是组织问题,要通过协同来实现上下文的积累与共享。
这也是为什么,OpenAI 为了整合 ChatGPT 和 Codex,在今年 1 月就开始重组团队,让产品团队和负责相关底层模型的研究人员更紧密协作;然后又将 ChatGPT、Codex 和 API 团队整合成了一个部门,由 Thibault Sottiaux 负责。
同时,对上下文的重视,可能还会刺激硬件的 Agent 化,让硬件成为一种 Agent 收集用户上下文的有效途径。微软的 Project Solara 项目就是在进行这种探索。随时随地的沟通并不是开发 Agent 桌面终端和随身设备的唯一目的,更多的目的是在桌面、移动场景中为 Agent 执行任务提供更多上下文信息。
过去几年,AI 行业呈现出了一条相对清晰的技术路径:预训练→后训练→ Agent → Coding Agent。这条路径可能不是未来唯一的主线,但却是大厂当下能抓住的最有效的主线。
我们提炼出的四个趋势,则是固定路径走向的层层相连的基础坐标,最终都是为了实现 Coding Agent 向通用场景的泛化。这又是一场系统级的竞争。