关于ZAKER Skills 合作
钛媒体 23分钟前

OpenAI 最新报告:Codex 取代 ChatGPT,大神让“ Agent 团队”干活

文 | 世界模型工场

Agent 到底有没有真的改变工作?

OpenAI 最新发布的一份报告《The Shift to Agentic AI: Evidence from Codex》,给出了目前最直接的一组数据。

这份报告由 OpenAI、哥伦比亚商学院、沃顿商学院、杜克大学 Fuqua 商学院的研究者共同完成。

报告分析了 OpenAI Codex 的真实使用数据,比较了三类人群:个人账户用户、组织账户用户,以及 OpenAI 内部员工。

它不仅展示了 OpenAI 内部是如何最大化使用 Codex 的,还会让人产生一种感受:

AI 的使用方式正在经历一次静默的范式转移。

从和 AI 对话到让 AI 干活,从自己动手到管理一群 AI 员工,这个过程已经在发生,但大多数人还没意识到这件事已经在发生了。

Codex 用户半年增长五倍,但采用不均衡

报告显示,2026 年上半年,Codex 的周活跃用户数增长超过 5 倍。

但在个人用户、组织用户、OpenAI 内部员工之间,Codex 的使用强度差异很大。

报告数据表明,过去 28 天内使用过 Codex 的活跃用户,个人用户中的比例只有 0.7%,组织用户中的比例达到 17.3%,OpenAI 内部员工中达到 97.9%。

也就是说,在普通个人用户中,Codex 仍然是早期产品;在企业组织中,Codex 已经开始扩散;但在 OpenAI 内部,它已经接近全面普及。

报告特别指出,在 OpenAI 内部,Codex 已经基本替代 ChatGPT,成为主要的工作 AI 界面。

因为 OpenAI 是一个异常有利的环境,员工熟悉前沿模型、使用成本低、组织支持度高、培训和非正式知识分享普遍。

尽管 OpenAI 的使用不代表今天的典型企业,但它展示了一个信号:

当所有的采用障碍都被移除后,Agent 的使用会是什么样子。

Agent 任务越来越难,输出越来越多

报告还分析了用户交给 Codex 任务的复杂度,并为测试设置了一个巧妙的问题:

如果没有 AI,一个有经验的人类完成同样任务,需要多长时间?

结果很惊人。

2025 年 12 月,只有 35.4% 的活跃个人用户,发送过至少一个需要 1 小时以上人工完成的任务。

到了 2026 年 5 月,这个比例翻倍到了 70.2%。

更夸张的是需要 8 小时以上人工完成的任务,发送过这类任务的用户比例从 2.1%,飙升到了 25.6%,增长了 10 倍还多。

与此同时,产出也在暴涨。

2026 年 6 月,OpenAI 法律岗位的普通员工通过 Codex 和 ChatGPT 生成的月输出 Token,比 2025 年 11 月增长了 13 倍,普通研究人员的增长更是超过了 50 倍。

报告还发现一个有趣的现象:

在 Agent 时代,用户从一开始就在委派最复杂的工作。用户先提出最宏大、最复杂的需求,后续的对话只是不断地细化和修正。

这跟传统的 " 先问简单问题、再逐步深入 " 的交互模式完全相反。

Codex 早就不只是写代码了

虽然 Codex 最初是为软件开发设计的,但它的使用早已超出这个范围。

在 Codex 所有用户群体中,最常见的仍然是工程运维、代码实现、代码理解等软件相关任务。

但 Codex 也被广泛用于文档编写、数据分析、研究、协作沟通等非编码工作。

在 OpenAI 内部,Codex 还被用于研究、规划、沟通、招聘、销售、产品工作和数据分析。

使用范围越广的组织,Agent 的渗透越深,这似乎是一个自我强化的循环。

报告还比较了不同职能的使用差异。

在组织中,工程运维占大多数资历组输出 Token 的最大份额,但知识工件类任务在管理人员和高管中占比更高。

在 OpenAI 内部,个体贡献者更偏向工程运维,而管理层更偏向协作类任务。

不同角色用 Agent 做不同的事,但所有人都在用。

最深度用户在 " 管理一群 AI 员工 "

如果说普通用户还在用 AI 干活,那最前沿的用户已经在管一群 AI 员工干活了。

在 OpenAI 内部,只有 10.7% 的员工在同一时间只运行一个 Agent,近 30% 的员工在某个时间点同时管理 5 个或以上的并发 Agent。

报告描述这是一种 " 人类监督一支 Agent 团队 " 的工作方式,同时把任务分配给多个 Agent,监控进度,选择性介入。

在外部,这种并行工作流还不普遍。

约 67% 的组织用户和 64% 的个人用户,完全不使用并发 Agent。

但在 OpenAI 内部,这批最重度用户每天平均会让 Codex 累计运行约 71 小时。

比如,一个员工同时让 3 个 Codex agents 分别修 bug、写测试、整理文档。如果这 3 个任务各自运行 1 小时,报告就会记为累计运行 3 小时。

报告显示,从 2026 年 4 月 7 日以来,OpenAI 内部这批前 1% 重度用户的 Codex 累计每日运行时长,增长了近 88%。

外部用户也在增长,但强度明显低得多。

在组织用户中,使用强度排在前 1% 的用户,每日运行时长增长约 25%。

在个人用户中,前 1% 重度用户的每日运行时长增长约 50%。

用户开始把工作流封装起来反复使用

一次性使用 AI 完成某个任务,跟把一套工作流封装好让 AI 反复执行,是两种完全不同的深度。

Codex 通过 " 技能 "(Skills)和 " 插件 " 来实现工作流的系统化,即把指令、软件和外部工具集成打包,可以反复调用,甚至跨用户、跨组织共享。

2026 年 3 月 1 日,只有 5.4% 的活跃 Codex 用户调用过技能。到 6 月 11 日,这个比例达到了 26.6%。

分群体看差距更明显:

25.7% 的个人用户和 30.4% 的组织用户调用了技能,而在 OpenAI 内部,96.2% 的活跃用户调用了至少一个技能。

报告特别提到,自定义技能的增长尤其快,就是那些用户或组织自己编写的、针对特定团队标准或工作流程的技能。

这是一次更深层的工作方式变革。

一旦组织下定决心,AI 转型可以非常快

很多人以为,新技术总是从顶层先普及,但 Codex 的数据给出了相反的答案。

从职位来看,工程师是最早、最深地使用 Codex 的群体。

在组织用户中,普通工程师有 26.8% 的 Token 是在 Codex 上生成的,这一份额自年初以来增长了 5 倍。

数据和数据分析从业者紧随其后,达到 15.2%。

但从资历来看,Codex 的采用横跨了整个层级,从初级员工到高管都在用。

报告认为,高级用户用 Codex 不只是为了写代码,更多是为了规划、审查和委派任务。

有意思的是,在 OpenAI 内部,后来采用 Codex 的部门如:法务、招聘的转型速度,反而比早期采用的工程部门更快。

2026 年 1 月时,这些部门的 Codex 使用率接近于零,到 4 月初达到约 20%,一个月内就飙升至 75%。

这表明,一旦组织下定决心,转型可以非常快。

最会造 AI 的人,也是把 AI 用得最狠的人

这份报告最核心的一个洞见是:

Agent 的采用,不取决于模型有多强,而取决于组织环境有多支持。

同样的 Codex,在个人、组织和 OpenAI 内部,呈现出完全不同的使用模式。

报告认为,决定因素包括:相关文件和系统的访问权限、管理层的期望、员工的技能水平、以及是否有配套的审查流程。

这跟历史上所有通用技术的扩散规律一致。

技术本身只是催化剂,真正的变革发生在组织如何围绕技术重新设计工作流程。

报告用了一个经典的类比:

19 世纪末从蒸汽动力转向电力的过程中,早期工厂只是把蒸汽机换成电动机,工厂布局和 工作流基本没变。

真正的生产力爆发,发生在几十年后工厂被重新设计、生产流程被彻底重构的时候。

Agent 可能正在经历同样的过程。

当下的使用情况或许只是冰山一角,真正的变革还在后面。

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容