OpenAI 最新报告：Codex 取代 ChatGPT，大神让“ Agent 团队”干活

文 | 世界模型工场

Agent 到底有没有真的改变工作？

OpenAI 最新发布的一份报告《The Shift to Agentic AI: Evidence from Codex》，给出了目前最直接的一组数据。

这份报告由 OpenAI、哥伦比亚商学院、沃顿商学院、杜克大学 Fuqua 商学院的研究者共同完成。

报告分析了 OpenAI Codex 的真实使用数据，比较了三类人群：个人账户用户、组织账户用户，以及 OpenAI 内部员工。

它不仅展示了 OpenAI 内部是如何最大化使用 Codex 的，还会让人产生一种感受：

AI 的使用方式正在经历一次静默的范式转移。

从和 AI 对话到让 AI 干活，从自己动手到管理一群 AI 员工，这个过程已经在发生，但大多数人还没意识到这件事已经在发生了。

Codex 用户半年增长五倍，但采用不均衡

报告显示，2026 年上半年，Codex 的周活跃用户数增长超过 5 倍。

但在个人用户、组织用户、OpenAI 内部员工之间，Codex 的使用强度差异很大。

报告数据表明，过去 28 天内使用过 Codex 的活跃用户，个人用户中的比例只有 0.7%，组织用户中的比例达到 17.3%，OpenAI 内部员工中达到 97.9%。

也就是说，在普通个人用户中，Codex 仍然是早期产品；在企业组织中，Codex 已经开始扩散；但在 OpenAI 内部，它已经接近全面普及。

报告特别指出，在 OpenAI 内部，Codex 已经基本替代 ChatGPT，成为主要的工作 AI 界面。

因为 OpenAI 是一个异常有利的环境，员工熟悉前沿模型、使用成本低、组织支持度高、培训和非正式知识分享普遍。

尽管 OpenAI 的使用不代表今天的典型企业，但它展示了一个信号：

当所有的采用障碍都被移除后，Agent 的使用会是什么样子。

Agent 任务越来越难，输出越来越多

报告还分析了用户交给 Codex 任务的复杂度，并为测试设置了一个巧妙的问题：

如果没有 AI，一个有经验的人类完成同样任务，需要多长时间？

结果很惊人。

2025 年 12 月，只有 35.4% 的活跃个人用户，发送过至少一个需要 1 小时以上人工完成的任务。

到了 2026 年 5 月，这个比例翻倍到了 70.2%。

更夸张的是需要 8 小时以上人工完成的任务，发送过这类任务的用户比例从 2.1%，飙升到了 25.6%，增长了 10 倍还多。

与此同时，产出也在暴涨。

2026 年 6 月，OpenAI 法律岗位的普通员工通过 Codex 和 ChatGPT 生成的月输出 Token，比 2025 年 11 月增长了 13 倍，普通研究人员的增长更是超过了 50 倍。

报告还发现一个有趣的现象：

在 Agent 时代，用户从一开始就在委派最复杂的工作。用户先提出最宏大、最复杂的需求，后续的对话只是不断地细化和修正。

这跟传统的 " 先问简单问题、再逐步深入 " 的交互模式完全相反。

Codex 早就不只是写代码了

虽然 Codex 最初是为软件开发设计的，但它的使用早已超出这个范围。

在 Codex 所有用户群体中，最常见的仍然是工程运维、代码实现、代码理解等软件相关任务。

但 Codex 也被广泛用于文档编写、数据分析、研究、协作沟通等非编码工作。

在 OpenAI 内部，Codex 还被用于研究、规划、沟通、招聘、销售、产品工作和数据分析。

使用范围越广的组织，Agent 的渗透越深，这似乎是一个自我强化的循环。

报告还比较了不同职能的使用差异。

在组织中，工程运维占大多数资历组输出 Token 的最大份额，但知识工件类任务在管理人员和高管中占比更高。

在 OpenAI 内部，个体贡献者更偏向工程运维，而管理层更偏向协作类任务。

不同角色用 Agent 做不同的事，但所有人都在用。

最深度用户在 " 管理一群 AI 员工 "

如果说普通用户还在用 AI 干活，那最前沿的用户已经在管一群 AI 员工干活了。

在 OpenAI 内部，只有 10.7% 的员工在同一时间只运行一个 Agent，近 30% 的员工在某个时间点同时管理 5 个或以上的并发 Agent。

报告描述这是一种 " 人类监督一支 Agent 团队 " 的工作方式，同时把任务分配给多个 Agent，监控进度，选择性介入。

在外部，这种并行工作流还不普遍。

约 67% 的组织用户和 64% 的个人用户，完全不使用并发 Agent。

但在 OpenAI 内部，这批最重度用户每天平均会让 Codex 累计运行约 71 小时。

比如，一个员工同时让 3 个 Codex agents 分别修 bug、写测试、整理文档。如果这 3 个任务各自运行 1 小时，报告就会记为累计运行 3 小时。

报告显示，从 2026 年 4 月 7 日以来，OpenAI 内部这批前 1% 重度用户的 Codex 累计每日运行时长，增长了近 88%。

外部用户也在增长，但强度明显低得多。

在组织用户中，使用强度排在前 1% 的用户，每日运行时长增长约 25%。

在个人用户中，前 1% 重度用户的每日运行时长增长约 50%。

用户开始把工作流封装起来反复使用

一次性使用 AI 完成某个任务，跟把一套工作流封装好让 AI 反复执行，是两种完全不同的深度。

Codex 通过 " 技能 "（Skills）和 " 插件 " 来实现工作流的系统化，即把指令、软件和外部工具集成打包，可以反复调用，甚至跨用户、跨组织共享。

2026 年 3 月 1 日，只有 5.4% 的活跃 Codex 用户调用过技能。到 6 月 11 日，这个比例达到了 26.6%。

分群体看差距更明显：

25.7% 的个人用户和 30.4% 的组织用户调用了技能，而在 OpenAI 内部，96.2% 的活跃用户调用了至少一个技能。

报告特别提到，自定义技能的增长尤其快，就是那些用户或组织自己编写的、针对特定团队标准或工作流程的技能。

这是一次更深层的工作方式变革。

一旦组织下定决心，AI 转型可以非常快

很多人以为，新技术总是从顶层先普及，但 Codex 的数据给出了相反的答案。

从职位来看，工程师是最早、最深地使用 Codex 的群体。

在组织用户中，普通工程师有 26.8% 的 Token 是在 Codex 上生成的，这一份额自年初以来增长了 5 倍。

数据和数据分析从业者紧随其后，达到 15.2%。

但从资历来看，Codex 的采用横跨了整个层级，从初级员工到高管都在用。

报告认为，高级用户用 Codex 不只是为了写代码，更多是为了规划、审查和委派任务。

有意思的是，在 OpenAI 内部，后来采用 Codex 的部门如：法务、招聘的转型速度，反而比早期采用的工程部门更快。

2026 年 1 月时，这些部门的 Codex 使用率接近于零，到 4 月初达到约 20%，一个月内就飙升至 75%。

这表明，一旦组织下定决心，转型可以非常快。

最会造 AI 的人，也是把 AI 用得最狠的人

这份报告最核心的一个洞见是：

Agent 的采用，不取决于模型有多强，而取决于组织环境有多支持。

同样的 Codex，在个人、组织和 OpenAI 内部，呈现出完全不同的使用模式。

报告认为，决定因素包括：相关文件和系统的访问权限、管理层的期望、员工的技能水平、以及是否有配套的审查流程。

这跟历史上所有通用技术的扩散规律一致。

技术本身只是催化剂，真正的变革发生在组织如何围绕技术重新设计工作流程。

报告用了一个经典的类比：

19 世纪末从蒸汽动力转向电力的过程中，早期工厂只是把蒸汽机换成电动机，工厂布局和工作流基本没变。

真正的生产力爆发，发生在几十年后工厂被重新设计、生产流程被彻底重构的时候。

Agent 可能正在经历同样的过程。

当下的使用情况或许只是冰山一角，真正的变革还在后面。

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

OpenAI 最新报告：Codex 取代 ChatGPT，大神让“ Agent 团队”干活

宙世代

一起剪

相关阅读

三只羊开卖线下课：大杨哥现身分享短视频经验 三天两晚收费1980元

聚和材料：空白掩膜版产品已通过SK海力士等国内外半导体客户的量产验证 并实现量产销售

特斯拉FSD全面转向订阅制：港澳台地区买断版6月30日后下架，中国内地尚无明确时间表

保护国内用户！Wallpaper Engine官宣将移除程序类壁纸：限期两周

《人工智能 智能体互联》系列7项国家标准发布 支撑智能经济高质量发展

《人工智能 智能体互联》系列7项国家标准发布

不想当宇树的高德不是好美团

豆包被迫收费养家，反而拉高了「DAA」的能见度

苹果Mac、iPad全线涨价！山姆成代购宝地：不调价不限购

鲜制零食全景图：6类玩家和34个品牌盘点

微星MPG X870E CARBON MAX WIFI暗黑主板首发2999元：全新PinSafe设计避免装机划伤

美银证券：AI内存供给短缺至少会持续到明年底

AI时代电网重构，储能构网能否解决算力“饥渴”？

尚界H5辅助驾驶数据公布：累计行驶突破1.22亿公里

绿茵流量唤醒消费势能，世界杯观赛经济的价值裂变

最新评论

钛媒体

热门推荐

企业资讯

三只羊开卖线下课：大杨哥现身分享短视频经验三天两晚收费1980元

聚和材料：空白掩膜版产品已通过SK海力士等国内外半导体客户的量产验证并实现量产销售

《人工智能智能体互联》系列7项国家标准发布支撑智能经济高质量发展

《人工智能智能体互联》系列7项国家标准发布