关于ZAKER Skills 合作
智东西 3小时前

OpenAI 六项更新炸场!Codex 手机遥控锁屏 Mac,人走了 AI 继续写代码!

AI 应用风向标(公众号:ZhidxcomAI)

作者|毕伟豪

编辑|漠影

智东西 5 月 22 日报道,今早,OpenAI 发布了 Codex 的六项更新,包括 Mac 锁屏后用手机远程操控、Appshots 应用截图、目标模式、应用内浏览器注释、团队插件共享以及改进企业分析功能。

此次更新最引人注目的是手机操控锁屏 Mac 以及 Appshots 应用截图两项功能,即使 Mac 已锁定且屏幕关闭,Codex 也可以通过手机安全地使用 Mac 上的应用程序。同时,用户可以使用 Appshots 功能,让 Codex 自动捕获前台的应用窗口的画面,无需截图和复制。

这些更新核心指向的是:让 Codex 知道用户在看什么,并在用户离开电脑后接着把活干完。明显能感受到的是,Codex 正在和 Claude Code、Cursor 等 AI 工具一样," 卷 " 起了开发效率,想尽一切办法让使用更方便。

一、锁屏也能操控整个电脑,人走了 Codex 还能干活

启用 " 锁定电脑使用 " 功能后,Mac 用户在电脑锁定后,可以继续远程安全地使用 Codex,也就是说用户可以在电脑处于锁定状态下让 Codex 继续工作,无需保证电脑时刻保持打开状态。

这项功能并非传统的远程解锁,也不会允许其他应用程序或本地进程解锁电脑。

当 Codex 在 Mac 锁定后通过 " 电脑使用 " 访问应用程序时,Codex 会暂时解锁 Mac,同时阻止本地使用并保留屏幕锁定。解锁前,Codex 会短暂检查解锁尝试是否源自活跃的、受信任的电脑。如果超出此短暂窗口期,Codex 将拒绝解锁,并提示用户根据需要手动解锁。

Codex 还为锁定使用设置了以下安全措施:

1、授权窗口持续时间很短,仅限于当前的解锁尝试。

2、自动解锁功能仅在 Codex 处于常用活跃计算机使用状态时可用。

3、Codex 会遮盖所有显示屏,防止信息泄露。

4、如果 Codex 检测到本地键盘或指针输入,它会重新锁定 Mac 并暂停自动解锁,直到用户手动解锁为止。

二、不用截屏和复制,一键自动截图、提取文字,丝滑导入 Codex

Appshots 功能支持用户将前台最上方的应用程序窗口发送到 Codex 中,当用户正在使用另一个应用程序时,可以同时按左右 Command 键,Codex 会自动截取当前窗口上的可见图像、提取可见文本以及可见区域之外的文本,提取后 Codex 会将图像和文本存储在本地会话文件中,就像手动添加的文件或图像一样。

适用场景很实在,OpenAI 给出的例子包括:分享 API 参考页面让 Codex 写脚本、分享邮件或日历页面让 Codex 起草下一步、分享设计稿窗口让 Codex 修改对应资源或代码、分享报错面板或设置页面让 Codex 排查问题。

一句话总结,凡是打字不如贴图的场景,Appshots 都能省掉用户描述环节。

Codex 需要在屏幕和系统音频录制功能,以及辅助功能中开启权限才可以使用,此外 Appshot 只能看到可见的屏幕截图,无法接收完整的文档。

三、一人做插件,全公司都能用

对于企业用户来说,此次更新有两个非常便利的功能:团队共享插件和使用情况分析优化。

企业用户可以将自己的插件共享给团队使用,团队内部可以重复使用已有工具以及管理可用资源,这一功能可以更好地实现团队协作,提高效率。

同时,OpenAI 改进了 Codex 中面向企业和公司的分析功能,企业可以获取包括活跃用户、Token 用量、调用次数、运行状况、代码行数、用户排行以及插件使用情况这些数据,便于企业进行管理。

四、目标模式正式上线:让 Codex 执行任务不再跑偏

目标模式是 Codex 提供的一种长效工作模式,它赋予 Codex 一个具有明确完成标准的持久目标,让用户可以将复杂、多步骤的任务放心地交给它独立推进。

与普通的单轮提示不同,目标模式是一个贯穿整个会话的行动纲领。用户需要输入 /goal 命令,然后提供起始文本和完成标准,让 Codex 知道从哪里开始以及什么情况算是完成。

设定目标后,Codex 会自动循环执行 " 规划、执行、自检 " 的流程,持续判断下一步该做什么、离目标还有多远,直到达成用户定义的完成标准。

如果目标难以预先明确,用户可以先键入 /plan 让 Codex 协助完善目标,然后再继续,也可以让 Codex 进行询问,共同制定包含清晰成功标准的目标。

目标模式启动后,用户可以继续操控 Codex,发送后续消息来调整限制条件,例如要求 Codex 使用特定库或避免使用特定方法。如果用户需要状态回顾或解释,但又不想中断主任务,可以使用侧边聊天功能。对于长时间运行的任务想要暂停时,需要在网络连接中断前暂停目标,然后在准备好继续时恢复。

五、浏览器高级注释,标注哪里改哪里,支持实时预览

浏览器方面的改进集中在两点:内置浏览器本身的能力升级,以及注释交互的精细化。

内置浏览器现在支持高级注释模式。打开注释模式后,选中页面元素或区域,直 接提交反馈,Codex 会根据注释定位问题。按住 Shift 点击可以选择区域,按住 Cmd 点击则是直接发送注释。

一个很有意思的功能是样式反馈,在注释输入框旁边有个配置图标,点开后可以调整字体、文本、间距、颜色等样式值,能直接在页面上预览改动效果,设计师和开发人员可以准确地预览他们想要更改的内容。

结语:六大更新,Codex 在追求极致效率和保证安全的权衡中前进

这些更新放在一起看,逻辑很清晰:Appshots 解决 " 怎么让 AI 更快更好地看到我的上下文 ",目标模式解决 " 怎么让 AI 方向不跑偏 ",浏览器注释解决 " 怎么让 AI 精确且方便地修改 ",锁定使用解决 " 怎么让 AI 在用户离开后继续干活 "。

这些串联起来,再加上面向企业的更新,可以看到 Codex 正在朝着提高开发效率的方向不断努力,在 OpenClaw 等一众 AI 助手横空出世后,Claude、Codex、Cursor 等都在追求如何结合 Agent 为用户打造更好的 " 帮手 ",此次更新也正是 OpenAI 在这条路上的阶段成果。

当然,每一项都有硬约束。Appshots 有权限限制和场景盲区,目标模式需要用户定义清晰的成功标准,锁屏使用加了层层安全校验。这些边界不是缺陷,是 OpenAI 给 Agent 行为打的防护栏,如何在保证安全的前提下发挥 Agent 更强大的能力,是所有厂商思考的方向。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容