OpenAI全面升级Codex,获Mac系统级“后台接管”能力,支持多智能体并行

  4 月 17 日消息,OpenAI 周四宣布对其自动化编程工具 Codex 进行重大重组更新,旨在赋予其显著扩展的能力。

  其中最核心的亮点,在于 Codex 获得了系统级的“后台接管”能力:它如今能够隐于电脑后台运行,直接调用桌面应用程序,并模拟人类操控光标完成点击与输入。

  OpenAI 在官方博客中解释,基于这一特性,Codex 支持部署多个智能体。**这些智能体能在用户的 Mac 系统内并行处理任务,“且完全不干扰用户在其他应用中的正常工作”。**这意味着,由于其独特的后台运行机制,当开发者专注核心业务时,Codex 可作为“编程伙伴”在后台自动处理辅助性任务。OpenAI 将“迭代前端代码、测试应用,甚至在缺乏 API 接口的传统软件中进行操作”列为该智能体辅助功能的潜在用例。

  整体而言,这一技术演进路径表明了 OpenAI 的战略野心:不仅要巩固 Codex 作为编程助手的基本盘,更要将其打造成能深度嵌入各类企业工作流的多功能生产力中枢。

  AI 编程赛道的观察者们也会注意到,OpenAI 目前赋予 Codex 的部分能力,与竞争对手 Anthropic 近期为 Claude Code 推出的策略高度重合。上个月,Anthropic 宣布其 AI 模型 Claude 及协作工具 Cowork 能够“在用户离开键盘期间”远程接管并代为操控 Mac 桌面。

  除桌面控制权外,新版 Codex 还内置了专属浏览器环境。用户可指令智能体在特定的 Web 应用内执行操作,OpenAI 表示该功能将极大赋能前端及游戏开发场景,并计划最终将该能力从本地主机(Localhost)环境扩展至对标准网页浏览器的“完全操控”。

  在生态拓展与多模态能力方面,OpenAI 还推出了多项附加功能。其新增的“记忆”(Memory)预览版功能允许 Codex 回顾历史工作会话,并提取特定用户工作习惯的重要上下文信息。系统同时被赋予了全新的图像生成能力,可用于制作产品概念图、演示文稿视觉元素、设计原型图及占位图等企业常规物料。最后,为提升跨平台执行力,Codex 现已接入 CodeRabbit、GitLab Issues 等 111 个第三方应用插件,以执行涉及这些工具的具体任务。

  按照 OpenAI 的设定,调用这些接口使得 Codex 能够处理日常行政琐事,以更好地组织用户的工作生活。例如,用户现在可以要求 Codex 查阅 Slack 通讯记录和谷歌日历(Google Calendar),并为你生成一份当天的待办事项清单。

  在商业化层面,OpenAI 面向 ChatGPT 企业版(Enterprise)和商业版(Business)客户新增了“按需付费”(Pay-as-you-go)模式,显然旨在为用户采购该编程工具服务时提供更大的灵活性。

  这一系列密集的产品与定价动作背后,折射出的是愈演愈烈的巨头博弈。目前,围绕“谁能推出最便捷、最强大的 AI 编程工具”,OpenAI 与 Anthropic 之间正展开一场低烈度的暗战。

  OpenAI 曾被视为该行业无可争议的绝对领导者,但在最近几个月里,它与 Anthropic 的竞争愈发白热化。目前 Anthropic 似乎暂占上风,但 OpenAI 显然还未打算认输。

  OpenAI 战略重心正加速向企业级服务倾斜,并逐渐从 Sora 2 这一类消费级社交视频应用中收缩。与此同时,OpenAI 近期还深陷一系列外部合规与法律风波,包括因 ChatGPT 被指涉嫌影响部分用户心理健康而引发的诉讼。(易句)

  (本文由 AI 翻译,网易编辑负责校对)