
新智元报道
编辑:好困
你的电脑长出了第二个光标了!OpenAI 重磅更新 Codex,AI 能在后台自己开模拟器、修 Bug,完全不耽误你前台工作。一代「赛博牛马」正式觉醒。
刚刚,OpenAI 把 Codex 炸了个底朝天!
昨天你还在用 Codex 写代码。
今天它已经能看你的屏幕、点你的鼠标、记住你上周的偏好、自己给自己排日程。
好几个 AI Agent 同时在后台帮你干活,你的鼠标键盘完全不受影响。

Codex 的「独门秘诀」:可以在后台直接使用 App,而不用完全接管你的整个电脑
从今天起,这个每周 300 万开发者都在用工具,不再只是个编程 Agent。
你干你的活
它在后台帮你跑 Xcode
现在,Codex 有了自己的光标,跟你的鼠标互不干扰。
你在写文档,它在旁边跑 Xcode 测 App,两边同时进行。

这个功能的来头不小,负责它的 Ari Weinstein 是 Apple Shortcuts 的联创,去年秋天随团队被 OpenAI 收购
具体能干什么,看一段演示就明白了。
首先,用户发出指令:「在 Xcode 里运行这个井字棋 App,自己玩一局测试它,修复你发现的 bug。」
只见,Codex 自己打开 Xcode,启动 iOS 模拟器,开始用自己的光标下棋。
测试过程中,它发现了一个逻辑 bug——人类走一步,电脑会同时画两个O。
在一番思考之后,Codex 果断切回到代码界面,并定位到了漏洞的位置。
改完 Swift 代码后,它立即进行了重新编译,然后做了第二轮完整测试验证。
不到一分钟。运行→测试→发现 bug→修复→回归验证,整个 Debug 闭环一条龙。

目前 Computer Use 仅支持 macOS,欧盟和英国用户暂时用不了。
Windows 端可以从其他 App 拉取信息到 Codex 里,但还不支持后台光标级别的操控。

在这次更新中,Codex 首次获得了对 Intel Mac 的支持
点哪改哪
前端调试再也不用翻代码
Codex 客户端里现在内置了浏览器,底层用的是 OpenAI 自家的 Atlas 引擎。
落到实处就是,以前前端开发调 UI,你得在代码和浏览器之间来回跳。现在可以在渲染好的网页上操作。
点击主标题,留一条评论「缩小字体并缩短标语」;点击左上角,「加一个 Logo」;发现图表X轴图例越界了,在出错的地方点一下,写一句「修复越界问题」。
Codex 能理解视觉和空间上下文,后台即时修改代码,页面实时刷新。

OpenAI 拿来做演示的是一个叫 Brickfolio 的乐高套件追踪 Web 应用。
Codex 从零开始写完代码、配好环境、启动本地服务器,然后在内置浏览器里打开了渲染好的页面。整个过程就几秒钟。
然后就是所见即所得的修改体验。这种感觉就像在审核一张设计图,你只管标注问题,底层迭代全部由 AI 搞定。
换句话说,用户只需在页面上东点一下西标一下,Codex 就会在后台改代码,并在前台实时出效果。

目前内置浏览器仅限 localhost 本地预览。OpenAI 表示未来会扩展到完整的浏览器控制能力。
90 多款插件上线
整条工具链焊进 Codex
插件方面,OpenAI 这波一口气上了 90 多个。
Atlassian Rovo 管 JIRA、CircleCI 搞 CI/CD、GitLab Issues 跟踪需求、Microsoft Suite 处理文档、Neon by Databricks 操作数据库,几乎覆盖了一个开发团队日常用到的所有工具。

用法很简单,在输入框里@一下插件名就行。
比如@SharePoint,让 Codex 去读产品目录下的文档,生成一份高管简报。它自动检索文件树、解析文档、提取核心信息,不用你在各个网盘里来回翻找。

再比如@Superpowers,让 Codex 在本地代码目录里构思一个功能方案。它会去遍历你的文件结构,读取代码和 CSS,然后给出一套符合当前项目架构的实施建议。
@CircleCI 可以帮你诊断分支构建失败的问题;@Atlassian Rovo 能读取 Confluence 上的产品说明书,按格式输出总结,还能把功能点转化成标准的 JIRA 任务。

从上游需求到本地写代码,再到 CI/CD 和任务管理,插件把整条链路串起来了。
AI 开始自己给自己排班了
更值得一提的,是这次新增的「心跳」机制。
现在 Codex 能给自己安排未来的工作日程,到了时间自动醒过来继续干,跨天跨周都行。而且它可以复用之前的对话线程,上次积累的上下文不会丢。
比如,用户可以让 Codex 检查 Slack、Gmail、Google 日历和 Notion,它从四个渠道扒出相关信息,甩出一份按优先级排好的待办清单。
用户追了一句「能不能帮我一直盯着点?」
Codex 立刻就给自己设定了每小时自动巡查的日程,有需要决策的重点主动汇报,甚至问你「需要我帮你起草回复吗?」

这已经不是工具了,这是一个不睡觉的初级员工。
再加上 gpt-image-1.5 的图片生成能力原生内置,产品概念图、前端设计、视觉原型都可以在同一个工作流里一口气搞定。
日常刚需一口气补齐
除了这些重头功能外,还有一批体验层面的升级。
首先,记忆功能上线了预览版,Codex 能记住你的偏好和纠正过的地方,下次开聊不用从头解释。
其次,GitHub 的代码审查评论,现在也可以放到 Codex 里处理了。
支持同时开多个终端标签页,通过 SSH 连接远程开发机的功能也上了内测。还有一个新的汇总面板,帮你随时盯紧 Agent 的工作计划、信息来源和产出文件。
演示中,用户让 Codex 整理当前项目最近的 open issues,按主题分组生成一张表格。
Codex 便在后台拉取代码仓库上下文,几分钟后甩出核心摘要,列出项目当前最大的痛点板块。
点击即可生成的 Excel 文件,不用跳转到外部软件,侧边栏里就能打开完整的表格预览。
PDF、PPT 也一样,全都在 Codex 一个窗口里搞定。

超级 App 的第一块拼图
回看时间线就能感受到 OpenAI 的节奏。
3 月 19 日,外媒爆出 OpenAI 计划将 ChatGPT、Codex 和 Atlas 浏览器合并为一个桌面端「超级 App」。
3 月 31 日,OpenAI 拿到了 1220 亿美元的融资,估值 8520 亿,亚马逊、英伟达、软银领投。融资文件里明确写着,资金将用于超级 App 的开发和部署。
4 月 16 日,Codex 这波更新落地。
还有一个数据很说明问题,OpenAI 内部已经有超过 80% 的员工在用 Codex,而且不只是工程师。
写周报、整理反馈、起草产品需求文档、审合同、发安全培训提醒,什么都用它干。
50% 的 Codex 用户已经在拿它做非编码任务了。
这不是一个编程工具在加功能。这是一个超级 App 在用编程工具的壳做冷启动。
打不过就渗透
给 Anthropic 做了个官方插件
更有趣的是,OpenAI 还给 Claude Code 做了一个官方插件,主动把 Codex 嵌入竞品的生态里。
颇有种,与其等开发者换阵营,不如先渗透进他们工作流的架势。
目前来看,Codex 更强调后台执行、多 Agent 并行和无人值守;Claude Code 的优势在长上下文推理和深度代码理解。越来越多的团队选择两个都用。
不过 OpenAI 要的显然不只是分一杯羹。
1220 亿美元砸下去,赌的可不是一个编程工具。
参考资料:
