
原标题:OpenAI Codex 桌面版深夜突袭!一人指挥 Agent 军团,程序员彻底告别 996
新智元报道
编辑:桃子好困
太带劲了!抢先 Claude 5,OpenAI 深夜祭出了一个编码杀器——Codex。它可以让一人指挥多 Agent 并行协作,自带 Skills,编码从此进入自动化时代。
Claude 5 的脚步声越来越近,奥特曼终于坐不住了。
就在刚刚,OpenAI 毫无预警地抛出「王炸」——Codex 正式进化为独立的桌面 App。


这不仅仅是一个写代码的窗口,更是一个能同时指挥千军万马(多个 Agent)的「全能指挥部」。

Codex 定位非常明确:要做 Agent 的「指挥中心」
具体来说,Codex 可以做到以下几点:
-
多任务并行切换,毫不费力:同时调用多个 AI 智能体开展工作,并通过「工作树」(worktrees)实现变更隔离,互不干扰;
-
创建并调用 Skills:将工具和开发规范封装成可复用的能力;
-
设置自动化流程:通过后台定时工作流,把那些重复性的琐事统统交给 Codex 处理。
假设想要为相册里的照片添加「拖拽」功能,选择「工作树」,即可让 AI 在同一仓库中各司其职。

Codex 的进化令人毛骨悚然,它不仅生成代码,还学会了利用代码作为「Skills」来操控电脑。
比如想要解决项目中的 Comment,直接调用安装好的 Skills,Codex 立刻就把问题破解了。

不仅如此,OpenAI 仅凭一句话,就让 Codex 消耗 700 万 token,徒手搓出一个 3D 版赛车游戏。

这一次,Codex 的诞生,并非是新瓶装旧酒,更不是一次毫无诚意的「套壳」包装。
它标志着 AI 编程正式从「对话助手」进化为「指挥中心」。
奥特曼激动表示,「真是爱了爱了,它比我想象中还要惊喜」!

「AI 程序员就是不会耗尽多巴胺。他们不会感到沮丧,也不会耗尽能量。它们会一直坚持下去,直到解决问题」。

OpenAI 总裁 Greg 墙裂推荐——
我多年来一直是终端和 Emacs 的铁粉,但自从用了 Codex 之后,再回到终端简直感觉像穿越回了过去,代差太明显了。
这种感觉,就像是一个专门为开发而生的 AI 智能体原生界面。

OpenAI Codex 代表着一种全新的 AI Coding 范式,极有可能重塑开发者与代码交互的逻辑。
甚至,Codex 还可与 Claude Cowork 狂飙能力,把杂乱桌面瞬间清理干净。

目前,Codex 正式在 macOS 上线,Windows 版即将推出。
OpenAI 还放出了「限时福利」,ChatGPT 免费用户和 Go 版本也可用上 Codex,Plus、Pro、Business、Enterprise 和 Edu 计划的用户,速率直接翻倍。
编码杀器 Codex APP 震撼登场
一人指挥所有 Agent
macOS 版 Codex 应用,是一个功能强大的新界面。
它能让开发者能轻松驾驭多个AI智能体,并行处理任务,并与AI协作搞定那些耗时的大活儿。
过去一直以来,开发者和 AI 的关系是「结对编程」,你写一段,它接一段。

如今,Codex 的出世将彻底改变软件构建的方式——
人类不再与 AI 紧密结对,直接给 AI 委派任务,贯穿于软件设计、构建、发布和维护的全生命周期。
这一转变的苗头,实际上从 2025 年 4 月发布 Codex 以来,便已初见端倪。
开发者与AI的协作方式已发生了根本性转变。
现有模型可以端到端地处理复杂的、长流程的任务,开发者也开始在跨项目中指挥多个AI智能体:
分派工作、并行跑任务,并放心地把耗时数小时、数天甚至数周的重大项目交给 AI 。
核心挑战已不再是AI能做什么,而是人们如何大规模地指挥、监督并与它们协作——
遗憾的是,现有的 IDE 和终端工具并非为此而生。
这种全新的构建方式,加上模型能力的提升,呼唤着一种全新的交互载体。
这正是 OpenAI 要推出 Codex 桌面应用的原因,主打「一个AI智能体的指挥中心」。
多智能体并行,狂飙代码不乱套
Codex 为与AI智能体多任务并行,构建了一个专注的空间。
所有AI在按项目组织的独立线程中运行,确保你无缝地在任务间切换,而不会丢失上下文。
你可以在应用里直接检查AI的改动,在 diff 上写评论,甚至用编辑器打开进行手动调整。
它还内置了对 Git worktree 的支持,所以多个AI可以在同一个仓库(repo)上开工而互不冲突。
每个AI都在你代码的隔离副本上工作,让你能探索不同的开发路径,而无需操心它们会如何影响你的主代码库。

当AI智能体干活时,可以把改动拉(checkout)到本地,或者让它继续推进,完全不动本地的 git 状态。
应用会自动从 Codex CLI 和 IDE 扩展中同步会话历史和配置,这样你马上就能在现有项目中用起来。
解锁 Skills 外挂,手搓 3D 赛车游戏
Codex 正从一个只会写代码的AI,进化为一个能用代码在电脑上真正解决问题的AI。
通过 Skills(技能),可以轻松扩展 Codex 的能力。
今后,Codex 不再局限于代码生成,还能处理信息收集与整合、问题解决、写作等任务。
Skills 就像是打包好的指令、资源和脚本,让 Codex 能可靠地连接工具、运行工作流,并按照团队的习惯完成任务。
Codex 应用里有一个专门的界面来创建和管理 Skills。
你可以明确要求 Codex 使用某个 Skill,或者让它根据手头的任务自动调用。
OpenAI 举了一个例子,曾让 Codex 做一个赛车游戏——
要有不同的车手、八张地图,甚至还有玩家能用空格键触发的道具。
利用图像生成 Skill(由 GPT Image 驱动)和网页游戏开发 Skill,Codex 仅凭最初的一个用户提示词,就独立工作并消耗了超过 700 万个Token,把游戏做了出来。
它身兼数职,既是设计师、游戏开发者,又是 QA 测试员,通过实际试玩来验证成果。
-
6 万 Token
可以看到,在只消耗了 6 万 token 的这个版本里,画面非常粗糙。
很窄的赛道中间,塞满了撞上去会穿模的「障碍物」。
技能箱可以吃,也可以发射,但好像没有什么效果。
最尴尬的是,你会永远在「第二圈」无限循环下去……
-
80 万 Token
在 80 万 token 的版本里,画面似乎好了一些,赛道也宽敞了不少,更接近大家平时玩的赛车游戏了。
但是箱子吃到的技能好像没什么用,发射出去之后,小车们还是各跑各的……
而且依旧会在第二圈陷入循环,永远跑不完。
-
700 万 Token
最后这个 700 万 token 的版本,画质明显好了很多。不仅有清晰的赛道,技能箱也更精致了。
这次,技能箱确实有用了。
比赛刚开始,我们就吃了 AI 扔出的一个大招,没有闪。于是,喜提倒数第一,
不过,比起前两个陷入无限循环的世界来说,这次至少能完赛了。
从跑评测和盯着模型训练,到起草文档和汇报增长实验,OpenAI 内部构建了数百个 Skills,来帮助多个团队自信地把以前很难统一定义的工作委派给 Codex。
Codex 应用内置了一个 Skills 库,涵盖了 OpenAI 内部流行的工具和工作流,下面重点介绍几个。
-
实现设计:从 Figma 拉取设计上下文、资源和截图,并将其转化为视觉上1:1 还原的生产级 UI 代码。
-
管理项目:在 Linear 中处理 Bug 分类、追踪发布、管理团队工作负载等,推动项目进展。
-
部署到云端:让 Codex 把你做好的 Web 应用部署到流行的云主机,如 Cloudflare、Netlify、Render 和 Vercel。
-
生成图像:使用由 GPT Image 驱动的图像生成 Skill 来创建和编辑图像,用于网站、UI 原型、产品配图和游戏素材。
-
使用 OpenAIAPI构建:在使用 OpenAI API 开发时,参考最新的文档。
-
创建文档:一套用于阅读、创建和编辑 PDF、电子表格和文件的 Skills,排版布局专业。

使用 Vercel 和图像生成 Skills 更新网站

使用电子表格 Skill 创建表格以生成购物清单

使用 Linear 管理你的 Issue Backlog
当你在应用中创建一个新 Skill 时,Codex 可以在你工作的任何地方使用它:应用内、CLI 或 IDE 扩展中。
你也可以把 Skills 提交到代码仓库,让整个团队都能用上。

OpenAI 分享的 Agent Skills:https://github.com/openai/skills
一键自动化,24h 为你打工
Codex 可以设置 Automations(自动化),按计划在后台自动干活。
Automations 将指令与可选的 Skills 结合,会按照你设定的时间表运行。
当 Automation 完成时,结果会进入审查队列,可以随时切回来查看并根据需要继续后续工作。

设置自动化以定期创建新 Skills
在 OpenAI,团队一直用 Automations 来处理那些重复但重要的任务,比如每日 Issue 分类、查找和总结 CI 失败原因、生成每日发布简报、检查 Bug 等等。
双人格模式,秒切换
开发者在与AI合作时口味各不相同。
有人喜欢直截了当、只讲执行的搭档;有人则喜欢话多一点、更有互动感的风格。
Codex 现在允许开发者在两种个性间选择——一种是简洁务实风,另一种是更具对话感和同理心的风格。
两者的能力完全一样,只为贴合你的喜好。只需在应用、CLI 和 IDE 扩展中输入/personality命令即可切换。

默认安全,按需配置
此外,OpenAI 还将「设计即安全」(Security by Design)的理念融入了 CodexAI智能体栈的方方面面。
Codex 应用采用了原生的、开源且可配置的系统级沙箱(Sandboxing),这就跟在 Codex CLI 里一样。
默认情况下,CodexAI智能体只能编辑它当前工作的文件夹或分支里的文件,并使用缓存的网页搜索。
如果需要运行像联网访问这类需要更高权限的命令,它会先请求你的许可。
你可以为项目或团队配置规则,允许特定命令自动以提升的权限运行。
一切皆由代码控制
如今,企业和开发者正越来越依赖 Codex 进行端到端开发。
自 12 月中旬发布 GPT-5.2-Codex 以来,Codex 的总使用量翻了一番,过去一个月里有超过 100 万开发者使用 Codex。
下一步,团队继续扩展 Codex 使用场景,包括上线 Windows 版应用、不断突破模型能力边界,以及实现更快的推理速度。

OpenAI 科学家感慨,过去几周写的代码比过去几年还要多。而且,还用 Codex 修复了 Prism 多个 bug 和功能更新
在应用内部,OpenAI 还将根据实际反馈持续打磨多AI智能体工作流,让管理并行任务和在AI间切换变得更容易,且不丢失上下文。
他们还在为 Automations 开发基于云端的触发器支持,这样 Codex 就能在后台持续运行——而不仅仅是在你电脑开着的时候。
Codex 建立在一个简单的前提之上:一切皆由代码控制。
一个AI智能体在推理和生成代码方面越强,它在各类技术和知识工作中的能力就越强。

OpenAI 全家桶
然而,当今的一个关键挑战在于,前沿模型的能力与人们在实际中轻松使用它们之间存在差距。
Codex 旨在缩小这一差距,让人们更容易指挥、监督并将 OpenAI 模型的全部智慧应用到实际工作中。
OpenAI 致力于将 Codex 打造成最强的编程AI智能体,这也为它成为能处理代码之外广泛知识工作的全能AI奠定了基础。
附录
在制作上面这款赛车游戏时,Codex 使用的初始提示词如下(总结精炼版):
使用 Three.js 实现 Voxel Velocity 作为一个 3D 体素卡丁车赛车游戏,只有一种模式:单人比赛(总是 3 圈,1 个人类对 7 个 CPU,所有 8 条赛道立即在这个模式下可用,没有进度限制)。构建一个最小的赛前流程,仅包括:赛道(8),角色(8),难度(轻松/标准/刻薄),可选的镜像模式,可选的允许克隆,和开始比赛,加上一个选项菜单和一个赛中暂停菜单(恢复/重新开始/退出)。创建一个街机驾驶模型,具有灵敏的操控,宽容的擦墙碰撞,有意义的漂移作为主要技能,以及一个漂移充电系统,产生精确的加速等级(1 级 0.7 秒,2 级 1.1 秒,3 级 1.5 秒),同时保持基准速度「快但可读」,并且在宽阔的道路上保持持续的超车。实现正好 8 个道具,单道具容量,微妙的位置加权分布,和温和的效果(最大失控≤1.2 秒,最大转向禁用≤0.6 秒),创造滑稽的混乱而没有硬眩晕,加上在加速期间减少 50% 的越野减速。定义 8 个角色及其给定的统计数据和 AI 倾向,实现 CPU 难度预设和赛道编写的赛车/变化样条线,漂移区和危险回避,以便 AI 使用多车道宽度进行干净的超车,并发布 HUD/音频要素(位置,圈数/最后一圈横幅,小地图,道具槽,计时器/分段,可读的音效,和每个赛道一个音乐循环)。
随后,Codex 不断地被从 10 个通用提示词的随机列表中重新提示,以继续处理这个问题。
其中一个提示词的例子是:
你的工作是添加新功能,使游戏更接近原作。首先,玩游戏并确定与原作相比缺少了什么。然后挑选几个缺失的功能并实现它们。在每个功能之后,彻底测试它,通过玩游戏并确认它工作正常。如果你在玩的时候注意到任何错误,也要优先修复它们。
参考资料:
https://x.com/sama/status/2018414858015039504?s=20
