
新智元报道
都说 Codex 只是个编程工具,OpenAI 却把全公司的活都交给它,不到一年,ChatGPT 就在自家丢了 AI 工具的主力位。
造 ChatGPT 的人,已经不太用 ChatGPT 干活了?
不到一年时间,OpenAI 就把主力 AI 从聊天框换成了 AI 智能体(AI Agent)。
到 2026 年 6 月,Codex 已经吃下 OpenAI 全公司每周 99.8% 的输出 token。
就在 10 个月前,这个数字还不到 10%。
转折发生在去年 9 月前后。Codex 接上更强的模型、补齐更多能力,能接的活越来越重。
员工慢慢发现,与其在对话框里一问一答,不如把一大摊任务直接丢给它自己跑。
而这并非某个工程小组在尝鲜。整整一家公司,法务、财务、招聘,每个部门都把它摆上了头号 AI 工具的位置。
到今天,OpenAI 人均超过 85% 的输出 token 产自 Codex。重度用户本就更费 token,全公司加权下来,占比被推到 99.8%。
一个聊天机器人,就这样在自己诞生的公司,被同门替换掉了。

https://openai.com/index/how-agents-are-transforming-work/
OpenAI 在最新的一篇博客里把话挑明了:
智能体(Agent)正在改写知识工作的基本单位——从一来一回的单次问答,变成一整件可以「丢出去」的长周期任务。
聊天机器人一次只接一个短问题,智能体却能独立跑上几分钟到几小时,自己调工具、自己跟环境交互、自己迭代到交活为止。
如今近四分之一的 Codex 请求,对应的都是人类得花一小时以上才能干完的活。

OpenAI 总裁 Greg Brockman 转发这份报告时,说道:智能体正在被飞快采纳,加速所有人的工作。
他配的图,就是公司内部这条陡峭的上升曲线。
火从工程师工位
烧到法务办公室
最先改变的是工程师。
这不意外,Codex 本就是为写代码的人造的。

2025 年 12 月起,OpenAI 的平均工程师就把大部分活儿挪到了 Codex 上,如今平均一个工程师 99% 的输出 token 都走 Codex,留给 ChatGPT 的只剩个零头。
但这把火,并没只停在工程部。
法务、财务、招聘这些根本不碰代码的部门,在 2026 年 4 月前后集体越界,把 Codex 用成了头号工具,而且转得比工程师还快。
如今 OpenAI 一个律师或招聘,人均超过 85% 的输出 token 也产自 Codex。
各部门的用量,也像被点着的火一样快速向上攀升。
按 OpenAI 自报,到 2026 年 6 月,研究部门的中位用量翻了 56 倍,客服 32 倍,工程 27 倍,连转得最慢的法务也涨到 13 倍。
当律师把活儿交给智能体,这画面本身就比任何跑分都更有说服力。
真正的信号
是那些原本不写代码的人
如果只看到工程师偏爱 Codex,你可能就漏掉了一个最关键的信号。

从 2025 年 8 月起,非开发者用户的增长全面反超开发者:个人端涨了 137 倍,组织端 189 倍,OpenAI 内部 12 倍。
一个起家于写代码的工具,正被越来越多压根不懂代码的人用起来。
他们拿 Codex 干什么?
财务团队用它处理了 24771 份K-1 税表,足足 71637 页。这套脱敏流程跑下来,团队比去年提前两周收工。
公关团队更直接,搭了一个自动分流的 Slack 智能体:低风险的演讲邀约自动处理,高风险的转人工审核。

敢交给它的活,也越来越重。
到 2026 年 5 月,80.6% 的个人用户提过预计超过 30 分钟的任务,70.2% 超过 1 小时,还有 25.6% 直接甩给它 8 小时以上的活。
更微妙的是,业务岗用 Codex 干的活里,超过四分之一其实是编程。一个做财务的人,正悄悄跨进工程师的地盘。
岗位之间那道墙正在慢慢消失。

OpenAI 各部门用 Codex 干的活,按工作类型拆开看:财务岗里 31% 是编程,产品营销岗 25%,连非技术的「其他」部门都有 50% 在写代码。岗位的墙,正被 Codex 一点点抹平。
到这一步,Codex 已经不只是编程智能体——它越界成了通用工作流智能体。
这才是它真正让人后背发凉的地方。
从工具到执行者
Codex 换了一个身份
撑起这一切的,是 Codex 角色的彻底转身。
它早已不是那个写代码的补全插件,如今它能接手一整条工程任务链:实现、重构、调试、测试、验证,一条龙全包。
早期版本就能单次自主运行 7 小时以上,自己迭代实现、修掉测试报错,最后交出一个能跑的方案。
这已经不只是帮你写两行代码,而是你交代一摊事,它自己从头跑到尾。
更能说明问题的是并行规模。
到 2026 年 6 月,跑在 P99 分位的重度用户,单日能让 Codex 产出超过 60 小时的智能体轮次,分散在好几个并行的智能体身上。
用户早就不满足于问一个答案,而是一天里同时指挥一支智能体小队。

OpenAI 内部 Codex 的单日智能体运行时长,从普通用户到最重度用户分成五档。到 2026 年 6 月,最重度的用户,单日能跑出 60 小时以上的智能体工作量。
一个人,一天,调度出 60 小时的活,这是别人一周的活。
Codex 的底座是 GPT-5.5。它能用更少的 token,扛更长的任务。
其中最让人惊讶的,是 GPT-5.5 干的另一件事。
为了在不拖慢速度的前提下提速,OpenAI 让它去重写负载均衡和分区的启发式算法。
GPT-5.5 分析了数周的真实流量,写出定制方案,把 token 生成速度硬生生拉高 20% 以上。
于是,GPT-5.5 成了一台开始优化自己的引擎。
有提前用上它的英伟达工程师甚至说,失去对 GPT-5.5 的访问权限,感觉像被截了肢。
这一切的背后,人和 AI 搭班的对象悄悄换了:从一问一答的聊天机器人,变成能独立跑长活的智能体。
不变的是发指令、做判断、担责任的这些依然是人。改变的是办公的默认动作:从打开聊天框问一句,变成把一整件事交给智能体去跑。
这份报告,更像是一次办公方式换挡的预演。
往后真正拉开差距的,是你敢把多大的一摊事,整个交给 AI。
参考资料:
https://openai.com/index/introducing-codex/https://openai.com/index/codex-for-every-role-tool-workflow/
https://x.com/gdb/status/2070199649823297653
https://openai.com/index/how-agents-are-transforming-work/https://openai.com/index/harness-engineering/
编辑:元宇
