国思软件 - 造ChatGPT的人，已经不用ChatGPT干活了

　　新智元报道

　　都说 Codex 只是个编程工具，OpenAI 却把全公司的活都交给它，不到一年，ChatGPT 就在自家丢了 AI 工具的主力位。

　　造 ChatGPT 的人，已经不太用 ChatGPT 干活了？

　　不到一年时间，OpenAI 就把主力 AI 从聊天框换成了 AI 智能体（AI Agent）。

　　到 2026 年 6 月，Codex 已经吃下 OpenAI 全公司每周 99.8% 的输出 token。

　　就在 10 个月前，这个数字还不到 10%。

　　转折发生在去年 9 月前后。Codex 接上更强的模型、补齐更多能力，能接的活越来越重。

　　员工慢慢发现，与其在对话框里一问一答，不如把一大摊任务直接丢给它自己跑。

　　而这并非某个工程小组在尝鲜。整整一家公司，法务、财务、招聘，每个部门都把它摆上了头号 AI 工具的位置。

　　到今天，OpenAI 人均超过 85% 的输出 token 产自 Codex。重度用户本就更费 token，全公司加权下来，占比被推到 99.8%。

　　一个聊天机器人，就这样在自己诞生的公司，被同门替换掉了。

　　https://openai.com/index/how-agents-are-transforming-work/

　　OpenAI 在最新的一篇博客里把话挑明了：

　　智能体（Agent）正在改写知识工作的基本单位——从一来一回的单次问答，变成一整件可以「丢出去」的长周期任务。

　　聊天机器人一次只接一个短问题，智能体却能独立跑上几分钟到几小时，自己调工具、自己跟环境交互、自己迭代到交活为止。

　　如今近四分之一的 Codex 请求，对应的都是人类得花一小时以上才能干完的活。

　　OpenAI 总裁 Greg Brockman 转发这份报告时，说道：智能体正在被飞快采纳，加速所有人的工作。

　　他配的图，就是公司内部这条陡峭的上升曲线。

　　火从工程师工位

　　烧到法务办公室

　　最先改变的是工程师。

　　这不意外，Codex 本就是为写代码的人造的。

　　2025 年 12 月起，OpenAI 的平均工程师就把大部分活儿挪到了 Codex 上，如今平均一个工程师 99% 的输出 token 都走 Codex，留给 ChatGPT 的只剩个零头。

　　但这把火，并没只停在工程部。

　　法务、财务、招聘这些根本不碰代码的部门，在 2026 年 4 月前后集体越界，把 Codex 用成了头号工具，而且转得比工程师还快。

　　如今 OpenAI 一个律师或招聘，人均超过 85% 的输出 token 也产自 Codex。

　　各部门的用量，也像被点着的火一样快速向上攀升。

　　按 OpenAI 自报，到 2026 年 6 月，研究部门的中位用量翻了 56 倍，客服 32 倍，工程 27 倍，连转得最慢的法务也涨到 13 倍。

　　当律师把活儿交给智能体，这画面本身就比任何跑分都更有说服力。

　　真正的信号

　　是那些原本不写代码的人

　　如果只看到工程师偏爱 Codex，你可能就漏掉了一个最关键的信号。

　　从 2025 年 8 月起，非开发者用户的增长全面反超开发者：个人端涨了 137 倍，组织端 189 倍，OpenAI 内部 12 倍。

　　一个起家于写代码的工具，正被越来越多压根不懂代码的人用起来。

　　他们拿 Codex 干什么？

　　财务团队用它处理了 24771 份K-1 税表，足足 71637 页。这套脱敏流程跑下来，团队比去年提前两周收工。

　　公关团队更直接，搭了一个自动分流的 Slack 智能体：低风险的演讲邀约自动处理，高风险的转人工审核。

　　敢交给它的活，也越来越重。

　　到 2026 年 5 月，80.6% 的个人用户提过预计超过 30 分钟的任务，70.2% 超过 1 小时，还有 25.6% 直接甩给它 8 小时以上的活。

　　更微妙的是，业务岗用 Codex 干的活里，超过四分之一其实是编程。一个做财务的人，正悄悄跨进工程师的地盘。

　　岗位之间那道墙正在慢慢消失。

　　OpenAI 各部门用 Codex 干的活，按工作类型拆开看：财务岗里 31% 是编程，产品营销岗 25%，连非技术的「其他」部门都有 50% 在写代码。岗位的墙，正被 Codex 一点点抹平。

　　到这一步，Codex 已经不只是编程智能体——它越界成了通用工作流智能体。

　　这才是它真正让人后背发凉的地方。

　　从工具到执行者

　　Codex 换了一个身份

　　撑起这一切的，是 Codex 角色的彻底转身。

　　它早已不是那个写代码的补全插件，如今它能接手一整条工程任务链：实现、重构、调试、测试、验证，一条龙全包。

　　早期版本就能单次自主运行 7 小时以上，自己迭代实现、修掉测试报错，最后交出一个能跑的方案。

　　这已经不只是帮你写两行代码，而是你交代一摊事，它自己从头跑到尾。

　　更能说明问题的是并行规模。

　　到 2026 年 6 月，跑在 P99 分位的重度用户，单日能让 Codex 产出超过 60 小时的智能体轮次，分散在好几个并行的智能体身上。

　　用户早就不满足于问一个答案，而是一天里同时指挥一支智能体小队。

　　OpenAI 内部 Codex 的单日智能体运行时长，从普通用户到最重度用户分成五档。到 2026 年 6 月，最重度的用户，单日能跑出 60 小时以上的智能体工作量。

　　一个人，一天，调度出 60 小时的活，这是别人一周的活。

　　Codex 的底座是 GPT-5.5。它能用更少的 token，扛更长的任务。

　　其中最让人惊讶的，是 GPT-5.5 干的另一件事。

　　为了在不拖慢速度的前提下提速，OpenAI 让它去重写负载均衡和分区的启发式算法。

　　GPT-5.5 分析了数周的真实流量，写出定制方案，把 token 生成速度硬生生拉高 20% 以上。

　　于是，GPT-5.5 成了一台开始优化自己的引擎。

　　有提前用上它的英伟达工程师甚至说，失去对 GPT-5.5 的访问权限，感觉像被截了肢。

　　这一切的背后，人和 AI 搭班的对象悄悄换了：从一问一答的聊天机器人，变成能独立跑长活的智能体。

　　不变的是发指令、做判断、担责任的这些依然是人。改变的是办公的默认动作：从打开聊天框问一句，变成把一整件事交给智能体去跑。

　　这份报告，更像是一次办公方式换挡的预演。

　　往后真正拉开差距的，是你敢把多大的一摊事，整个交给 AI。

　　参考资料：

　　https://openai.com/index/introducing-codex/https://openai.com/index/codex-for-every-role-tool-workflow/

　　https://x.com/gdb/status/2070199649823297653

　　https://openai.com/index/how-agents-are-transforming-work/https://openai.com/index/harness-engineering/

　　编辑：元宇

造ChatGPT的人，已经不用ChatGPT干活了

我们的产品

相关链接

关于我们

联系我们