再见,人类程序员!OpenAI自曝:一行代码都不写了,100%用Codex

  新智元报道

  编辑:好困 Aeneas

  100% 是用 Codex 写的。还有内部爆料说,Codex 让他们仅用三天时间就搭出了服务器,三周就发布了 APP。人类程序员,真的要退出历史舞台了?

  硅谷的空气里再次充满了躁动,而这一次的震源中心,回到了 OpenAI。

  OpenAI 的奇点时刻,也要来了?

  就在刚刚,X被一条爆料彻底刷屏——

  Codex,已经正式接管了 OpenAI 研究员「Roon」100% 的代码编写工作!

  Roon 发出了感慨万千的宣告:

  编程一直很痛苦,然而却是必经之路。我很高兴,它终于结束了。

  我惊讶于自己竟然这么快就摆脱了编程的阴影,而且一点都不怀念它。甚至我有点遗憾,从前的电脑为什么不是这样的。

  早在去年 12 月,Claude Code 之父 Boris Cherny 就曾投下一枚震撼弹——

  自己对 Claude Code 的贡献 100% 都是由 Claude Code 完成的。

  这一「套娃式」的自我进化,直接引爆了硅谷的自动编码狂潮。

  面对如此巨大的蛋糕,OpenAI 显然不会拱手相让。

  如今,反击已经开始。

  在刚刚过去的周末,Sam Altman 已经公开预告:接下来一个月会发布一堆关于 Codex 编码模型的新产品。

  社区的风向也开始发生微妙的转变。

  一些资深开发者评论道:在 90% 的情况下,GPT-5.2-Codex 都能一次性完成我提出的请求。

  Claude 虽然不错,但它偶尔会偷偷插入「坏代码」;相比之下,OpenAI 的新方案更像苹果——主打一个开箱即用。

  看来,Codex 和 Claude Code 的大战,已经一触即发!

  人类写代码的时代,彻底结束?

  OpenAI 研究员 Roon 的这个爆料,也让网友们直言:AI 终于到达了这个奇点!

  看来,人类直接手写代码的时代,真的结束了。

  经过多年的模型迭代与数据积累,我们似乎真的站在了一个临界点上:

  人类直接手写代码,正在变得不再有任何意义,甚至是一种效率的浪费。

  在 Roon 的评论区,人们开始集体对编程时代说再见。

  是的,我热爱电脑,热爱软件开发,对我而言,编程只是实现目标的手段,仅此而已。

  复杂的语法只是是我们为了让逻辑得以执行而必须付出的昂贵代价。

  如今,这些中间商终于可以退场了。

  激进的观点开始涌现。

  甚至有人建议,既然不需要人类阅读代码了,我们就该让模型跳过人类可读的汇编语言,直接使用机器代码。

  今天的编程就像曾经的打孔卡一样,应该永远消失了。

  与此同时,另一个炸裂的消息从 OpenAI 内部流出——

  一位研究员爆料,在 Codex 的辅助下,他们仅用了三天时间,就从零搭建了 OpenAI 的 MCP 服务器,并完成了规模验证。

  不仅如此,他们还在 3 周内推出了 Sora 的安卓应用;此外,还有一大波由 Codex 构建、甚至由 Codex 自我审核的内部工具正在排队上线。

  如果没有 Codex 的话,很难想象 OpenAI 能以如此惊人的速度发布产品。

  有趣的是,这位大佬似乎还玩起了 Claude Code 之父的梗:

  过去 30 天,我花了大量时间审核 Plan 和 PR,几乎没写一行代码!

  有人评价,这正是「起飞」第一阶段的样子。

  而下一步,或许就是真正的端到端 AI 自主研究。

  还有人问,确定你们这不是营销?

  这位研究者详细解释说,绝对不是。

  具体的使用过程是这样的:

  首先,他会花很多时间来撰写规格说明,并在脑海中构想输出应该是什么样子。

  然后,会启动一个「4×Codex」的云端并发任务。这样不仅可以一次性看到多种不同的变体,也能补上自己一开始遗漏的细节。

  接下来,就是让 Codex 自己发挥。等它跑完,人类再介入进行测试和验证。

  Codex CLI 0.9+ 来了!

  既然「人机协作」的范式已经改变,那么承载这种范式的工具自然也要升级。

  面对 Anthropic 在的步步紧逼,OpenAI 显然有备而来。

  就在今天,Codex CLI 连续推送了两次更新,版本号直接来到了 0.91.0。

  其中,Codex 0.9.0 带来了最受大家期待的功能——Plan Mode(计划模式)

  Code 模式是 Codex 的默认体验,它的工作方式和其他 AI 智能体一样。

  这点咱们就不多费口舌了。

  但 Plan 模式则完全不同,它将编程任务拆解为两个截然不同的阶段:

  第一阶段:理解意图(明确目标、划定范围、识别约束条件、制定验收标准)

  第二阶段:技术规格(生成决策完备的实施方案)

  在这种模式下,输出的内容非常详尽,无需任何后续追问即可直接执行。

  Plan 模式最聪明的地方在于:它坚持「证据优先探索」

  在开口问问题之前,Codex 会先在你的代码库中进行 2 次以上的针对性搜索,检查配置、Schema 结构、程序入口等。

  此外,Plan 模式还可以调用全套工具:

  它可以(并且将会)调用各种技能、子智能体和后台终端,从而构建高层级的实施计划。

  当 Codex 确实需要你输入时,它是结构化的,而且只有关键且聚焦的问题:

  · 尽可能提供选项

  · 总是包含一个推荐选项(对新手极其友好)

  · 只问那些会实质性改变计划的问题

  为了实现这一交互,它利用了新的 request_user_input 工具。

  这个工具会暂停执行流程,抛出一道有针对性的多项选择题,并支持你在选择时补充反馈或上下文。

  更贴心的是,一旦它在任何时候检测到歧义,尤其是当你在引导它时指令模糊,它会立即停下来确认,而不是盲目执行。

  现在,开发流程变成了这样:

  用户请求一个计划 -> AI 研究代码库与规划 -> 针对性询问用户 -> AI 完善并完成计划 -> 提示是否执行?

  但是,代码谁来审?

  看起来完美无缺,对吧?Codex 负责思考,Codex 负责执行,Codex 负责填满你的 GitHub。

  但就在我们为这种极致的效率欢呼时,一个被忽视的深渊正在脚下裂开——

  在这个新时代,最大的悬念不再是谁在写代码,而是谁来审核代码。

  当 AI 火力全开,每天向仓库甩出 10+ 个 PR 时,人类开发者面临的实际上是一场针对注意力的 DDoS 攻击。

  AI 生成代码是毫秒级的,而人类理解代码上下文是分钟级甚至小时级的。

  这种「生产与审查的极度不对称」带来了两个可怕的后果:

  审查者被淹没,开始习惯性点「Approve」,Code Review 沦为形式。

  那些看起来能跑、但缺乏系统性思考的代码块,正在像癌细胞一样在代码库中扩散。

  利益冲突显而易见,但我们需要看透这一层。

  Claude Code 的创造者吹捧自己的工具天经地义——这是商业的本能。

  但作为受众,我们不能把「Demo 里的完美世界」当成日常。

  毕竟,Demo 不会展示调试三小时都找不到的竞态条件,也不会展示由于上下文丢失导致的逻辑断层。

  除此之外,数据里还藏着一个迷人的悖论。

  Ars Technica 曾报道称,开发者对 AI 工具的使用量在涨,信任度却在跌。

  为什么?因为AI正在跨越「恐怖谷」

  以前的 AI 代码烂得很明显,现在的 AI 代码烂得很隐蔽——它引用了不存在的库,或者在一个极其边缘的 Case 上埋了雷。

  人们用得越多,踩的坑越多,信得自然越少。

  正如 Jaana Dogan 所警示的,我们正在面临软件工程「琐碎化」的风险。

  100 个提交,可能让 GitHub 的绿格子很好看。

  1 个架构变更,可能需要三天思考,零行代码产出。

  前者廉价如尘土,后者珍贵如黄金。

  问题从来不是 AI 能不能写代码,而是它写的代码,是不是我们系统真正需要的,以及我们是否有能力维护它

  这对我们意味着什么?

  无论我们是否准备好,这个时代已经来了。对于不同的人群,这意味着完全不同的生存法则。

  致开发者

  AI 编码工具不是「即将来临」,它们已经破门而入。

  问题在于,如何在不丢失自身核心价值的前提下整合它们。

  技术大牛们依然在做那些艰难的思考工作,AI 只是接过了「打字员」的工作。

  如果你只会「搬运代码」,那你确实该慌了。

  致非开发者

  「技术工作」与「非技术工作」的边界正在消融。

  Claude Cowork 这类工具创造了新物种。曾经需要开发者才能搞定的任务,可能很快只需要你能清晰描述出你想要什么。

  清晰描述需求的能力,将成为新的编程语言。

  最后的话

  虽然 OpenAI 的研究员和 Claude Code 的创造者都在宣称 AI 包办了 100% 的代码,但请记住——

  那是他们的实验室环境,不是你的生产环境。

  唯一可以确定的是,我们正在经历从「写代码」到「指挥写代码」的不可逆的转变。

  而且,正在加速。

  参考资料:

  https://x.com/tszzl/status/2015253546372153347

  https://jpcaparas.medium.com/the-claude-code-creator-says-ai-writes-100-of-his-code-now-956b2a5905ba?sk=4c840f27eb03694c8210086834a41691

  https://x.com/LLMJunky/status/2015487691891024052