有点伤自尊,但太值了!Karpathy:当AI接管80%代码,我看清了AGI魔法

  新智元报道

  编辑:元宇

  在 2025 年的最后一个月,Andrej Karpathy 经历了 20 年编程生涯中「最伤自尊」的一次巨变。

  就在刚刚过去的一两个月,一场无声的巨变发生在特斯拉前 AI 负责人、OpenAI 创始成员 Andrej Karpathy 身上。

  去年 11 月,他的工作流还是 80% 的代码手敲,20% 的代码交给 AI。

  仅仅几周过去,二八比例,出现了 180 度对调!

  AI 接管了 80% 的代码工作,而他只负责剩下的 20% 象征性微调工作。

  用 Karpathy 的话说:我现在基本上是在用英语编程,虽然有时多少会觉得有点伤自尊,但那感觉还是太值了。

  当大众对 AI 编码的认知还停留在「AI 写代码会有 Bug」的阶段时,Karpathy 已经宣布,「最热门的新编程语言是英语」!

  他抛弃了曾引以为傲的手写代码技能,取而代之的是「用英语指挥 AI 写代码」的新编程方式。

  Karpathy 在推文中说道,这是他二十年编程生涯里所出现的,对基础编码工作流最大的变化,而且这些变化还是在短短几周内发生的:

  我预计已经有两位数百分比的工程师正在经历类似的转变,而普通大众对此的认知程度,感觉还停留在个位数的低水平。

  这说明这场史诗级的 AI 编码方式转变,并不只是天才程序员的游戏,也发生在许多普通程序员甚至是非编码工程师的人身上。

  几乎所有人都在这场 Claude 引发的狂潮中,感受到了一种职业生涯被重塑的强大冲刷感。

  当编程变成一种「不好意思」的对话

  Karpathy 在描述这段剧变时,用词非常微妙。

  他说,现在的编程过程有时会让他感到有一点「伤自尊」。

  原本需要一个团队忙活一个星期的架构,现在只要他用英语和 AI 聊几句,代码就会如潮水般涌现。

  也许在去年 11 月之前,他觉得 AI 是他的副驾驶,80% 的工作还要靠自己手敲代码。

  但到了 12 月,短短几周时间他却突然发现,AI 已经接管了驾驶位,他坐在了副驾驶位置,留给他的只有 20% 的修补工作。

  这种「身份互换」所带来的冲击是前所未有的。有着资深编码经历的他,甚至会为这种「不劳而获」的爽感,觉得「有些不好意思」。

  但这种转变已经是不可逆转。

  尤其是像 Claude 和 Codex 等模型的编程能力在去年 12 月左右经跨过了「一致性」阈值之后,引发了软件工程巨变。

  当对话的质量(提示词工程)决定代码的质量,这种「英语编程」就成了一种新的硬核技能。

  IDE / 智能体蜂群 / 易错性:一些言过其实的说法

  在这篇推文中,Karpathy 也谈到了他对当前生成式 AI 在编程中的作用和局限性的看法。

  他觉得有些说法太夸张了,比如「AI 来了,就不用 IDE(集成开发环境,像 VS Code 那种代码编辑器)了」,或者「智能体蜂群」(AI 智能体像蜂群一样协作编程)的热炒。

  他承认 AI 是巨大进步,但模型还是容易出错,不是万能的。

  1.  别太相信AI,重要的代码还要自己盯紧

  对于真正重要的代码,Karpathy 建议不要扔掉 IDE,而是用一个大屏、舒服的 IDE 在旁边监视 AI 的输出,就像老鹰盯准猎物一样。

  现在错误的类型已经明显变了,不再是简单的语法错误,而更类似于一种稍微有点马虎、赶进度的初级工程师会犯的概念性错误。

  2.  AI最常见的毛病:爱乱假设,然后一路错下去

  AI 会自己「脑补」一些错误的假设(比如误解你的需求),然后不检查就继续写代码,导致整个东西崩盘。

  它不像真人那样停下来问:「这个地方我不确定,你能澄清吗?」,也不会指出代码里的矛盾、比较不同方案的优缺点,或者在你想法不对时「顶撞」你。

  相反,依然有点过度讨好。Karpathy 认为进入「计划模式」(plan mode,让 AI 先规划再执行)会好点,但还需要一种更简单、能随时插入的轻量版计划模式。

  3.  AI爱把简单的事搞复杂

  AI 写代码时,容易过度抽象(加太多层级)、结构臃肿(代码变胖),还经常不清理自己留下的死代码(废弃的部分)。

  它可能给你吐出一大堆低效、容易出 bug 的上千行代码,当你要求它们简化时,它们可能立刻精简到 100 行。

  它有时还会「多管闲事」,即便和当前任务无关,它们也会顺手修改或删除自己不喜欢、或者没完全理解的注释和代码。

  即便在 CLAUDE.md 里用一些简单指令试图约束,这些问题依然存在。

  尽管如此,Karpathy 仍认为整体上它已经是革命性提升了,已经很难想象再回到纯手写编码的时代了。

  当一个人习惯了 AI 帮忙写代码,再回去纯手工敲,可能会感觉像是回到了石器时代,超级难受。

  这说明 AI 虽然强大,但人类要聪明使用,才能发挥出超能力的效果。

  AGI 魔法真相

  提速之外

  是能力边界的扩展

  AI 辅助,到底为编程带来了多大的「加速」,这一点虽然并不好量化,但 Karpathy 的感受是:自己完成原本计划做的事情明显更快了。

  而且,还有比这更重要的变化,他可以做远超原计划的事情:

  • 可以写很多以前根本不值得花时间写的代码;

  • 可以去处理以前因为知识或技能不足而完全不敢碰的代码。

  因此,除了提速之外,AI 编码带给 Karpathy 更重要的一个变化是能力边界的扩张。

  AI 韧性

  真正的魔法来自于「闭环尝试」

  AI 智能体之所以能让 Karpathy 这样的大神感到震撼,是因为它具备一种人类极度稀缺的特质:韧性(Tenacity)。

  Karpathy 观察到,当一个代码 Bug 困扰人类超过 30 分钟,大多数人会陷入烦躁、焦虑甚至想要放弃。

  但 AI 不会。

  它会像一台不知疲倦的复读机,为了一个逻辑漏洞死磕到底,它可以连续尝试 50 种方案,每一次都保持着最初的热情。

  耐力本身是人类工作的一个核心瓶颈,而有了大模型之后,这个瓶颈被极大地放宽了。

  因此,当很多人认为 AI 的强大在于它「无所不知」,Karpathy 指出,它的真正魔法来自于「闭环尝试」。

  大模型非常擅长在循环中不断尝试,直到满足明确的目标条件,Karpathy 认为这正是大多数「AGI 体感」魔法的来源。

  人类的局限是,我们在写代码时,一旦遇到错误,心智负担会迅速增加。

  但 AI 的优势在于它不知疲倦。如果你给它一个明确的目标(比如:这个网页必须有一个能工作的登录框),它可以在循环中尝试 100 次。

  这种「不断试错直到成功」的能力,在感官上非常接近人类的智慧(AGI 体感)。

  声明式指令

  给「终点」,不给「路线图」

  AI 这种「闭环尝试」直至成功的特质,意味着我们要把思维从「命令式」(Imperative)切换到「声明式」(Declarative)。

  不要告诉它具体步骤,给它成功标准,然后看它自己跑。

  • 命令式编程(旧思维):告诉 AI 第一步打开文件,第二步解析字符串,第三步过滤空格……如果其中一步错了,全盘皆错。

  • 声明式编程(新思维):告诉 AI「我需要一个能处理这种 CSV 格式并输出图表的脚本,这是它的规格说明」。

  只要你定义清楚了「成功标准」,AI 就会利用它的「闭环尝试」能力去撞开每一扇门。

  测试驱动(TDD)与工具集成(MCP)

  Karpathy 还提到了具体的实操策略。

  1.  先写测试,再过测试

  Karpathy 认为这是最聪明的做法。

  先让 AI 写一段「验证程序是否正确」的代码(测试用例)。

  只要测试没通过,AI 就得在循环里一直改代码,测试就是 AI 的「监考老师」。

  2.  引入 MCP(Model Context Protocol)

  比如把浏览器能力集成进循环。

  AI 写完代码,自动打开浏览器运行,如果发现页面白屏或报错,它会自己看到报错信息,然后回到循环里继续修 Bug。

  整个过程,人类不需要介入。

  3. 杠杆效应:用「AI 的时间」换取「人的自由」

  所谓杠杆效应,就是让智能体循环得更久。

  不要一上来就让 AI 写最复杂的架构,先让它写一个「虽然笨但一定对」的版本。

  有了这个正确的基准,再让它去做性能优化。

  这样,每个人的编程成本,变成了写下「规格说明」的那几分钟。而 AI 可能在后台默默循环、尝试、报错、重启了整整一个小时。

  我们每个人的杠杆就在于:你投入的「指令时间」越短,AI 运行的「循环时间」越长,你获得的生产力倍率就越高。

  AI 编程的乐趣与「废用性萎缩」

  AI 编程带给了 Karpathy 乐趣,这一点让他事先没想到。

  他认为用智能体编程反而比以前更好玩了:

  当大量填空式的苦活被拿掉,留下来的更多是创造性的部分,他也更少被卡住(Karpathy 认为这种被卡住的体验一点都不好玩)。

  而且有了 AI 之后,Karpathy 在面对问题时也变得更有勇气了,因为几乎总能找到一种方式与它并肩作战、向前推进。

  Karpathy 认为 AI 编程大概会把工程师分成两类:一类主要喜欢「写代码」,另一类主要喜欢「造东西」。

  除了这些乐趣和积极的变化之外,Karpathy 也看到了 AI 编程所带来的一种令人不安的变化。

  他提出了一个警示:废用性萎缩

  「我已经明显感觉到,自己手写代码的能力在慢慢退化。」

  Karpathy 认为,当我们习惯了只负责判别、不负责生成(这是人类大脑中两种不同的能力),我们的大脑就像是长期不用、开始退化的肌肉,也就是说人类手动编程的能力正在经历一场不可逆的退化。

  这不仅是技能的丧失,更是一种深层的「降级」。

  如果有一天 AI 撤下了它的梯子,那些已经习惯了漂浮在云端、失去攀爬能力的程序员,该怎么办?

  Karpathy2026 预言

  垃圾内容大爆发与人才结构的洗牌

  自 2022 年末 ChatGPT 问世以来,生成式 AI 的爆发,已经进入第四个年头。

  Karpathy 表示,他已经为 2026 年做好了心理准备,那可能会是 GitHub、Substack、arXiv、X/Instagram 乃至几乎所有数字媒体的「垃圾内容大爆发」,也包括一些对 AI 生产力变革的炒作。

  当然,这个过程也会伴随着真实、扎实的进步。

  最近他不断思考的几个问题是:

  「10X 工程师」会发生什么变化?

  平均工程师和顶尖工程师之间的生产力差距,会不会被进一步拉大?

  在大模型加持下,通才是否会越来越胜过专才?毕竟大模型在补齐细节方面很强,但在宏观战略上没那么强。

  未来的大模型编程体验会像什么?像打《星际争霸》?像玩《异星工厂》(Factorio)?还是像演奏音乐?

  社会中到底有多少问题,本质上是被数字化知识工作的瓶颈卡住的?

  Karpathy 提到 Claude 和 Codex 等 AI 智能体能力在 2025 年 12 月左右跨过了某个一致性阈值,忽然之间像是明显走在了其他一切前面:无论是集成(工具、知识)、新的组织工作流与流程,还是更广泛的扩散。

  因此,他认为2026 年将会是一个高能量的年份,整个行业都在消化、吸收这种全新的能力

  在这种混乱中,人才的结构将发生一次大规模的洗牌。

  那些在宏观策略上有洞察、能够跨领域思考的人,因为拥有了 AI 这个无所不能的执行工具,他们的生产力将被放大成百上千倍,也许通才的春天可能会到来。

  相反,那些只掌握单一领域、只会机械执行的「专才」,将面临残酷的挤压。

  更让人扎心的是:AI 并没有像人们预想的那样抹平差距。

  一种现实可能是,一个顶尖开发者利用 AI 所爆发出的能量,与普通开发者之间的差距,将远远超出 10 倍以上。

  参考资料:

  https://x.com/karpathy/status/2015887154132746653