马斯克的好兄弟,卡帕西又双叒出新指南!GPT-5 Pro是AI编程最后防线

  新智元报道

  编辑:定慧好困

  「代码后稀缺时代」里,Karpathy 分享了他对 AI 辅助编程的最新体会:在代码已可低成本生成并随时丢弃的背景下,「写」与「删」的价值被重新审视。Cursor 补全适合日常开发,Claude Code 与 Codex 能完成大块功能但缺乏「品味」,而 GPT-5 Pro 则是攻克顽固 bug 的终极防线。

  马斯克的好兄弟,我们的好朋友,大神 Andrej Karpathy 最新「AI 编程指南」已出!

  在目前模型能力已经达到博士级的情况下,如何能够最大化 AI 对编程的帮助?

  当 AI 能够「低成本生成代码」,你只需要 vibe coding 的情况,一个新问题来了:

  现在是会写代码更重要?还是会删代码更重要?

  Karpathy 分享了他的「最佳 LLM 辅助编程」体验和方法。

  工具使用理念

  首先是建立一种理念,工具是为人服务的。

  不执着于单一「完美」工具,更倾向于整合多个工作流,取长补短。

  因为不同工具在不同层级的任务中各有优势。

  比如 Claude Code、Codex 等适合大段的难度不高的任务,Tab 补全则需要人类先「打好样」。

  Cursor(Tab 自动补全)

  Karpathy 说这种方式是日常工作的主要使用方式,比例大概占约 75%。

  因为在代码正确位置写代码块或注释,能向 AI 高效传达任务规范。

  这种「人类先写的方式」,信息传递效率高于自然语言对话。

  但有个问题,就是经常需开关 Tab 自动补全以避免干扰。

  更高一个层级的用法是,高亮一块具体的代码,然后让它进行某些修改。

  辅助工具(Claude Code / Codex 等)

  对于重型武器,比如 Cladue Code 和 Codex,可以用于实现大块、可直接描述的功能。

  不过这种完全的「自动驾驶」整体表现参差不齐,容易偏离需求。

  经常需手动中断(ESC)避免错误输出。

  Karpathy 也还没学会如何通过并行使用多个实例来提高效率——光用一个就感觉够费劲了。

  并且,Karpathy 还没找到好办法能把CLAUDE.md这个文件维护好。

  经常需要专门对代码风格或个人偏好的「代码品味」问题进行一轮「净化」,Karpathy 举了一些例子。

  它们写的代码防御性过强,比如,经常滥用try/catch;它们会把抽象搞得过于复杂;

  它们会产出臃肿的代码,例如,在可以用列表推导或单行if-then-else解决的地方,非要用嵌套的if-then-else结构);

  它们会重复代码块,而不是创建一个好用的辅助函数,等等……

  Karpathy 认为,目前来看,这些工具基本上没什么「品味」可言。

  简而言之,就是活是干了,但是没有写出「优美」的代码。

  不过,当 Karpathy 要涉足一些自己不太熟悉、需要「凭感觉编程」的领域时,它们又变得不可或缺。

  比如最近写的一些 Rust、SQL 命令,或者其他任何之前涉猎较少的技术。

  另一个体验就是,AI 写代码的同时能不能也化身老师,边写边教?

  Karpathy 曾试过让 Claude Code 在写代码的同时教他知识,但完全行不通——AI 只想埋头写代码,根本不想在过程中进行任何解释。

  还试过让它做超参数调优,结果非常滑稽。

  此外,在处理各种风险较低的一次性定制化、实用工具或调试代码时,它们也超级有用——如果没有它们,Karpathy 根本不会去写,因为太花时间了。

  举个例子,为了定位一个特定的 bug,Claude Code 可以一口气写出 1000 行一次性、极其详尽的可视化代码,等找到 bug 后,这些代码就全部删掉了。

  这就是「代码后稀缺时代」——你现在可以随手创造并删除成千上万行高度定制化、转瞬即逝的代码,这没关系,代码已不再是什么珍贵\昂贵的东西了。

  GPT-5 Pro:最后防线

  当面对最困难的问题,GPT-5 Pro 是最后的防线。

  只有 GPT-5 Pro 能定位其他工具无法解决的微妙 bug,用它能处理最硬核的问题。

  比如,Karpathy 已经遇到好几次这种情况:

  Karpathy(人类)、Cursor 和 Claude Code 三个加起来被一个 bug 卡了 10 分钟。

  但当把所有东西一股脑复制粘贴给 GPT-5 Pro 后,它琢磨了 10 分钟,结果真的找到了一个极其微妙的 bug。

  它非常强大,能挖出各种生僻的文档和论文之类的资料。

  Karpathy 也用它来处理其他更棘手的任务,比如就如何优化代码抽象征求建议(结果有好有坏,有时能提出好点子,但并非总是如此),或者围绕某个特定主题做一份完整的文献综述,它总能返回相关的优质资源和线索。

  代码「后稀缺时代」特征

  • 可快速生成和丢弃大量定制化、一次性代码。

  • 写代码的门槛降低,代码不再是稀缺资源。

  • 工具使得探索性和实验性编程成为可能。

  总之,在众多编程「范式」和各有优劣的工具的加持下,Karpathy 感觉编程这个领域被彻底引爆,充满了无限的可能性。

  身处其中,很难不为自己没能跟上技术最前沿而感到焦虑。

  因此,便有了以上这些胡思乱想,以及对其他人有什么新发现的浓厚兴趣。

  评论区里也由此引发大讨论。

  对于 CLAUDE.md 的更新问题,有人专门设置一个 Agent 来专门负责更新和校准。

  还有人表示可以把 Claude Code 得到代码,再给到 GPT 5 来「润色一番」。

  也有人分享了他的 AI 编程工具使用流程。

  还有人分享了他常用的开发工具。

  有人表达了同样的体会,在不同任务上选择合适的模型是一种艺术。

  你目前使用 AI 编程体验如何?可以评论区分享哦~

  参考资料:

  https://x.com/karpathy/status/1959703967694545296