国思软件 - ChatGPT证明了六年难题，图灵奖得主说：高兴早了

　　新智元报道

　　强化学习之父、图灵奖得主 Richard Sutton 一针见血：今天的 AI，好的部分全是老套路，新颖的部分全是废话。

　　学术圈最毒的评价之一是：

　　这项工作既有新意，又很好。

　　可惜的是，好的部分不新颖，新颖的部分不好。

　　但强化学习领域的奠基人之一、《强化学习》教科书的作者、图灵奖获得者 Richard Sutton，把这个笑话对准了整个生成式 AI。

　　他说：这个评价，适用于今天我们所熟悉的大部分 AI。

　　AI：好的部分不新颖，新颖的部分不好

　　Sutton 的核心论断极其简洁，简洁到残忍。

　　生成式 AI 本质上是监督学习。

　　监督学习的逻辑是：给模型看大量人类创造的样本，让它学会模仿。

　　模仿得越像，分数越高。

　　问题来了。

　　当模型严格按训练数据生成内容时，输出质量很高，因为它在复现人类已经验证过的好东西。但这不新颖。它只是在用不同的排列组合，重新包装人类已经知道的事。

　　当模型试图偏离训练数据、生成真正新颖的内容时，质量就崩了。因为它没有任何内部机制来判断「这个新东西到底好不好」。它只会生成，不会评估。

　　这就是那个结构性矛盾：

　　新颖性和质量，在纯监督学习的框架下，是跷跷板的两端。

　　你按下一头，另一头就翘起来。

　　不是工程问题。不是靠堆数据、扩大模型、加更多 GPU 就能解决的。

　　Sutton 用了一个极其刺眼的类比：「幻觉」——大模型最被人诟病的毛病——本质上就是模型试图「新颖」的副产品。

　　我们讨厌幻觉，恰恰证明了一件事：我们其实根本不要新颖性。我们只要高质量的模仿。

　　「好的不新颖，新颖的不好。」

　　那个笑话里审稿人的毒评，竟然精准描述了整个生成式 AI 的内在局限。

　　真正的「发现」，需要三件套

　　Sutton 从第一性原理出发，拆解了创造力的「三位一体公式」：

　　真正的发现（Discovery）=变异（Variation）+评估（Evaluation）+选择性保留（Retention）。

　　任何真正的创造力与发现，都需要三个步骤，缺一不可：

　　1. 变异（Variation）产生多样化的可能性。可以是随机的，可以是基于已有知识的，但必须有真正的不确定性——否则不叫探索，叫查表。

　　2. 评估（Evaluation）判断哪些变异是有价值的。这需要一个明确的目标，或者一个能够识别「好坏」的标准。

　　3. 选择性保留（Selective Retention）把有价值的变异留下来，让它影响未来的行动和学习。

　　这三个步骤，不是 Sutton 的发明。它是自然选择的逻辑，是科学方法的逻辑，是人类学习的逻辑。

　　进化论：随机基因突变（变异）→环境筛选（评估）→适者生存（选择性保留）。

　　科学方法：提出假说（变异）→实验验证（评估）→发表论文（选择性保留）。

　　人类学习：尝试不同解法（变异）→检验对错（评估）→记住有效的方法（选择性保留）。

　　现在，生成式 AI 只完成了三位一体的第一步：几乎没有评估，更不要提选择性保留了，

　　它就像一个会随机射箭的弓箭手，但眼睛是蒙着的，射完之后既不看靶子，也不根据结果调整姿势。

　　你叫它射一万箭，偶尔会中靶，但它永远不知道为什么中了。

　　那么，科学家还有没有用？

　　到这里你可能会有点焦虑：如果未来 AI 真的能自主完成"发现"的三位一体，科学家是不是就要失业了？

　　Sutton 自己的回答是：不能被取代，但角色要彻底转型。

　　他在演讲中说，哪怕是能独立证明数学定理的 AI，目前仍然需要人类来告诉它：哪些问题是重要的。

　　这不是谦虚，而是真实的认知边界。

　　数学家 Shiqian Ma，莱斯大学（Rice University）优化领域学者，说：他用 ChatGPT，证明了一个让他研究了整整六年的算法收敛性问题。

　　摘要里有一句话：

　　证明由 ChatGPT 5.5 生成，经作者验证。

　　https://optimization-online.org/2026/05/convergence-of-bdrs-as-a-matrix-scaling-algorithm/

　　这个算法叫 BDRS，全称 Bregman Douglas-Rachford Splitting，用于解决最优传输（Optimal Transport）问题。

　　论文标题：Bregman Douglas-Rachford Splitting Method

　　预印本地址：https://arxiv.org/abs/2509.08739

　　这是他和合著者们自己设计的东西，困扰了他六年的，是它的收敛性证明，就是说数学上最严格意义上的「它为什么是对的」。

　　预印本平台 arXiv 收到投稿后，至今仍在搁置。

　　他猜测原因：摘要里有「ChatGPT」三个字，平台不知道该如何处理这类论文。

　　但人类能被 AI 取代吗？

　　他的回答是：不能。他直言：

　　我认为 AI 不能创造性地提出这种算法，并声称「这是一种用于最优传输的高效算法，现在让我试着证明它的收敛性」。

　　没有人类的引导，AI 根本不知道该解决哪个问题。

　　这句话和 Sutton 精确对应：问题本身，必须由人类来定义。

　　他花了六年，才「提出正确问题」：

　　要提出哪些问题，实际上需要你对该主题有非常深入的理解。

　　就本例而言，我已在这个问题上钻研了六年，因此我清楚地知道其中的难点所在。"

　　这六年不是浪费，是先决条件。

　　正是这六年，让他知道这个证明卡在哪，之前所有路径失败的原因是什么，ChatGPT 给出的哪个方向值得继续追、哪个是幻觉。

　　而且不是一次提示，是五个月。这是最容易被误解的地方，他自己也误解过：

　　从 1 月到 5 月，整整五个月，无数次对话，每一次提示都在逼近那个证明。

　　他总结得极其清醒：

　　研究的本质没变，还是反复试错。变的是每一次试错的速度——过去需要几周验证一个方向，现在几分钟就能知道这条路走不走得通。

　　但 AI 的贡献不可磨灭：

　　然后，结尾直接封神：

　　回到我关于 BDRS 收敛性的论文，我相当确信证明是正确的。

　　但如果你发现任何错误，责任全由我承担——请不要责怪 ChatGPT，它才 3.5 岁。

　　这句话妙就妙在双重性：这是真诚的责任声明，也是一个精准的隐喻。

　　「3.5 岁」描述了 AI 此刻真实的处境：能力惊人，但判断未熟。

　　毕竟，人类从来没有指望 3.5 岁的孩童能做什么贡献。

　　虽然你不能把证明的最终签名权交给 AI，但你也不能假装 AI 没做任何贡献。

　　这也是为什么，真正的科学发现不会消失在人类手中。

　　相反，它会更残酷地筛选人类：谁能提出好问题，谁才配拥有强 AI。

　　未来，科学家不借助 AI，或许就像天文学家不用电脑一样过时。

　　最后，我们一起回味 Sutton 颇具宣言性质的话：

　　如果我们希望充分发挥 AI 科学家的全部力量，就应该与他们共享目标，让他们能够创造、评估、发现，从而全面参与实现这些目标。

　　让我们大胆一点！让我们彻底实现创造力与发现的全自动化！

　　参考资料：

　　https://x.com/RichardSSutton/status/2061216087744946656

　　https://optimization-online.org/2026/05/convergence-of-bdrs-as-a-matrix-scaling-algorithm/

　　编辑：大卫

ChatGPT证明了六年难题，图灵奖得主说：高兴早了

我们的产品

相关链接

关于我们

联系我们