国思软件 - 菲尔兹奖得主0贡献！GPT-5.5 Pro两小时跑出博士级证明

　　新智元报道

　　编辑：桃子

　　全网震撼！菲尔兹奖得主把未解数学题扔给 GPT-5.5 Pro，不到两小时拿到博士论文级证明。整个过程中，他没给出任何数学思路。

　　今天，菲尔兹奖得主 Timothy Gowers 在个人博客上发了一篇长文——

　　最近一次使用 ChatGPT 5.5 Pro 的体验

　　标题平平无奇，内容却让整个数学圈坐不住了。

　　文中，他亲手验证了一个令整个数学界不寒而栗的事实：

　　GPT-5.5 Pro，用了不到两个小时，独立完成了一项博士论文级别的数学研究。

　　而 Gowers 本人在整个过程中，数学贡献几乎为0。

　　两个小时，一章博士论文级成果。

　　全程 2 小时，菲尔兹奖得主贡献为0

　　事情是这样的。

　　这几天，Timothy Gowers 拿到了 ChatGPT 5.5 Pro 的测试权限，决定搞一次真刀真枪的测试。

　　他从数学家 Melvyn Nathanson 的一篇新论文中，挑出了几个关于加法数论中集合求和的未解问题。

　　这些问题的核心是：给定一个k个整数的集合A，它的h重求和集 hA 的可能大小有哪些？

　　要实现特定大小的求和集，集合的「直径」最小能是多少？

　　Nathanson 自己给出了一个指数级的上界：2^k - 1。

　　于是，Gowers 把问题扔给了 GPT-5.5 Pro。17 分钟 05 秒后，AI 给出了一个构造，直接把上界从指数级干到了二次方级。

　　而这，显然已经是最优的了。

　　更让人坐不住的，是 Gowers 在整个过程中扮演的角色。

　　他没有给出任何数学思路，没有提供关键引理，更没有指出证明方向，

　　Gowers 只是充当了一个「情绪价值提供者」和「排版助手」，给出的提示词极其简单——

　　对，这个想法不错，试试看能不能成；

　　把这段推导写成标准的 LaTeX 论文格式。

　　博客中，Gowers 在反复强调：提示词「不包含任何数学输入」。

　　AI 走的每一步推理、每一个构造、每一处关键转折，都是它自己想出来的。

　　仅用了几个小时，AI 就完成了人类可能需要数月，甚至数年才能完成的工作。

　　换句话说，人类顶级数学家在这场合作中的智力贡献，约等于0。

　　AI 给出原创想法，震惊 MIT 博士生

　　如果故事到这里就结束了，那顶多算是「AI 又解了一道数学题」。

　　但后面发生的事情，才真正让人细思极恐。

　　Gowers 继续追问 ChatGPT：那一般情况的h呢？这个问题的难度陡然上升。

　　因为当h=2 的时候，数学家们已完全搞清了所有可能的求和集大小。但对于一般的h，甚至不知道完整的答案是什么。

　　此前，MIT 博士生 Isaac Rajagopal 已经证明了一个指数级的上界。

　　Gowers 于是让 GPT 去看看能不能改进拉 Rajagopal 的结果。

　　第一轮：GPT 思考了 16 分 41 秒，把上界从k的指数级改进到了k^(1/2+ε)的指数级。

　　这是对拉 Rajagopal 工作的「常规修改」。

　　第二轮：Gowers 说，能不能再进一步，搞到多项式级？

　　GPT 思考了 13 分 33 秒，表示「有戏」，但需要验证两个技术性命题。

　　Gowers 让它自己验证，9 分 12 秒后，GPT 完成了验证，并在随后的 31 分 40 秒内写出了完整的预印本论文。

　　论文地址：https://drive.google.com/file/d/1IkJBcWYz_3J_QGsESBmMa-jrEHAJDcJB/view

　　最终结果：N(h,k) ≤ O (k^{10h³})——从指数级，直接跃升到多项式级。

　　Rajagopal 本人看完后，给出了一个让人五味杂陈的评价：

　　ChatGPT 这个想法很原创、很巧妙。如果是我自己想出来的，我会非常骄傲。

　　然而，我需要一两周才能完成的脑力风暴，GPT 只用了不到一个小时。

　　更重磅的是，Rajagopal 详细分析了 GPT 的核心创新——

　　它使用了h²-耗散集（h²-dissociated sets）来控制h阶以下的关系。「这个思路，据我所知，完全是原创的」。

　　不得不说，当一个 MIT 学生用「我会为这个想法感到骄傲」来评价一个 AI 的数学证明时，某种范式转移已经悄然发生了。

　　顶级数学家警告：危机来了

　　菲尔兹奖得主 Gowers 没有停留在「ChatGPT 很厉害」的层面，他直接把话题拉到了最尖锐的问题：

　　博士生怎么办？

　　这才是这篇博客真正的重量级炸弹。

　　在组合数学领域，有大量论文会提出一系列新的组合参数，并附带一串未解问题。

　　这些问题通常不是特别难，它们的价值在于给初入科研的学生提供一个「可以攻克的目标」，让他们在解决一个「正式的开放问题」中获得信心和成就感。

　　但现在，这条路被 AI 截断了。Gowers 的原话说得很直白：

　　过去，只要有人提出问题就够了。

　　但现在，仅仅被提出是不够的，它还必须足够难，难到 LLM 解决不了。

　　2026 年至今，已有 15 个 Erdős开放问题被解决，其中 11 个明确标注了 AI 的贡献。

　　就在几周前，一个 23 岁、没有高等数学学位的年轻人 Liam Price，用 GPT-5.4 Pro 在 80 分钟内解决了一个困扰数学家 60 年的 Erdős问题。

　　菲尔兹奖得主陶哲轩亲自验证了这个证明，并将其扩展为一个新理论的起点。

　　过去需要数年训练才能达到的研究能力门槛，正在被 AI 一夜之间碾平。

　　Gowers 直言，「若是 AI 在数学领域以目前这个速度发展下去，那么我们将很快面临一场危机」。

　　对此，OpenAI 研究员 Sebastien Bubeck 深表赞同。

　　但也有人冷静指出：这只是一次实验，不能过度外推。Nathanson 的问题虽然是开放问题，但难度未必代表数学前沿的天花板。

　　Gowers 自己也承认，他「没有完整答案」，只是在记录自己的经历。

　　过去两年，类似的「AI 攻克数学」叙事出现过好几次，仔细看都会发现具体条件限制不少。

　　但这一次，说话的人是菲尔兹奖得主，他的判断标准不需要额外背书。

　　AI 数学加速度，已不可逆转

　　把时间线拉长一点就会发现，AI 在数学领域的进步曲线几乎是垂直的。

　　2023 年，GPT-4 做不了大多数本科数学题；2024 年，o1 在数学竞赛中拿到了金牌水平；2025 年，o3 在前沿研究中开始展现推理能力。

　　2026 年 5 月，GPT-5.5 Pro 独立完成了博士论文级别的证明。

　　三年，从本科到博士。

　　Gowers 的实验揭示了一个临界点：AI 不只是工具了。至少在某些问题上，它已经是一个能独立产出原创结果的研究者。

　　那些曾经需要数年苦修才能叩开的大门，现在只需要一个提示框和两个小时。

　　门槛没了。但门后面的世界，可能比我们想象的更大，也更陌生。

　　参考资料：

　　https://x.com/wtgowers/status/2052830948685676605?s=20

　　https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/

菲尔兹奖得主0贡献！GPT-5.5 Pro两小时跑出博士级证明

我们的产品

相关链接

关于我们

联系我们