菲尔兹奖得主0贡献!GPT-5.5 Pro两小时跑出博士级证明

  新智元报道

  编辑:桃子

  全网震撼!菲尔兹奖得主把未解数学题扔给 GPT-5.5 Pro,不到两小时拿到博士论文级证明。整个过程中,他没给出任何数学思路。

  今天,菲尔兹奖得主 Timothy Gowers 在个人博客上发了一篇长文——

  最近一次使用 ChatGPT 5.5 Pro 的体验

  标题平平无奇,内容却让整个数学圈坐不住了。

  文中,他亲手验证了一个令整个数学界不寒而栗的事实:

  GPT-5.5 Pro,用了不到两个小时,独立完成了一项博士论文级别的数学研究。

  而 Gowers 本人在整个过程中,数学贡献几乎为0

  两个小时,一章博士论文级成果。

  全程 2 小时,菲尔兹奖得主贡献为0

  事情是这样的。

  这几天,Timothy Gowers 拿到了 ChatGPT 5.5 Pro 的测试权限,决定搞一次真刀真枪的测试。

  他从数学家 Melvyn Nathanson 的一篇新论文中,挑出了几个关于加法数论中集合求和的未解问题。

  这些问题的核心是:给定一个k个整数的集合A,它的h重求和集 hA 的可能大小有哪些?

  要实现特定大小的求和集,集合的「直径」最小能是多少?

  Nathanson 自己给出了一个指数级的上界:2^k - 1。

  于是,Gowers 把问题扔给了 GPT-5.5 Pro。17 分钟 05 秒后,AI 给出了一个构造,直接把上界从指数级干到了二次方级。

  而这,显然已经是最优的了。

  更让人坐不住的,是 Gowers 在整个过程中扮演的角色。

  他没有给出任何数学思路,没有提供关键引理,更没有指出证明方向,

  Gowers 只是充当了一个「情绪价值提供者」和「排版助手」,给出的提示词极其简单——

  对,这个想法不错,试试看能不能成;

  把这段推导写成标准的 LaTeX 论文格式。

  博客中,Gowers 在反复强调:提示词「不包含任何数学输入」。

  AI 走的每一步推理、每一个构造、每一处关键转折,都是它自己想出来的。

  仅用了几个小时,AI 就完成了人类可能需要数月,甚至数年才能完成的工作。

  换句话说,人类顶级数学家在这场合作中的智力贡献,约等于0。

  AI 给出原创想法,震惊 MIT 博士生

  如果故事到这里就结束了,那顶多算是「AI 又解了一道数学题」。

  但后面发生的事情,才真正让人细思极恐。

  Gowers 继续追问 ChatGPT:那一般情况的h呢?这个问题的难度陡然上升。

  因为当h=2 的时候,数学家们已完全搞清了所有可能的求和集大小。但对于一般的h,甚至不知道完整的答案是什么。

  此前,MIT 博士生 Isaac Rajagopal 已经证明了一个指数级的上界。

  Gowers 于是让 GPT 去看看能不能改进拉 Rajagopal 的结果。

  第一轮GPT 思考了 16 分 41 秒,把上界从k的指数级改进到了k^(1/2+ε)的指数级。

  这是对拉 Rajagopal 工作的「常规修改」。

  第二轮Gowers 说,能不能再进一步,搞到多项式级?

  GPT 思考了 13 分 33 秒,表示「有戏」,但需要验证两个技术性命题。

  Gowers 让它自己验证,9 分 12 秒后,GPT 完成了验证,并在随后的 31 分 40 秒内写出了完整的预印本论文。

  论文地址:https://drive.google.com/file/d/1IkJBcWYz_3J_QGsESBmMa-jrEHAJDcJB/view

  最终结果:N(h,k) ≤ O (k^{10h³})——从指数级,直接跃升到多项式级。

  Rajagopal 本人看完后,给出了一个让人五味杂陈的评价:

  ChatGPT 这个想法很原创、很巧妙。如果是我自己想出来的,我会非常骄傲。

  然而,我需要一两周才能完成的脑力风暴,GPT 只用了不到一个小时。

  更重磅的是,Rajagopal 详细分析了 GPT 的核心创新——

  它使用了h²-耗散集(h²-dissociated sets)来控制h阶以下的关系。「这个思路,据我所知,完全是原创的」。

  不得不说,当一个 MIT 学生用「我会为这个想法感到骄傲」来评价一个 AI 的数学证明时,某种范式转移已经悄然发生了。

  顶级数学家警告:危机来了

  菲尔兹奖得主 Gowers 没有停留在「ChatGPT 很厉害」的层面,他直接把话题拉到了最尖锐的问题:

  博士生怎么办?

  这才是这篇博客真正的重量级炸弹。

  在组合数学领域,有大量论文会提出一系列新的组合参数,并附带一串未解问题。

  这些问题通常不是特别难,它们的价值在于给初入科研的学生提供一个「可以攻克的目标」,让他们在解决一个「正式的开放问题」中获得信心和成就感。

  但现在,这条路被 AI 截断了。Gowers 的原话说得很直白:

  过去,只要有人提出问题就够了。

  但现在,仅仅被提出是不够的,它还必须足够难,难到 LLM 解决不了。

  2026 年至今,已有 15 个 Erdős开放问题被解决,其中 11 个明确标注了 AI 的贡献。

  就在几周前,一个 23 岁、没有高等数学学位的年轻人 Liam Price,用 GPT-5.4 Pro 在 80 分钟内解决了一个困扰数学家 60 年的 Erdős问题。

  菲尔兹奖得主陶哲轩亲自验证了这个证明,并将其扩展为一个新理论的起点。

  过去需要数年训练才能达到的研究能力门槛,正在被 AI 一夜之间碾平。

  Gowers 直言,「若是 AI 在数学领域以目前这个速度发展下去,那么我们将很快面临一场危机」。

  对此,OpenAI 研究员 Sebastien Bubeck 深表赞同。

  但也有人冷静指出:这只是一次实验,不能过度外推。Nathanson 的问题虽然是开放问题,但难度未必代表数学前沿的天花板。

  Gowers 自己也承认,他「没有完整答案」,只是在记录自己的经历。

  过去两年,类似的「AI 攻克数学」叙事出现过好几次,仔细看都会发现具体条件限制不少。

  但这一次,说话的人是菲尔兹奖得主,他的判断标准不需要额外背书。

  AI 数学加速度,已不可逆转

  把时间线拉长一点就会发现,AI 在数学领域的进步曲线几乎是垂直的。

  2023 年,GPT-4 做不了大多数本科数学题;2024 年,o1 在数学竞赛中拿到了金牌水平;2025 年,o3 在前沿研究中开始展现推理能力。

  2026 年 5 月,GPT-5.5 Pro 独立完成了博士论文级别的证明。

  三年,从本科到博士。

  Gowers 的实验揭示了一个临界点:AI 不只是工具了。至少在某些问题上,它已经是一个能独立产出原创结果的研究者。

  那些曾经需要数年苦修才能叩开的大门,现在只需要一个提示框和两个小时。

  门槛没了。但门后面的世界,可能比我们想象的更大,也更陌生。

  参考资料:

  https://x.com/wtgowers/status/2052830948685676605?s=20

  https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/