
新智元报道
OpenAI 用 125 页思维链踹开 Erdős 80 年猜想的门,Mythos 如今找到了一条更短更优雅的路。最离谱的是,它拿到第一个可行解就停手了——面对名满天下的开放问题,AI 也会紧张。
AI 做数学这件事,速度已经彻底「失控」了!
OpenAI 前脚刚推翻了一个悬了 80 年的数学猜想,Anthropic 后脚就亮出证明。同一周,DeepMind 还一口气啃下了 9 道同类难题。
就在刚刚,Anthropic 研究员 Levent Alpoge 在上甩出十条推文:
OpenAI 花了 125 页才解开,他周末拿 Mythos 随手一试。
不仅分分钟搞定,而且路径还更短更简洁!

断网隔离,Mythos 开测
这位 Levent Alpoge 来头可不小。
1992 年出生,哈佛本科 4.0 满分、剑桥 Part III、普林斯顿博士(导师是菲尔兹奖得主 Manjul Bhargava),2015 年拿了 Morgan Prize(美国本科生数学研究最高奖),哈佛 Junior Fellow,并且解决了希尔伯特第十问题在所有数域上的推广。
2023 年 GPT-4 发布,他立刻被击中了。
对我来说,它瞬间成了人类有史以来创造的最有趣的东西。回到 CS!
紧接着,他便加入了 Anthropic。

这周 OpenAI 破解 Erdős难题之后,Levent 做了一件「显而易见的事」——让 Mythos 也试试。
为了确保公平,测试条件很严格。
多个 Claude Code 实例各自独立工作,全程断网,杜绝从 OpenAI 公开解法里「抄作业」的可能。

结果,模型不止一次找到了和 OpenAI 类似的解法,但它更偏爱另一条完全不同但更加简洁的路。
更有意思的是,模型明明已经找到了一个能推翻猜想的方案,却在第一个可行答案上就停了下来。
明明往前再走一步,就能拿到更强的结果。但 Mythos 太紧张了!
面对这道名满天下的开放问题,它不敢相信自己的结论,保守地停在了第一个可行方案上。
看到这,Levent 直接乐了:「这种感觉,所有数学家都懂!」

目前,Opus 4.7 已完成了证明全文的整理排版:

https://www-cdn.anthropic.com/files/4zrzovbb/website/ca35f196125c899a5ad11f011080202a652aef02.pdf
80 年没人赢过的赌注
时间拨回 1946 年。
匈牙利数学家 Paul Erdős提了一个听起来极简单的问题,在平面上撒n个点,最多能有多少对点之间的距离恰好是1?
举个例子,你在桌上摆 100 枚硬币,每两枚硬币圆心之间如果刚好隔一个硬币直径,就算一对「单位距离」。100 枚硬币最多能凑出多少对?
Erdős自己给了一个答案:把点排成方格网格,经过适当缩放后,单位距离对的数量大约是n^(1+c/log log n)。
也就是,100 枚硬币大概能凑出 100 多一丢丢对。
然后他下了赌注,这就是极限了,没人能做得更好。

之所以这么自信,因为这里有个关键瓶颈——高斯整数Z[i]。
Erdős的方格网格依赖这个数系,而一个固定范数在Z[i]里能分解出多少种方式,取决于除数函数,上限大约是 exp (O(log n / log log n))。
这就是那个「多出一丁点」的天花板。
80 年来,所有人都在这个框架里打转。

数论重武器,降维打击几何学
对于人类数学家来说,代代相传的直觉是「答案要在高斯整数Z[i]里找」。
Mythos 没读过这个传统,一上来就把Z[i]换成了次数远比 2 大的数域K的整数环O_K。
听起来像「用大炮打蚊子」,但就是这种跨学科的暴力,撬开了 80 年的僵局。

方法是,先利用 Golod-Shafarevich 判则,在一个二次域上面搭一座无限高的「数域塔」K₀ ⊂ K₁ ⊂ K₂ ⊂……
然后对每一层K_n取一个四次根扩张F_n = K_n(D^{1/4}),次数为d_n。
这座塔之所以管用,靠的是一个关键性质:
不管塔造多高,数域的「复杂度密度」始终有界,结构始终可控。一旦参数够大,几何计数就能启动。

接下来是整个证明的核心。
在 Erdős的Z[i]里,单位群只有{±1, ±i}四个元素。能往外伸的「单位距离方向」就这么几个,直接被除数函数死死卡住。
但在高维数域里,单位群的秩随维度增长,van der Corput 定理直接把秩转化成方向数。
如此一来,4 个方向就变成随维度爆炸式增长。

这段看不懂没关系,记住一件事就行——
Erdős被困在一个只有 4 个出口的房间里,Mythos 把墙拆了。

接下来是具体的构造。
首先,选一个实嵌入把这些数投射到平面上,就得到了点集P。
然后,取一个单位向量平移这些点,新旧两点之间的距离恰好是1。
因为方向数增长极快,满足条件的点对数量远超 Erdős的上限。
两者相乘,就得到了多项式增益。

更直觉地说:
单位距离方向数增长为 exp (Ω(d log log d)),而所有其他损耗全是 exp (O(d))量级。d log log d 碾压d。
Erdős的猜想,就这样被推翻了。
整个论证没有任何解析上的复杂性。和 OpenAI 那条 125 页路径相比,简洁得多。

用 Levent 自己的话说:
高层来看,这本质上还是 Erdős原始构造加上一座类域塔。
只不过这里做的是字面意义上最蠢的事——把大小不超过半径一半的点加到大小不超过半径一半的单位上。
而它之所以管用,是因为类域塔的几何计数增长实在太快了。

一周三连,各自破城
过去这一周的时间线,信息密度高到离谱。
5 月 20 日 OpenAI 官宣,一个未公开名称的通用推理模型,自主反驳了 Erdős单位距离猜想。
同一天,普林斯顿教授 Will Sawin 在 arXiv 贴出手工改进版,把指数从6×10⁻³⁸干到了 0.014。10³⁵倍的差距。
Georgia Tech 数学家 Tom Trotter,Erdős本人的合作者感慨道:「如果 Erdős还活着,他一定会激动到发疯。」
5 月 21 日 DeepMind 上场,AlphaProof Nexus 一口气啃下 9 道 Erdős题,每道推理成本最多只需几百美元。
5 月 26 日,Anthropic 也宣布实现独立证明,路径比 OpenAI 的 125 页短得多。
三家路线完全不同,但结果都收敛到了同一个点。

从笑话到《数学年刊》
要知道,在七个月前 AI 做数学还是个笑话。
2025 年 10 月,OpenAI 时任 VP Kevin Weil 在上宣称 GPT-5 解决了 10 个 Erdős问题。
看到推文后,负责维护 erdosproblems.com 的数学家 Thomas Bloom 当场回怼「严重歪曲事实」,模型只是检索到了已知解法。Yann LeCun 和 Demis Hassabis 都跟着嘲讽了一波。
很快,Weil 就删了帖,并在四个月后离开了 OpenAI。

当时所有人的判断都一样:模型会做题,但不会做研究。
转眼到了今天。
Bloom 签了验证报告。Gowers 写下了「提交到《数学年刊》我会毫不犹豫推荐接受」的盛赞。Litt 说这是「AI 自主产出的第一个让我觉得本身就有意思的结果」。
甚至,Litt 还在 Nature 的采访中表示:「没有人类能像 LLM 那样吸收全部数学文献。AI 正在打破学科之间的壁垒。」

三年前 GPT-4 还做不了本科数学题。
如今,让最伟大的数学家都感到绝望的 Erdős问题,却正在变成 AI 的入学考试!
打破 80 年僵局的,是一个不知道「这题应该怎么想」的模型。
没有包袱,反而能从代数数论里借来重武器去打一道几何题。
Erdős留下了超过 1000 道未解题。这周又解了 1 道。
参考资料:
https://x.com/__alpoge__/status/2059298565093196012?s=20
https://x.com/_sholtodouglas/status/2059303540150137244?s=20
https://www-cdn.anthropic.com/files/4zrzovbb/website/ca35f196125c899a5ad11f011080202a652aef02.pdf
编辑:摩西
