国思软件 - 断网解题，Claude Mythos推翻Erdős 80年猜想！比OpenAI更短更漂亮

　　新智元报道

　　OpenAI 用 125 页思维链踹开 Erdős 80 年猜想的门，Mythos 如今找到了一条更短更优雅的路。最离谱的是，它拿到第一个可行解就停手了——面对名满天下的开放问题，AI 也会紧张。

　　AI 做数学这件事，速度已经彻底「失控」了！

　　OpenAI 前脚刚推翻了一个悬了 80 年的数学猜想，Anthropic 后脚就亮出证明。同一周，DeepMind 还一口气啃下了 9 道同类难题。

　　就在刚刚，Anthropic 研究员 Levent Alpoge 在上甩出十条推文：

　　OpenAI 花了 125 页才解开，他周末拿 Mythos 随手一试。

　　不仅分分钟搞定，而且路径还更短更简洁！

　　断网隔离，Mythos 开测

　　这位 Levent Alpoge 来头可不小。

　　1992 年出生，哈佛本科 4.0 满分、剑桥 Part III、普林斯顿博士（导师是菲尔兹奖得主 Manjul Bhargava），2015 年拿了 Morgan Prize（美国本科生数学研究最高奖），哈佛 Junior Fellow，并且解决了希尔伯特第十问题在所有数域上的推广。

　　2023 年 GPT-4 发布，他立刻被击中了。

　　对我来说，它瞬间成了人类有史以来创造的最有趣的东西。回到 CS！

　　紧接着，他便加入了 Anthropic。

　　这周 OpenAI 破解 Erdős难题之后，Levent 做了一件「显而易见的事」——让 Mythos 也试试。

　　为了确保公平，测试条件很严格。

　　多个 Claude Code 实例各自独立工作，全程断网，杜绝从 OpenAI 公开解法里「抄作业」的可能。

　　结果，模型不止一次找到了和 OpenAI 类似的解法，但它更偏爱另一条完全不同但更加简洁的路。

　　更有意思的是，模型明明已经找到了一个能推翻猜想的方案，却在第一个可行答案上就停了下来。

　　明明往前再走一步，就能拿到更强的结果。但 Mythos 太紧张了！

　　面对这道名满天下的开放问题，它不敢相信自己的结论，保守地停在了第一个可行方案上。

　　看到这，Levent 直接乐了：「这种感觉，所有数学家都懂！」

　　目前，Opus 4.7 已完成了证明全文的整理排版：

　　https://www-cdn.anthropic.com/files/4zrzovbb/website/ca35f196125c899a5ad11f011080202a652aef02.pdf

　　80 年没人赢过的赌注

　　时间拨回 1946 年。

　　匈牙利数学家 Paul Erdős提了一个听起来极简单的问题，在平面上撒n个点，最多能有多少对点之间的距离恰好是1？

　　举个例子，你在桌上摆 100 枚硬币，每两枚硬币圆心之间如果刚好隔一个硬币直径，就算一对「单位距离」。100 枚硬币最多能凑出多少对？

　　Erdős自己给了一个答案：把点排成方格网格，经过适当缩放后，单位距离对的数量大约是n^(1+c/log log n)。

　　也就是，100 枚硬币大概能凑出 100 多一丢丢对。

　　然后他下了赌注，这就是极限了，没人能做得更好。

　　之所以这么自信，因为这里有个关键瓶颈——高斯整数Z[i]。

　　Erdős的方格网格依赖这个数系，而一个固定范数在Z[i]里能分解出多少种方式，取决于除数函数，上限大约是 exp (O(log n / log log n))。

　　这就是那个「多出一丁点」的天花板。

　　80 年来，所有人都在这个框架里打转。

　　数论重武器，降维打击几何学

　　对于人类数学家来说，代代相传的直觉是「答案要在高斯整数Z[i]里找」。

　　Mythos 没读过这个传统，一上来就把Z[i]换成了次数远比 2 大的数域K的整数环O_K。

　　听起来像「用大炮打蚊子」，但就是这种跨学科的暴力，撬开了 80 年的僵局。

　　方法是，先利用 Golod-Shafarevich 判则，在一个二次域上面搭一座无限高的「数域塔」K₀ ⊂ K₁ ⊂ K₂ ⊂……

　　然后对每一层K_n取一个四次根扩张F_n = K_n(D^{1/4})，次数为d_n。

　　这座塔之所以管用，靠的是一个关键性质：

　　不管塔造多高，数域的「复杂度密度」始终有界，结构始终可控。一旦参数够大，几何计数就能启动。

　　接下来是整个证明的核心。

　　在 Erdős的Z[i]里，单位群只有{±1, ±i}四个元素。能往外伸的「单位距离方向」就这么几个，直接被除数函数死死卡住。

　　但在高维数域里，单位群的秩随维度增长，van der Corput 定理直接把秩转化成方向数。

　　如此一来，4 个方向就变成随维度爆炸式增长。

　　这段看不懂没关系，记住一件事就行——

　　Erdős被困在一个只有 4 个出口的房间里，Mythos 把墙拆了。

　　接下来是具体的构造。

　　首先，选一个实嵌入把这些数投射到平面上，就得到了点集P。

　　然后，取一个单位向量平移这些点，新旧两点之间的距离恰好是1。

　　因为方向数增长极快，满足条件的点对数量远超 Erdős的上限。

　　两者相乘，就得到了多项式增益。

　　更直觉地说：

　　单位距离方向数增长为 exp (Ω(d log log d))，而所有其他损耗全是 exp (O(d))量级。d log log d 碾压d。

　　Erdős的猜想，就这样被推翻了。

　　整个论证没有任何解析上的复杂性。和 OpenAI 那条 125 页路径相比，简洁得多。

　　用 Levent 自己的话说：

　　高层来看，这本质上还是 Erdős原始构造加上一座类域塔。

　　只不过这里做的是字面意义上最蠢的事——把大小不超过半径一半的点加到大小不超过半径一半的单位上。

　　而它之所以管用，是因为类域塔的几何计数增长实在太快了。

　　一周三连，各自破城

　　过去这一周的时间线，信息密度高到离谱。

　　5 月 20 日 OpenAI 官宣，一个未公开名称的通用推理模型，自主反驳了 Erdős单位距离猜想。

　　同一天，普林斯顿教授 Will Sawin 在 arXiv 贴出手工改进版，把指数从6×10⁻³⁸干到了 0.014。10³⁵倍的差距。

　　Georgia Tech 数学家 Tom Trotter，Erdős本人的合作者感慨道：「如果 Erdős还活着，他一定会激动到发疯。」

　　5 月 21 日 DeepMind 上场，AlphaProof Nexus 一口气啃下 9 道 Erdős题，每道推理成本最多只需几百美元。

　　5 月 26 日，Anthropic 也宣布实现独立证明，路径比 OpenAI 的 125 页短得多。

　　三家路线完全不同，但结果都收敛到了同一个点。

　　从笑话到《数学年刊》

　　要知道，在七个月前 AI 做数学还是个笑话。

　　2025 年 10 月，OpenAI 时任 VP Kevin Weil 在上宣称 GPT-5 解决了 10 个 Erdős问题。

　　看到推文后，负责维护 erdosproblems.com 的数学家 Thomas Bloom 当场回怼「严重歪曲事实」，模型只是检索到了已知解法。Yann LeCun 和 Demis Hassabis 都跟着嘲讽了一波。

　　很快，Weil 就删了帖，并在四个月后离开了 OpenAI。

　　当时所有人的判断都一样：模型会做题，但不会做研究。

　　转眼到了今天。

　　Bloom 签了验证报告。Gowers 写下了「提交到《数学年刊》我会毫不犹豫推荐接受」的盛赞。Litt 说这是「AI 自主产出的第一个让我觉得本身就有意思的结果」。

　　甚至，Litt 还在 Nature 的采访中表示：「没有人类能像 LLM 那样吸收全部数学文献。AI 正在打破学科之间的壁垒。」

　　三年前 GPT-4 还做不了本科数学题。

　　如今，让最伟大的数学家都感到绝望的 Erdős问题，却正在变成 AI 的入学考试！

　　打破 80 年僵局的，是一个不知道「这题应该怎么想」的模型。

　　没有包袱，反而能从代数数论里借来重武器去打一道几何题。

　　Erdős留下了超过 1000 道未解题。这周又解了 1 道。

　　参考资料：

　　https://x.com/__alpoge__/status/2059298565093196012?s=20

　　https://x.com/_sholtodouglas/status/2059303540150137244?s=20

　　https://www-cdn.anthropic.com/files/4zrzovbb/website/ca35f196125c899a5ad11f011080202a652aef02.pdf

　　编辑：摩西

断网解题，Claude Mythos推翻Erdős 80年猜想！比OpenAI更短更漂亮

我们的产品

相关链接

关于我们

联系我们