国思软件 - 陶哲轩盖章！GPT-5.2杀疯了，我们终将沦为「硅基帕鲁」

　　新智元报道

　　编辑：倾倾

　　币圈玩家 Neel Somani 带着 GPT-5.2 暴力踹开了数学圣殿的大门。陶哲轩亲自盖章确认，但这并非「AI 成神」，而是一场成功率仅1% 的算力挖矿。当数学证明变成工业流水线，我们失去的不仅是天才，还有对真理的最后一点敬畏。

　　总统先生，数学界的第四座塔倒了！

　　昨晚，这张总统耳语的 Meme 图，在美国学术圈引发了核爆级的讨论。

　　Paul Erdos 留下的第 281 号难题，被一个「门外汉」用 AI 暴力破解了。

　　人类最严肃的智力高地，沦为一张 Meme 图的注脚。旧世界的规则，崩塌了。

　　第一现场：被 GPT-5.2 攻破的百年难题

　　这不仅是破解，更是「入侵」。

　　一个手持 H100 算力集群的「野蛮人」，一脚踹开了象牙塔的大门。

　　光看 Neel Somani 的履历表，就足以让传统数学家感到信仰崩塌：

前 Citadel 量化研究员（以高频交易著称的华尔街巨头）；
前 Eclipse 创始人（Solana 生态的高性能区块链项目）；
现役 AI 与区块链交叉领域的探索者。

　　他来自 Eclipse，混迹于加密货币与区块链的丛林。在他的世界里，算力即权力，共识即真理。

　　2026 年 1 月，他带着硅谷的算力崇拜，横冲直撞地闯入了数学界——通过投资或协作的方式，推动了 ErdosProblems.com 平台，把 Paul Erdős留下的的数学悬赏，变成了一场公开的「猎杀游戏」。

　　他的武器不是天才的大脑，而是 GPT-5.2Pro。

　　Somani 的逻辑简单粗暴：既然数学证明可以被形式化，那它本质上和比特币挖矿没有任何区别。

　　只要显卡够多，只要 AI 试错速度够快，我就能通过穷举撞开真理的大门。

　　结果呢？他赌赢了。

　　就在几天前，作为这个收割月的重磅，GPT-5.2 成功攻克了 Erdős Problem#281。

　　Erdős Problem#281，源自 1980 年 Erdős和 Graham 的工作，焦点是「覆盖系统」的极限行为：

　　给定一个无限递增的正整数序列n₁

　　这题卡了 46 年，牵扯到遍历理论、profinite 整数上的 Haar 测度等硬核工具。

　　Somani 的 GPT-5.2Pro 用遍历理论+点态遍历定理 +Dini 定理给出了证明，陶哲轩评价这个思路与已知的 Rogers/Davenport-Erdős证明相当不同。

　　X 上的网友也将其誉为「第一台真正达到博士级别的 AI」。

　　这已经是 2026 年 1 月第三个被 GPT-5.2Pro 击落的 Erdős问题了。

　　从圣诞节到现在，ErdosProblems.com 上已有 15 个问题从「open」转为「solved」，其中 11 个明确标注 AI 参与。

　　陶哲轩甚至开了个 wiki 页面，专门记录「AI 对 Erdős问题的贡献」。

　　https://github.com/teorth/erdosproblems/wiki/AI-contributions-to-Erd%C5%91s-problems?referrer=grok.com

　　数学界从「会不会来」直接跳到「来得有多快、会扫荡多少」的恐慌阶段。

　　Somani 用行动告诉世界：不需要理解数学之美，只要电费管够、GPU 跑满，就能收割数学界的「圣杯」。

　　但是，在这一片欢呼声中，如果你去翻看 Somani 公布的后台数据，就能发现这场「胜利」的底色，其实是一片尸横遍野的荒原。

　　数据库尸横遍野

　　Neel Somani 赢了，但赢得非常难看。

　　登陆 ErdosProblems.com，关掉「只显示成功」的滤镜，你会看到，后台躺着成千上万具「尸体」。

　　根据数据库后台的真实统计，GPT-5.2 Pro 对这类问题的一次性通过率，只有可怜的1% 到2%。

　　这意味着，为了那个登上头条的完美证明，AI 在后台进行了成百上千次的胡言乱语。

　　它会捏造不存在的引理，陷入逻辑死循环，甚至把数学证明写成一首打油诗。

　　如果只有一个 GPT-5.2，这堆垃圾早就把数学界淹没了。

　　所以，在这场游戏中，真正的 MVP 根本不是 GPT，而是一个被大众忽略的冷酷工具——「Aristotle」。

　　Aristotle 其实是 Harmonic 公司开发的专用工具，它把 GPT 输出的自然语言（经常是胡说八道）自动翻译并强制转换成 Lean 形式语言，然后交给 Lean 内核做严格验证。

　　相当于给 AI 配了一个「无限试错+零容忍 bug」的自动编译+单元测试系统。

　　没有它，GPT 的1% 到2% 成功率根本无法浮出水面。

　　现在的 AI 解题流程越来越标准化。GPT 疯狂猜→Aristotle 强制形式化+杀垃圾→Lean 验证通过→人类再读。

　　一次，两次，一万次。直到那个概率极低的「幸存者」出现，Aristotle 才会放行。

　　大众以为的「神迹」，其实是统计学必然。

　　陶哲轩在 Mastodon 上一针见血。他拒绝使用「Intelligence（智能）」，而是发明了一个新词：「Artificial General Cleverness（人工通用小聪明）」。

　　注意这个词：小聪明。

　　就像是一个从来不听课、也没看懂课本的差生，靠着疯狂的作弊和试错，硬生生蒙对了一道奥数题。

　　而这，正是 NeelSomani 想要的。对于「挖矿」的人来说，只要能挖出金子，谁在乎矿机懂不懂地质学？

　　最后的防线：人类只负责「提问」，不再负责「解答」

　　那么，人类数学家要失业了吗？

　　未必。但他们的工种，将发生一次彻底的变异。

　　在 Neel Somani 开启的这个暴力版本里，数学研究不再是属于艺术家的吟唱，而变成了属于建筑师的图纸。

　　以前，数学家需要亲自下矿井，一镐一镐地去挖掘真理。现在，GPT-5.2 接过了镐头。

　　人类唯一剩下的特权，也是最后的防线，叫做「定义问题」。

　　你需要告诉那个疯狂的 AI 矿工：去哪里挖？挖什么？以及最重要的——为什么值得挖？

　　这听起来像是升职了，从「矿工」变成了「包工头」。但这背后藏着一个巨大的隐忧：我们正在失去对「为什么」的掌控。

　　当 GPT-5.2 扔给你一个长达几千行的 Lean 证明代码时，Aristotle 会告诉你「这是对的」，但你可能根本读不懂中间发生了什么。

　　表面上，人类从「矿工」升职成了「包工头」。实际上，我们正在丧失对「为什么」的解释权。

　　数学曾是人类理解宇宙的语言，追求的是极致的优雅和简洁。

　　而在 AI 的统治下，数学可能变成一堆虽然正确、但毫无美感的、乱七八糟的「逻辑堆砌物」。

　　这或许就是陶哲轩所说的「小聪明」的代价。我们用算力换来了效率，却把理解这件事，外包给了机器。

　　当然，陶哲轩也反复强调，这些被 AI 快速解决的 Erdős问题多属于「最低垂的果实」——可以用标准工具、只是之前没人费心去组合的那一类。

　　真正最硬核的几十个（比如需要全新思想或新对象的）目前 AI 还远没有触及。

　　但问题在于：一旦算力×模型继续指数上升，昨天的「最硬核」可能就是明天的「最低垂果实」。这不是结束，而是加速。

　　那张 500 美元的支票，已经被 Neel Somani 的算法兑现了。

　　这笔钱很少，但代价昂贵。它兑现了天才的祛魅，瓦解了数学最后的神圣感。

　　真理不再是上帝的耳语，它只是服务器里风扇狂转后，吐出的一行代码。

　　从此，决定真理的不再是智商的高低，而是显卡的多少。

　　醒醒吧，大航海时代结束，工业革命开始了。

　　当年蒸汽机让肌肉贬值，电力让距离贬值，今天的 GPU 集群正在让「数学直觉的稀缺性」贬值。

　　下一个被收割的，可能不是 Erdős题，而是某个价值 5000 万美元的工业优化问题、或者卡了二十年的药物分子设计关键引理。

　　数学的象牙塔倒了——就像那张总统耳语的 Meme 图，下一个可能是你的行业。

　　参考资料：

　　https://the-decoder.com/gpt-5-2-pro-solves-another-erdos-problem-while-a-new-database-reveals-most-attempts-still-fail/

　　https://www.erdosproblems.com/forum/thread/281

　　https://x.com/neelsomani/status/2012695714187325745

　　https://mathstodon.xyz/@tao/115911902186528812

　　https://www.erdosproblems.com/forum/thread/281#post-3327

陶哲轩盖章！GPT-5.2杀疯了，我们终将沦为「硅基帕鲁」

我们的产品

相关链接

关于我们

联系我们