陶哲轩盖章!GPT-5.2杀疯了,我们终将沦为「硅基帕鲁」

  新智元报道

  编辑:倾倾

  币圈玩家 Neel Somani 带着 GPT-5.2 暴力踹开了数学圣殿的大门。陶哲轩亲自盖章确认,但这并非「AI 成神」,而是一场成功率仅1% 的算力挖矿。当数学证明变成工业流水线,我们失去的不仅是天才,还有对真理的最后一点敬畏。

  总统先生,数学界的第四座塔倒了!

  昨晚,这张总统耳语的 Meme 图,在美国学术圈引发了核爆级的讨论。

  Paul Erdos 留下的第 281 号难题,被一个「门外汉」用 AI 暴力破解了。

  人类最严肃的智力高地,沦为一张 Meme 图的注脚。旧世界的规则,崩塌了。

  第一现场:被 GPT-5.2 攻破的百年难题

  这不仅是破解,更是「入侵」。

  一个手持 H100 算力集群的「野蛮人」,一脚踹开了象牙塔的大门。

  光看 Neel Somani 的履历表,就足以让传统数学家感到信仰崩塌:

  • 前 Citadel 量化研究员(以高频交易著称的华尔街巨头);

  • 前 Eclipse 创始人(Solana 生态的高性能区块链项目);

  • 现役 AI 与区块链交叉领域的探索者。

  他来自 Eclipse,混迹于加密货币与区块链的丛林。在他的世界里,算力即权力,共识即真理。

  2026 年 1 月,他带着硅谷的算力崇拜,横冲直撞地闯入了数学界——通过投资或协作的方式,推动了 ErdosProblems.com 平台,把 Paul Erdős留下的的数学悬赏,变成了一场公开的「猎杀游戏」。

  他的武器不是天才的大脑,而是 GPT-5.2Pro。

  Somani 的逻辑简单粗暴:既然数学证明可以被形式化,那它本质上和比特币挖矿没有任何区别。

  只要显卡够多,只要 AI 试错速度够快,我就能通过穷举撞开真理的大门。

  结果呢?他赌赢了。

  就在几天前,作为这个收割月的重磅,GPT-5.2 成功攻克了 Erdős Problem#281。

  Erdős Problem#281,源自 1980 年 Erdős和 Graham 的工作,焦点是「覆盖系统」的极限行为:

  给定一个无限递增的正整数序列n₁

  这题卡了 46 年,牵扯到遍历理论、profinite 整数上的 Haar 测度等硬核工具。

  Somani 的 GPT-5.2Pro 用遍历理论+点态遍历定理 +Dini 定理给出了证明,陶哲轩评价这个思路与已知的 Rogers/Davenport-Erdős证明相当不同。

  X 上的网友也将其誉为「第一台真正达到博士级别的 AI」。

  这已经是 2026 年 1 月第三个被 GPT-5.2Pro 击落的 Erdős问题了。

  从圣诞节到现在,ErdosProblems.com 上已有 15 个问题从「open」转为「solved」,其中 11 个明确标注 AI 参与。

  陶哲轩甚至开了个 wiki 页面,专门记录「AI 对 Erdős问题的贡献」。

  https://github.com/teorth/erdosproblems/wiki/AI-contributions-to-Erd%C5%91s-problems?referrer=grok.com

  数学界从「会不会来」直接跳到「来得有多快、会扫荡多少」的恐慌阶段。

  Somani 用行动告诉世界:不需要理解数学之美,只要电费管够、GPU 跑满,就能收割数学界的「圣杯」。

  但是,在这一片欢呼声中,如果你去翻看 Somani 公布的后台数据,就能发现这场「胜利」的底色,其实是一片尸横遍野的荒原。

  数据库尸横遍野

  Neel Somani 赢了,但赢得非常难看。

  登陆 ErdosProblems.com,关掉「只显示成功」的滤镜,你会看到,后台躺着成千上万具「尸体」。

  根据数据库后台的真实统计,GPT-5.2 Pro 对这类问题的一次性通过率,只有可怜的1% 到2%。

  这意味着,为了那个登上头条的完美证明,AI 在后台进行了成百上千次的胡言乱语。

  它会捏造不存在的引理,陷入逻辑死循环,甚至把数学证明写成一首打油诗。

  如果只有一个 GPT-5.2,这堆垃圾早就把数学界淹没了。

  所以,在这场游戏中,真正的 MVP 根本不是 GPT,而是一个被大众忽略的冷酷工具——「Aristotle」。

  Aristotle 其实是 Harmonic 公司开发的专用工具,它把 GPT 输出的自然语言(经常是胡说八道)自动翻译并强制转换成 Lean 形式语言,然后交给 Lean 内核做严格验证。

  相当于给 AI 配了一个「无限试错+零容忍 bug」的自动编译+单元测试系统。

  没有它,GPT 的1% 到2% 成功率根本无法浮出水面。

  现在的 AI 解题流程越来越标准化。GPT 疯狂猜→Aristotle 强制形式化+杀垃圾→Lean 验证通过→人类再读。

  一次,两次,一万次。直到那个概率极低的「幸存者」出现,Aristotle 才会放行。

  大众以为的「神迹」,其实是统计学必然。

  陶哲轩在 Mastodon 上一针见血。他拒绝使用「Intelligence(智能)」,而是发明了一个新词:「Artificial General Cleverness(人工通用小聪明)」。

  注意这个词:小聪明。

  就像是一个从来不听课、也没看懂课本的差生,靠着疯狂的作弊和试错,硬生生蒙对了一道奥数题。

  而这,正是 NeelSomani 想要的。对于「挖矿」的人来说,只要能挖出金子,谁在乎矿机懂不懂地质学?

  最后的防线:人类只负责「提问」,不再负责「解答」

  那么,人类数学家要失业了吗?

  未必。但他们的工种,将发生一次彻底的变异。

  在 Neel Somani 开启的这个暴力版本里,数学研究不再是属于艺术家的吟唱,而变成了属于建筑师的图纸。

  以前,数学家需要亲自下矿井,一镐一镐地去挖掘真理。现在,GPT-5.2 接过了镐头。

  人类唯一剩下的特权,也是最后的防线,叫做「定义问题」。

  你需要告诉那个疯狂的 AI 矿工:去哪里挖?挖什么?以及最重要的——为什么值得挖?

  这听起来像是升职了,从「矿工」变成了「包工头」。但这背后藏着一个巨大的隐忧:我们正在失去对「为什么」的掌控。

  当 GPT-5.2 扔给你一个长达几千行的 Lean 证明代码时,Aristotle 会告诉你「这是对的」,但你可能根本读不懂中间发生了什么。

  表面上,人类从「矿工」升职成了「包工头」。实际上,我们正在丧失对「为什么」的解释权。

  数学曾是人类理解宇宙的语言,追求的是极致的优雅和简洁。

  而在 AI 的统治下,数学可能变成一堆虽然正确、但毫无美感的、乱七八糟的「逻辑堆砌物」。

  这或许就是陶哲轩所说的「小聪明」的代价。我们用算力换来了效率,却把理解这件事,外包给了机器。

  当然,陶哲轩也反复强调,这些被 AI 快速解决的 Erdős问题多属于「最低垂的果实」——可以用标准工具、只是之前没人费心去组合的那一类。

  真正最硬核的几十个(比如需要全新思想或新对象的)目前 AI 还远没有触及。

  但问题在于:一旦算力×模型继续指数上升,昨天的「最硬核」可能就是明天的「最低垂果实」。这不是结束,而是加速。

  那张 500 美元的支票,已经被 Neel Somani 的算法兑现了。

  这笔钱很少,但代价昂贵。它兑现了天才的祛魅,瓦解了数学最后的神圣感。

  真理不再是上帝的耳语,它只是服务器里风扇狂转后,吐出的一行代码。

  从此,决定真理的不再是智商的高低,而是显卡的多少。

  醒醒吧,大航海时代结束,工业革命开始了。

  当年蒸汽机让肌肉贬值,电力让距离贬值,今天的 GPU 集群正在让「数学直觉的稀缺性」贬值。

  下一个被收割的,可能不是 Erdős题,而是某个价值 5000 万美元的工业优化问题、或者卡了二十年的药物分子设计关键引理。

  数学的象牙塔倒了——就像那张总统耳语的 Meme 图,下一个可能是你的行业。

  参考资料:

  https://the-decoder.com/gpt-5-2-pro-solves-another-erdos-problem-while-a-new-database-reveals-most-attempts-still-fail/

  https://www.erdosproblems.com/forum/thread/281

  https://x.com/neelsomani/status/2012695714187325745

  https://mathstodon.xyz/@tao/115911902186528812

  https://www.erdosproblems.com/forum/thread/281#post-3327