国思软件 - 我用ChatGPT做了一下姜萍的数学竞赛题，它懵了，我也懵了。

　　攀登者从来不畏成长。

　　文章来源｜数字生命卡兹克（ID：Rockhazix）

　　最近这个叫做姜萍的小姑娘火了。

　　不仅仅因为她进入了 2024 阿里巴巴全球数学竞赛决赛入围名单，而且，因为她是 17 岁、93 分、全球第 12 名。且是前三十名里唯一的女生。

　　更炸的一点是，是她的学校。

　　江苏省涟水中等专业学校。

　　嗯，中专。

　　她的上下左右，是北大、剑桥、清华、MIT、中科院等等等等。

　　这个江苏省涟水中等专业学校，就让人非常的出戏。

　　而且她读的还是，服装设计专业。

　　这一下子，给我人看的更麻了。

　　今年是阿里全球数学竞赛的第六届，而姜萍，也是有史以来，第一个冲进决赛的中专生。

　　互联网上铺天盖地，有太多太多关于她的讨论了。无论如何，在这里，先向小姑娘献上膝盖。希望她越走越远，去攀登自己理想的高峰。

　　同时也让我对另一个点很好奇，2024 阿里巴巴全球数学竞赛，这是个啥比赛。

　　于是我就去查了下资料和题。

　　才发现原来是马爸爸在 2018 年就发起的比赛，然后阿里巴巴公益、达摩院一起把它打造成为现在世界上规模最大的在线数学竞赛。

　　而且最好玩的是，今年的竞赛，有一个很创新的点，就是，支持 AI 队伍参赛。

　　然后有 563 支 AI 队伍冲了进去，但是无一入围。最高分才 34 分，跟人类第一 113 分差的挺远，跟姜萍的 93 分也有很大的距离。

　　看了一下 AI 组的榜单，第一名又是个高中生= =第二名还是个老熟人，特工宇宙。

　　不过他们都用了不少的工程化的手法。

　　我突然就对这个数学竞赛的题目感了兴趣，我就想看看，他有多难。

　　于是我就把试题翻了出来。

　　第 1 题：

　　看完这题，我就感觉，我刚才说话稍微是有些大声了。脑海里就在幻视这个小同学勇闯迷踪阵，有 6 个桩，小同学们迷失在迷踪中，回过神来发现怎么只有四个桩。不是问桩在哪个位置，而是问到底有几个小同学…

　　但是没关系，我有 AI，于是我没有加任何 Prompt 和 Agent，就这么直接把这张图扔给了 ChatGPT。

　　反正看着很厉害的一顿输出后，GG 了。答案是6，你整个 12，复制人是吧。

　　老师告诉我们，考试的时候不要在第一题浪费太多时间。那先冷静一下看第二题。

　　第 2 题：

　　我：好啊！这题我会，战机游戏！AABB 上上下下！完事。

　　至于 ChatGPT，他让我想起了那首歌，《都选C》。全错。。。答案是B和A。

　　人类与人工智能选择看第三题。。。

　　第 3 题：

　　我：这怎么还有立体效果。。。不是，那个Z，怎么镂空了？数学卷子上都开始用 windows 艺术字了？通篇我就看到一个稠密，看的我脑子都稠密了。

　　ChatGPT：

　　小字写挺多，一堆我看不懂的玩意就往上招呼，我虽然看不懂公式，但是我好歹看得懂调不同，你这里面的公式，一个都跟答案里长得不一样啊我擦= =

　　第 4 题：

　　我：是谁？！是谁对我释放了大脑空空咒…

　　至于 ChatGPT... 算了，它认怂了。

　　第 5 题：

　　我：多年经验告诉我，字少事大。果然，定睛一看，那个R，又特么是艺术字！

　　ChatGPT：

　　不是，答案里面明明有很多长这样的小音符的。

　　那问题来了，ChatGPT，你的小音符呢？都没小音符，你也敢说你对了？

　　第 6 题：

　　我：好家伙终于有一个认识的了！五福我熟啊，每年的福卡我都集齐了！

　　ChatGPT：

　　勉强蒙对个1/2，但是过程全错= =真的纯靠蒙。第二题继续错。

　　终于，来到了最后一题。

　　第 7 题：

　　我：啊？

　　你特娘的给我出阅读理解呢？

　　你不是音乐吗，不是小红和小绿吗？不是一起去了树下吗，滑稽树下滑稽果，滑稽树下你和我？

　　至于 ChatGPT。。。

　　洗洗睡吧。。。

　　最终 ChatGPT 得分：0 分。

　　在看完了 7 道题之后，此时此刻我的脑海里只有一句话：

　　我是做啥的来着？

　　估计 ChatGPT 也很懵，不知道为啥我要这么折磨它。。

　　不得不说，能够参加这样的竞赛，能够在这样的竞赛中证明自己的，都是大神。

　　从上面我和 ChatGPT 一人一模型相互搀扶着踉踉跄跄走过来的经历看，现有的 AI 距离高等数学的推理学习，还有很长一段路要走。

　　但是这并不意味着大模型在数学领域就会被限制在中学水平。作为一种工具，它更多依靠的，是来自人类的训练。

　　就像今年 1 月登上 Nature 的炸裂级研究，谷歌 DeepMind 的 AlphaGeometry，在 30 题的范围内，能够答出 25 道国际数学奥林匹克几何题，人类金牌得主平均解决了 25.9 个问题。

　　这已经是人类的奥数金牌级水平了。

　　而这胜利背后，是 AlphaGeometry 的团队，构建了神经语言模型与符号演绎引擎这两个系统，尝试提高模型的推导能力。

　　这是 AlphaGeometry 的成就，这更是人类得天独厚的成就。

　　在具备丰富的情感与直觉感知的同时，去做出理性的决策与判断。

　　不过，这种东西，离我们普通人，肯定还是有非常远的距离，但是我们也有属于自己的小期待。

　　比如，GPT-5。

　　之前 Sam Altman 就放出话来，GPT-5 会在高级推理功能上实现重大突破。

　　我很相信 OpenAI，至少不会在 GPT 这个最核心的模型上，跟我们打嘴炮。

　　纵使现在的 AI 仍然需要成长，但是，攀登者从来不畏成长。

　　就像姜萍对数学的追求，就像之前我分享给大家的那些，因热爱而凌云登峰的可敬者们。

　　所以，最后的问题来了。

　　GPT-5，到底什么时候才能出来？

我用ChatGPT做了一下姜萍的数学竞赛题，它懵了，我也懵了。

我们的产品

相关链接

关于我们

联系我们