国思软件 - 字节推出形式化数学推理专用模型Seed Prover 1.5

　　近日，字节跳动 Seed 团队推出新一代形式化数学推理专用模型 Seed Prover 1.5 ，通过大规模的 Agentic RL 训练，其推理能力和推理效率取得显著进步。相比上一代模型，Seed Prover 1.5 在 16.5 小时内，针对 IMO 2025 的前 5 道题目生成了完整可编译验证的 Lean 证明代码，换算成绩为 35/42，达到此前 IMO 评分标准的金牌分数线。

　　针对北美本科级别数学竞赛 Putnam，Seed Prover 1.5 用时 9 小时，对 12 道 Putnam 2025 赛题中的 11 道生成了可编译验证的 Lean 代码。更系统的评估中，Seed Prover 1.5 表现出色：它在完整的 Putnam 历史评估集上解决了 88% 的问题，在代表硕士数学难度的 Fate-H 和代表博士生数学难度的 Fate-X 评估集上，分别解决了 80% 和 33% 的问题，刷新了形式化数学推理模型在这几个评测集上的 SOTA 表现。

　　Seed Prover 1.5 在多个评估集上与此前其他 SOTA 方法的比较

　　Seed Prover 1.5 的技术报告已对外公开。后续将开放 API，邀请感兴趣的数学和 AI 研究者体验该模型。

字节推出形式化数学推理专用模型Seed Prover 1.5

我们的产品

相关链接

关于我们

联系我们