达到金牌分数线:字节跳动推出新一代数学推理专用模型Seed Prover 1.5
凤凰网·2025-12-24 04:34

公司技术进展 - 字节跳动Seed团队推出新一代形式化数学推理模型Seed Prover 1.5 [1] - 该模型基于大规模智能体强化学习训练,在数学竞赛题的形式化证明能力上有所提升 [1] 模型性能表现 - 在IMO 2025的前5道题目上,模型于16.5小时内生成了完整可编译验证的Lean证明代码,换算成绩达到此前金牌分数线 [1] - 在Putnam 2025的12道赛题中,模型用时9小时对其中11道生成了可验证代码 [1] - 在Putnam历史评估集上,该模型解决了88%的问题 [1] 当前能力与未来计划 - 当前模型仍主要面向“规则清晰、背景封闭”的竞赛题目,与前沿数学研究所需的长链条、文献依赖推理尚有距离 [1] - 技术报告已公开,后续将开放API供研究者体验 [1]