字节跳动Seed团队推出形式化数学推理专用模型Seed Prover 1.5
智通财经网·2025-12-24 06:16

公司技术发布 - 字节跳动Seed团队于12月24日宣布推出形式化数学推理专用模型Seed Prover 1.5 [1] - 该模型通过大规模的Agentic RL训练,在推理能力和推理效率上宣称取得显著进步 [1] - 公司已对外公开Seed Prover 1.5的技术报告,后续将开放API供数学和AI研究者体验 [1] 模型性能表现 - 在IMO 2025前5道题目上,模型在16.5小时内生成完整可编译验证的Lean证明代码,换算成绩为35/42,达到金牌分数线 [1] - 针对Putnam 2025赛题,模型用时9小时,对12道题中的11道生成了可编译验证的Lean代码 [1] - 在完整的Putnam历史评估集上,模型解决了88%的问题 [1] - 在代表硕士数学难度的Fate-H评估集上,模型解决了80%的问题 [1] - 在代表博士生数学难度的Fate-X评估集上,模型解决了33%的问题 [1] - 模型在上述评测集上刷新了形式化数学推理模型的SOTA表现 [1]