可验证的超级智能

搜索文档
陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了
36氪· 2025-09-14 05:16
核心观点 - 人工智能公司Math开发的AI智能体Gauss在数学形式化验证领域取得重大突破 仅用三周时间完成陶哲轩等数学家18个月未能解决的强素数定理形式化挑战 展示出AI在复杂数学问题求解上的巨大潜力 [1][2][4][6] 技术突破 - Gauss作为首个协助顶级数学家进行形式验证的自动形式化Agent 能够将人类数学内容转换为机器可读的形式语言并验证正确性 [4][5] - 该智能体生成约25000行Lean代码 包含上千个定理和定义 这种规模的形式化证明传统上需要多年时间完成 [7] - 项目突破复分析核心难题 Gauss作为硅基生命可持续工作 极大压缩顶尖形式化专家的工作量 [6] 性能表现 - 相比历史上最大的单个形式化项目(最多50万行代码) Gauss的产出规模达到同数量级 [7] - Lean标准数学库Mathlib包含200万行代码和35万个定理 由600多位贡献者耗时8年完成 而Gauss三周的产出效率显著超越人类团队 [7] - 团队计划在未来12个月内将形式化代码总量提升100到1000倍 目标实现"可验证的超级智能"和"通才型机器数学家" [9] 基础设施 - 为支撑Gauss运行 团队与Morph Labs合作开发Trinity环境基础设施 [8] - 系统涉及数千个并发Agent 每个Agent拥有独立Lean运行环境 消耗数TB集群内存 属于复杂系统工程挑战 [8] 团队背景 - Math公司创始人Christian Szegedy为ICML'25时间检验奖得主 其2015年提出的Batch Normalization技术引用量超过6万次 是深度学习领域的里程碑突破 [13][15][17] 行业影响 - AI工具采用与人类截然不同的方法 可能专注于明确目标而忽略隐含目标 这要求项目组织者需要更明确阐述所有目标 [10][11] - 陶哲轩指出随着强大AI工具出现 需要重新评估形式化项目的多重目标 包括知识传承、社区建设等隐含价值 [10][11]