可验证的超级智能 - 财报，业绩电话会，研报，新闻 - Reportify

可验证的超级智能

搜索文档

陶哲轩18个月没搞定的数学挑战，被这个“AI高斯”三周完成了

36氪· 2025-09-14 05:16

核心观点 - 人工智能公司Math开发的AI智能体Gauss在数学形式化验证领域取得重大突破仅用三周时间完成陶哲轩等数学家18个月未能解决的强素数定理形式化挑战展示出AI在复杂数学问题求解上的巨大潜力 [1][2][4][6] 技术突破 - Gauss作为首个协助顶级数学家进行形式验证的自动形式化Agent 能够将人类数学内容转换为机器可读的形式语言并验证正确性 [4][5] - 该智能体生成约25000行Lean代码包含上千个定理和定义这种规模的形式化证明传统上需要多年时间完成 [7] - 项目突破复分析核心难题 Gauss作为硅基生命可持续工作极大压缩顶尖形式化专家的工作量 [6] 性能表现 - 相比历史上最大的单个形式化项目（最多50万行代码） Gauss的产出规模达到同数量级 [7] - Lean标准数学库Mathlib包含200万行代码和35万个定理由600多位贡献者耗时8年完成而Gauss三周的产出效率显著超越人类团队 [7] - 团队计划在未来12个月内将形式化代码总量提升100到1000倍目标实现"可验证的超级智能"和"通才型机器数学家" [9] 基础设施 - 为支撑Gauss运行团队与Morph Labs合作开发Trinity环境基础设施 [8] - 系统涉及数千个并发Agent 每个Agent拥有独立Lean运行环境消耗数TB集群内存属于复杂系统工程挑战 [8] 团队背景 - Math公司创始人Christian Szegedy为ICML'25时间检验奖得主其2015年提出的Batch Normalization技术引用量超过6万次是深度学习领域的里程碑突破 [13][15][17] 行业影响 - AI工具采用与人类截然不同的方法可能专注于明确目标而忽略隐含目标这要求项目组织者需要更明确阐述所有目标 [10][11] - 陶哲轩指出随着强大AI工具出现需要重新评估形式化项目的多重目标包括知识传承、社区建设等隐含价值 [10][11]

自动形式化（autoformalization）

可验证的超级智能

通才型机器数学家

古德哈特定律

自动形式化（autoformalization）

可验证的超级智能

通才型机器数学家

古德哈特定律