核心事件 - AI数学家“亚里士多德”在6小时内,100%独立破解了30年未解的埃尔德什问题124的简化版本,验证仅需1分钟,全程无人类辅助,被形容为数学界的“登月”时刻 [1][2][4] - 该AI由HarmonicMath公司开发,结合了强化学习、蒙特卡洛树搜索和Lean形式化语言,通过搜索上亿种证明策略输出可验证定理 [11][13] - 菲尔兹奖得主陶哲轩高度赞扬了这一成就,并指出数学界正迎来“vibe证明”的时代 [4][5][6] 技术突破细节 - 解决的问题是埃尔德什问题列表中的第124号问题,该问题在论文“Complete sequences of sets of integer powers”中提出,核心是探究在极端约束下是否总能用“二进制”表示任意大数 [7][9] - AI“亚里士多德”输出的定理形式化为:theorem erdos_124 : ∀ k, ∀ d : Fin k → ℕ, (∀ i, 2 ≤ d i) → 1 ≤ ∑ i : Fin k, (1 : ℚ) / (d i - 1) → ∀ n, ∃ a : Fin k → ℕ, ∀ i, ((d i).digits (a i)).toFinset ⊆ {0, 1} ∧ n = ∑ i, a i [13] - 目前解决的是该问题两个版本中较为简单的一个,完整版本更具难度 [14][22] 行业影响与趋势 - 陶哲轩指出,数学未解问题服从“长尾分布”,AI自动化正在收割长尾末端的“低垂果实”,即大量相对容易但因关注度低而未解决的问题 [16][18] - 近期,埃尔德什问题网站的“未解”标签下减少了近十个问题,均因AI辅助的文献搜索发现已被解决,人类数学家也正结合AI工具和形式化证明助手进行研究 [20] - AI自动化工具能先清理容易的问题,将真正困难的部分剥离出来,使人类数学家能更专注于值得投入的难题 [23] 竞品对比 - 根据陶哲轩的点评,Gemini和ChatGPT的深度研究工具均未能针对该问题找到新的、有价值的文献 [15] - Gemini仅给出了一个简单的观察,并将其与一些平行研究联系起来,但未找到直接相关的新文献 [15] - ChatGPT大量依赖现有网页作为权威来源,未能提供新信息,尽管其生成的总结可能有趣 [15] 应用案例与前景 - 陶哲轩以“Equational Theories Project”为例,该项目涉及普遍代数中2200万条可能的蕴涵关系,通过采用自动化方法在几天内解决了大部分,仅剩的顽固难点最终由人类数学家花费数月攻克 [18] - AI发现另一类“低垂果实”是因描述存在技术性瑕疵而意外变得好解决的问题,E124的简化版本即属此类,其因遗漏关键假设而成为已有判据的直接推论,这一漏洞由AI自主发现并证明 [21][22][23] - 埃尔德什问题网站收录了1108个问题,其中包含大量不起眼、几乎无人关注的问题,为AI自动化攻克提供了广阔空间 [20]
30年数学难题,AI仅6小时告破,陶哲轩:ChatGPT们都失败了
36氪·2025-12-01 08:56