AI辅助数学研究 - 财报，业绩电话会，研报，新闻

AI辅助数学研究

搜索文档

量子位· 2025-11-04 08:22

核心观点 - AI在数学研究中的角色实现从“解题工具”到“科研协作伙伴”的升级，清华大学团队通过人机协同模式成功解决均匀化理论难题，形成约17页数学证明 [1][2][3] - 该研究验证了“人类分析+AI推导”协同范式的可行性，为攻克复杂数学问题提供了新路径，使AI踏入“原创科研”核心地带 [2][3][5] 研究背景与目标 - 当前主流AI系统在数学研究中存在局限，如FunSearch、AlphaEvolve依赖程序化表述，AlphaGeometry系列聚焦几何推理，难以覆盖广泛数学分支，且完整证明构建仍需依赖人类 [4] - 研究核心目标是打破AI在数学研究中的困境，通过人机协同实现能力互补，共同攻克单一主体难以突破的复杂数学难题 [5] 具体研究问题与成果 - 研究聚焦均匀化理论问题，具体为推导周期性分布的流体夹杂尺度趋近于零时耦合Stokes-Lamé系统的极限均匀化方程，并严格证明原解与极限解的误差估计 [6][7] - 团队通过人机协同不仅得出极限方程，更精确证明了误差阶数α=1/2，形成约17页数学证明，AIM系统在最困难的子问题证明中作出非平凡贡献 [8][12] 人机交互五大模式 - 直接提示：通过定理提示、概念引导、细节优化，引导AIM聚焦核心推理路径，减少无效探索 [13][14] - 理论协同应用：将完整数学理论体系打包为“知识包”提供给AIM，使其在预设框架内开展多步骤连贯推导 [16][17] - 交互式迭代优化：遵循“AI输出→人类诊断→反馈修正→AI再推理”循环，逐步完善证明链条 [18][19] - 明确运用边界：针对AIM当前难以胜任的任务由人类主导完成，避免资源浪费 [20][21] - 辅助优化策略：通过多轮尝试筛选最优证明、提供目标结论约束推理方向、根据任务选择适配模型，提升AI输出可靠性与效率 [22] 研究价值与突破 - 验证人机协同数学研究范式，将AI推理能力与人类知识经验系统性融合，拓宽数学工作者能力边界 [27][28] - 攻克均匀化理论难题，证明内容很大程度上由AI生成，体现了人机协同在解决研究级数学问题方面的潜力 [29] - 系统梳理交互模式，提炼具有实证价值的见解，为未来AI辅助数学研究框架设计提供参考，加速AI与数学科研融合落地 [30] 未来研究方向 - 深化并系统化人机交互模式，研究现有模式能否迁移到其他数学领域，并针对特定需求设计更丰富高效的交互模式 [32][33] - 基于交互反馈优化AIM系统，以实现数学定理证明自动化为长期目标，依据实验积累的见解提升模型推理能力 [34][35][36]

陶哲轩用GPT5-Pro跨界挑战，3年无解的难题，11分钟出完整证明

36氪· 2025-10-11 09:23

AI在数学研究中的应用进展 - 陶哲轩与GPT-5 Pro合作解决了一个微分几何领域悬置3年的开放问题，该问题涉及三维光滑拓扑球面在主曲率绝对值不超过1的条件下所围体积的最小值问题[1][3] - GPT-5 Pro在11分18秒内完成了复杂计算并提供了完整证明，运用了Stokes定理、Willmore不等式和Minkowski第一积分公式等工具[5] - AI在验证证明步骤时提供了两种不同证明路径：基于散度定理的方法和基于流方法的新思路[7] AI辅助研究的效果评估 - 陶哲轩将AI的价值分为三个尺度：小尺度上表现良好，贡献了有用想法且只犯小错误；中尺度上略显无益，强化了错误直觉；大尺度上间接有帮助，能快速验证并放弃不适用方法[11][12][14] - 在数值搜索任务中，AI工具可节省大量时间，通过逐步对话执行启发式计算并找到可行参数选择[29] - 与GPT-4相比，GPT-5 Pro在解决复杂数学问题方面有显著进步，但仍有局限性，特别是在复杂分析问题上缺乏关键概念思想[27] AI工具的发展历程 - 从ChatGPT早期只能提供表面合理但缺乏实质深度的回答，到GPT-4已能处理统计数据并在几分钟内完成人类一天的工作量[21][22] - GPT-4在熟悉领域数学问题中能提出八种不同解决方法，其中生成函数法被证明比传统渐近分析方法更有效[23][25] - GPT-o1解决了前代的幻觉问题，在形式化任务中作用显著，被评价为"平庸但并非完全无能"的数学研究生水平[27] 人机协作模式优化 - 最优自动化水平严格介于0%和100%之间，需要足够自动化减少重复工作，同时保持"人在回路中"审查局部问题[18] - 减少AI幻觉的有效方法包括在计算任务每一步详细解释、对话中先确认再执行、对话后使用Python进行外部验证[29] - AI最合理的角色是数学家的"副驾驶"或助理，而非取代人类在创造性、直觉性和策略性方面的工作[31]