Workflow
GPT-5 Pro独立做数学研究!读论文后给出更精确边界,OpenAI总裁:这是生命迹象
量子位·2025-08-21 04:23

核心观点 - AI模型GPT-5 Pro在阅读数学论文后能够独立推导出新的数学结论,展示了自主探索能力 [1][2][8] - 在凸优化问题中,GPT-5 Pro改进了原有论文的边界阈值,将步长边界从1/L提升到1.5/L [26][27] - 虽然人类研究者后续更新论文反超了GPT-5 Pro的结果,但AI的证明思路完全不同,表明其具备独立研究能力 [7][8][41] - OpenAI总裁将这一成果称为"生命迹象",突显AI自主思考的突破性 [9] 技术细节 凸优化问题研究 - 研究核心是梯度下降算法优化光滑凸函数时,优化曲线(f(x_n)随迭代次数n变化的曲线)的凸性问题 [10][11] - 关键发现包括: - 步长η ∈ (0, 1/L]时优化曲线保证是凸的 [17] - 步长η ∈ (1.75/L, 2/L)时优化曲线可能非凸 [17] - 整个收敛区间η ∈ (0, 2/L]内梯度范数序列总是单调递减 [17] - 二阶可导凸函数的梯度流优化曲线总是凸的 [17] 证明方法 - 原论文通过构造辅助函数g_k(t)将离散迭代转化为连续积分,利用凸函数性质证明优化曲线凸性 [14] - 非凸可能区间的证明通过构造特定分段函数反例实现,选择初始点x_0 = -1.8进行验证 [19] - GPT-5 Pro的创新在于: - 运用Bregman散度不等式和共强制性不等式进行更精细的代数操作 [30][31] - 通过不等式技巧将边界从1/L提升到1.5/L,耗时17分半 [27][28] - 证明思路与人类研究者后续更新论文的方法完全不同 [41] 人类研究者的更新 - 后续论文更新证明了1.75/L是精确界限,闭合了之前未探索的区间 [37] - 方法是对三个点对分别建立Bregman散度不等式,加权求和后化简梯度项组合 [37] - 通过不等式组合证明了f(x_2)-f(x_1) ≥ f(x_1)-f(x_0)的关系 [38][39][40] 社会影响 - 该研究成果引发广泛关注,相关推文在半天内获得230多万次阅读 [3] - 虽然GPT-5 Pro的结果最终被人类反超,但其独立证明能力被视为重要突破 [8][41] - 这一进展展示了AI在数学研究领域的潜在应用价值 [1][9]