Workflow
组合数学
icon
搜索文档
GPT-5通过“哥德尔测试”!独创性解决博士生都得花几天时间的开放数学问题
量子位· 2025-09-25 13:00
henry 发自 凹非寺 量子位 | 公众号 QbitAI GPT-5,你这家伙! 究竟还有什么事是我不知道的? 在一篇最新论文中,研究人员让它挑战了5个尚未解决的优化猜想。 结果它居然解出了其中3个! 更令人吃惊的是,其中有一道题,它甚至给出了与研究者预期完全不同的、同样有效的证明方案。 它可不是"笨蛋"研究生,而是能展现出独创性的"聪明"博士生。 前微软研究副总裁、现OpenAI科学家Sebastien Bubeck表示: 和国际数学奥林匹克(IMO)那些为"人类天才高中生"准备的题目不同,这次的测试题需要博士水平的研究者花上几天才能完成。 在论文里,研究者们还特意"挑衅" 陶哲轩 对大语言模型数学能力的印象—— 这意味着GPT-5能够解决一些真正的开放性数学问题。 接下来,就让我们看看,这位AI数学天才是怎么炼成的。 "哥德尔"测试 如上所述,GPT-5这次挑战的并不是奥赛题,而是高等数学里的简单猜想。 求解这类问题不仅需要算术能力,还需要相当强的数学背景和逻辑推理能力。 研究人员把他们的测试称为: 哥德尔测试 。 哥德尔测试里的问题需要人自己动脑、经过训练才能解决,而且在现有文献中找不到现成答案。 ( ...
速递|斯坦福90后中国数学博士的AI公司,未出产品先融资5000万美元,B Capital正洽谈领投
Z Potentials· 2025-06-04 02:42
数学AI初创公司Axiom - 斯坦福大学数学博士生Carina Hong创立Axiom 致力于开发基于形式化数学证明训练的AI 目标估值3亿至5亿美元 正筹集5000万美元资金 [2] - Axiom计划将产品出售给对冲基金和量化交易公司 帮助解决涉及资产价值和股票市场的复杂数学问题 [3] - 公司开发方向是利用编程语言训练机器掌握形式化证明语言 而非仅回答问题 [6] 数学AI行业动态 - OpenAI的o4-mini在FrontierMath评估中超越人类数学家团队 谷歌AI达到国际数学奥林匹克金牌水平 [4] - 主流AI模型如Anthropic OpenAI和谷歌在基础数学问题仍存在错误 但复杂查询处理展现潜力 [3] - 谷歌AI模型存在组合数学领域的短板 恰为Carina Hong的专长领域 [5] 竞争格局 - 类似数学AI初创公司Harmonic由Robinhood CEO创立 2023年以3 25亿美元估值融资7500万美元 [6] - 投资者对专业数学AI模型仍保持兴趣 尽管部分认为自主模型开发窗口期已过 [3] 创始人背景 - Carina Hong拥有MIT数学与物理学位 牛津大学深造经历 斯坦福在读 发表过组合数学领域论文 [3] - 曾指出主流AI模型数学表现优异可能源于训练数据包含考题 而非真正掌握证明能力 [6]