Workflow
AI答IMO难题坦承“不会”,OpenAI:这就是自我意识
量子位·2025-08-01 09:05

大模型能力突破 - 模型在IMO第6题上得零分,但展现了“高智商的诚实”,能在缺乏有效证据时表示不确定[2][3] - 与过去产生“看起来完美,实则错误”的幻觉式答案不同,新一代大模型开始学会承认自己不会[6] - 模型从胡编乱造的幻觉式回答转向更可靠且具有“自我意识”的新阶段,能帮助其面对困难问题时承认无能为力而非生成错误方案[7][17] 团队成就与研发细节 - 三人团队仅用两个月时间就完成了获得IMO金牌的目标,远超最初认为2025年不太可能实现的预期[5][18][19][20] - 团队真正优先考虑通用技术,而非专门开发用于数学竞赛的系统[22] - 公司研究人员拥有很大自主权去做他们认为有影响力的研究[21] 核心团队成员背景 - Alex Wei本硕就读于哈佛大学,在加州大学伯克利分校获计算机科学博士学位,曾任职于谷歌、微软和Meta,并于2024年1月加入公司,曾是FAIR团队成员并参与开发人类级人工智能CICERO[23][25] - Sheryl Hsu毕业于斯坦福大学计算机科学专业,是斯坦福AI实验室中IRIS实验室的研究员,于2025年3月加入公司[23][27] - Noam Brown本科就读于罗格斯新泽西州立大学,在卡内基·梅隆大学获硕士和博士学位,曾任职于DeepMind和Meta,于2023年6月加入公司[23][29]