人工智能推理能力

搜索文档
OpenAI在ICPC 2025编程赛上满分登顶,Gemini也达到金牌水平
36氪· 2025-09-18 09:50
AI在ICPC竞赛中的表现 - OpenAI在5小时内解决了全部12个问题,相当于人类排名第1位,超过所有参赛大学团队[1] - OpenAI对11个问题的首次提交便获得正确答案,最难问题经过9次尝试后成功攻克[7] - OpenAI由通用推理模型集成体构成,结合GPT-5和实验性推理模型,未针对竞赛专门优化[12] Gemini在竞赛中的表现 - Gemini解决了12个问题中的10个,总用时677分钟,达到金牌水平,相当于人类排名第2[3][20] - Gemini在45分钟内解决8个问题,三小时内又解决2个问题,使用高级数据结构和算法[20] - Gemini在半小时内成功解决C题,而该题在竞赛中没有任何大学队伍解出[23] 人类团队竞赛结果 - 俄罗斯圣彼得堡国立大学排名第1,解决了11个问题[4] - 北京交通大学、清华大学、北京大学、中国科学技术大学分别排名2、4、5、9[4] - 在139支参赛队伍中,只有前四支队伍获得金牌[6] 技术实现细节 - Gemini通过假设水库优先级值,应用动态规划算法和极小极大定理解决C题[27][28] - Gemini通过嵌套三分查找迅速找到最优优先级值[28] - OpenAI解题过程中完全自主分析问题并提交答案,无定制化测试工具辅助[6] 研究人员背景 - OpenAI研究员Borys Minaiev曾获ICPC世界总决赛冠军,专注于大规模推理模型开发[14] - OpenAI研究员Mostafa Rohaninejad专注于元学习和强化学习,参与GPT-5开发[17][19] - Google DeepMind的Hanzhao Lin领导Gemini竞赛编程技术方向,Heng-Tze Cheng共同领导研究工作[28][31][33] 行业意义 - AI在ICPC中获得金牌级成绩,展示其在创新性解决方案方面的独特优势[35] - AI正从信息处理工具转变为解决复杂推理问题的关键力量[35] - 同一组模型已在IMO和IOI等竞赛中证明其实力和通用性[12]