
赛事概况 - 谷歌旗下Kaggle平台举办首届全球AI国际象棋争霸赛 旨在通过游戏竞技评估通用大模型智能水平[1][3] - 参赛模型包括8款顶级语言模型:闭源阵营为Gemini 2.5 Pro、OpenAI o4-mini、Grok 4、OpenAI o3、Claude 4 Opus、Gemini 2.5 Flash 开源阵营为DeepSeek R1和Kimi K2 Instruct[1] - 比赛采用单败淘汰制 首日进行8进4淘汰赛 胜者以4-0全胜战绩晋级半决赛[2] 首轮赛果 - OpenAI o4-mini以4-0击败DeepSeek R1 后者在脱离开局模板后出现瞄准不存在棋子、防守无威胁空格等严重认知错误[11][13] - OpenAI o3因对手Kimi K2连续4局非法走子自动晋级 最短对局不足8回合 Kimi K2在脱离套路后出现棋盘误读[9][10] - Gemini 2.5 Pro以4-0淘汰Claude 4 Opus 后者在第十回合主动敞开防线送出突破口 成为首轮最接近真实对抗的对局[14][15][16] - Grok 4以4-0碾压Gemini 2.5 Flash 被业内评为开赛最佳表现 其精准识别弱点能力获马斯克在X平台转发[17][20] 赛事价值 - 游戏竞技具备无限扩展性和思维可视化优势 可完整追踪模型决策链并评估策略推理能力[3] - 明确输赢信号为AI智能评估提供理想试验场 尤其考验复杂推理任务中的长期规划与动态适应能力[21] - 真实评分标准基于数百场未公开对局 本次公开赛仅为测试通用智能的开局小规模测试[22] 赛程安排 - 半决赛对阵为OpenAI o3-mini对战同门o3 Gemini 2.5 Pro对战Grok 4[3] - 半决赛将于太平洋时间次日上午10:30举行[5]