Workflow
谷歌Gemini IMO和ICPC夺金功臣之一被xAI挖走,马斯克直呼:起飞
机器之心·2025-09-21 05:26

行业人才流动趋势 - 特斯拉Optimus AI团队负责人Ashish Kumar被Meta挖走 [2] - 谷歌DeepMind资深研究科学家Dustin Tran被xAI挖走 [2][5] - 马斯克在社交媒体公开祝贺新成员加入并用火箭符号表示"起飞啦" [3] 核心人才背景与贡献 - Dustin Tran在谷歌DeepMind工作近9年 离职前担任资深首席研究员 [5] - 是谷歌Gemini-0801共同创造者 该模型是谷歌首个在LMSYS登顶的模型 [5] - 作为Gemini 2.5系列模型评测专家 在WebDev Arena和HLE等榜单取得第一名 [5] - 参与Gemini 1/1.5/2/2.5核心开发 涵盖强化学习、评测与数据等基础环节 [5] - 主导Gemini后训练评测 在100天内完成追赶并成功发布 带领团队登顶LMArena并保持一年多 [7] - 参与Gemini推理突破性创新 在IMO与ICPC中夺得金牌 [7] 技术发展历程 - 从LaMDA模型进化到通过RLHF生成长篇有内容回答的聊天机器人 [9] - 通过长链思维训练和全新环境推动推理与深度思考能力 [9] - 初期外界舆论普遍不看好 认为谷歌会因搜索历史包袱和组织政治而失败 [9] - 最终Gemini在用户偏好上稳定占据第一并引领科学突破 [10] 行业竞争格局 - OpenAI曾通过抢先宣布消息方式抢占AI舆论周期 [10] - 目前认为OpenAI的想法储备已经见底 [10] - xAI认为算力、数据及约100位聪明勤奋人员足以训练前沿大语言模型 [12] - xAI人均芯片拥有量超过谷歌 即将投入10万块GB200与30万块芯片 [12] - Grok 4在强化学习和后训练规模化方面做出最大押注 [12] 技术性能表现 - Grok 4 Fast在LMArena排名第8 而Gemini 2.5 Flash仅排第18 [12] - 在AIME等核心推理评测中表现与Grok 4相当 但成本降低15倍 [12] - 根据评测数据 Grok-4-fast得分为1421分 Grok-4-0709得分为1420分 [13] - 模型排名显示OpenAI的gpt-4.5-preview以1441分位居榜首 [13]