Gemma 2

搜索文档
Meta万引强化学习大佬跑路,用小扎原话作为离别寄语,扎心了
36氪· 2025-08-27 06:48
核心事件 - Meta强化学习研究员Rishabh Agarwal宣布离职 决定不加入公司新组建的超级智能实验室 选择尝试全新职业道路 [1] - 另一位在Meta工作12年的资深员工同期离职 加入竞争对手Anthropic的推理团队 [15] 人才背景 - Rishabh Agarwal为AI领域顶尖研究人员 拥有谷歌学术论文引用量10,392次 h-index指数达34 [5][6] - 曾获NeurIPS 2021杰出论文奖 论文主题为深度强化学习统计不稳定性分析 [3][11] - 职业生涯覆盖谷歌Brain、DeepMind及Meta 累计7.5年从业经验 [1][7][11] - 参与谷歌Gemini 1.5(引用2,508次)、Gemma 2(引用1,224次)等核心项目开发 [3][6][11] 技术贡献 - 在Meta期间主导推理模型后训练工作 包括使用强化学习规模化训练8B参数稠密模型 达到接近DeepSeek-R1性能水平 [13][16] - 开发训练中途引入合成数据技术 为强化学习提供热启动机制 [16] - 提出高效on-policy蒸馏方法 提升模型训练效率 [16] 行业影响 - Meta近期出现资深研究人员流失趋势 与公司招聘新人才导致的内部薪酬待遇差异有关 [17] - 人工智能领域高端人才竞争加剧 头部企业间人才流动频繁 [15][17]
小扎亲自出马挽留AI 大神,结果毒鸡汤把人劝跑了?
虎嗅· 2025-08-26 05:01
公司人才流动 - Meta研究科学家Rishabh Agarwal宣布离职 原计划加入公司新成立的Superintelligence TBD实验室但最终选择离开[2][3] - 离职原因包括追求不同类型的风险 并引用公司CEO关于"不冒险才是最大风险"的观点作为决策依据[4][24] - 该科学家拥有7.5年行业经验 曾任职于Google Brain、DeepMind和Meta等头部AI研究机构[3][21][23] 公司招聘策略 - 公司采用激进招聘策略 向顶级研究员提供高达九位数美元薪酬 部分总薪酬达1亿美元[7] - 截至8月中旬成功从竞争对手招募超过50名AI人才 包括从OpenAI挖走20人 Google挖走13人 苹果3人 xAI 3人 Anthropic 2人[8] - 近期传闻公司已冻结AI部门招聘并全面缩减团队规模 重组为研究、训练、产品和基础设施四个核心团队[9][10] 人才背景与成就 - 离职科学家在强化学习领域具有深厚造诣 学术引用总数超过10,000次 h-index达34 i10-index达41[19] - 参与多项重要研究项目 包括Gemini 1.5(引用2,508次)和Gemma 2(引用1,224次)等突破性成果[18] - 技术贡献涵盖多模态理解、开放语言模型、可解释性神经网络及离线强化学习等热门方向[20] 公司组织调整 - AI业务重组后大部分团队负责人将直接向Alexandr Wang汇报[10] - 此前负责Llama大模型的AGI基金会团队在重组中被正式解散[10] - 公司新成立的Superintelligence TBD实验室面临人才流失挑战[3][9]
Meta万引强化学习大佬跑路!用小扎原话作为离别寄语,扎心了
量子位· 2025-08-26 04:36
核心人才流失 - Meta强化学习专家Rishabh Agarwal离职 其曾参与Gemini 1[4]5和Gemma 2等核心项目开发 论文总引用量达10[6]392次 h-index为34[6] 2021年获得NeurIPS杰出论文奖[4][14] - 另一名任职12年的Meta资深员工同期离职并加入竞争对手Anthropic推理团队[18][19] - 离职潮可能与新老员工薪酬待遇悬殊引发的内部矛盾相关 部分研究人员曾威胁辞职[23][24] 技术贡献与行业影响 - Rishabh Agarwal在Meta期间主导推理模型后训练工作 具体包括采用RL规模化训练将8B稠密模型性能提升至接近DeepSeek-R1水平 在训练中引入合成数据实现RL热启动 提出高效on-policy蒸馏方法[16][20] - 其2021年发表的深度强化学习统计不稳定性论文成为评估RL算法的里程碑工作[14] - 曾作为核心贡献者参与谷歌Gemini 1[4]5(上下文突破100万token)和Gemma 2(轻量级开源模型)开发[4][13] 人才流动趋势 - Meta近期组建超级智能实验室并大量引进人才 但同期出现资深技术骨干流失现象[1][22] - 高端AI人才更倾向选择创业或探索非传统技术路径 Rishabh Agarwal明确表示拒绝加入Meta新实验室并寻求"完全不同道路"[1][17] - 行业顶尖人才普遍具备跨机构任职背景 Rishabh Agarwal曾同时任职谷歌Brain[6]DeepMind[6]Meta[1]并兼任麦吉尔大学教授[13]