腾讯调整大模型组织架构:姚顺雨加盟,向总裁刘炽平汇报

腾讯AI组织架构与人才引进 - 腾讯内部官宣大模型研发组织架构调整,新成立AI Infra部、AI Data部、数据计算平台部,以全面强化大模型研发体系与核心能力 [6] - 姚顺雨加盟腾讯,出任“CEO/总裁办公室”首席AI科学家,向总裁刘炽平汇报,同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报 [4][7] - AI Infra部将负责大模型训练和推理平台技术能力建设,聚焦分布式训练、高性能推理等核心技术 [8] - AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的数据智能融合平台建设 [8] - 此次架构升级旨在强化工程化优势,提升AI大模型研究能力,聚焦公司AI战略布局,提升研发效率 [8] 姚顺雨背景与成就 - 姚顺雨是前OpenAI研究员,拥有清华大学姚班背景和普林斯顿大学计算机博士学位,是NOI奥赛银牌得主和安徽省高考探花 [2][16] - 他是Tree of Thoughts(思维树)、ReAct等知名研究的作者,也是SWE-bench、SWE-agent等一系列研究的核心贡献者 [3][27] - 博士期间师从GPT-1第二作者Karthik Narasimhan,从事智能体方向研究,毕业后加入OpenAI [18] - 其研究工作贯穿Agent研究关键节点,包括提出CALM、WebShop等 [19] 姚顺雨的AI发展观点 - 姚顺雨在2024年8月发表博文《The Second Half》,提出AI正处在“中场休息”阶段 [21] - 他认为AI上半场以模型和方法为中心,核心是“把模型训出来”;下半场重心将转向任务定义、系统构建与评估体系 [22] - 关键问题从“能否训练模型解决XX”转向“什么问题值得被解决”以及“如何判断AI是否真的进步”,评估成为决定方向的前置条件 [23] - 真正重要的不是继续堆模型规模,而是让模型在真实任务和系统中经得起检验 [24] - 他认为Agent的本质不是“会用工具”,而是“能推理并泛化” [26] - 创业公司的最大机会不在模型,而在交互方式 [28] 腾讯AI产品与业务进展 - 过去一年,腾讯混元大模型发布了超过30个新模型 [9] - 2024年12月5日发布的混元2.0显著改进了预训练数据和强化学习策略,在复杂推理与文本生成场景表现国内领先 [9] - 混元3D模型保持全球领先水准,开源社区下载量超过300万 [9] - 腾讯元宝AI应用用户规模稳居国内前三,成为最受新中产欢迎的AI原生应用,上线初期保持每天一个版本的迭代频率 [10] - 腾讯将元宝的AI能力融入微信、QQ、音乐、会议等国民级产品中 [10] - 腾讯混元大模型已在内部超过900款应用和场景中落地,包括腾讯会议、微信、广告、游戏等 [10] - 公司内部超90%的工程师使用腾讯云代码助手CodeBuddy,50%新增代码由AI辅助生成,代码评审环节AI参与度达94% [10] 腾讯AI战略与行业地位 - 腾讯被认为拥有完备的AI要素:丰富场景、海量数据、生态资源,以及谋定后动的战略风格 [14] - 公司通过组织变阵、人才引进、产品(如元宝)和开源(如混元3D)等多方面举措,明显开启了AI进程上的提速 [12][13] - 引进姚顺雨这样的顶尖人才,被视为腾讯开启AI攻坚的证明 [11]