大模型
搜索文档
腾讯升级大模型研发架构,前OpenAI研究员姚顺雨任首席AI科学家
贝壳财经· 2025-12-17 11:49
公司组织架构与人事任命 - 腾讯宣布升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,以全面强化其大模型的研发体系与核心能力 [1] - 前OpenAI研究员姚顺雨(Vincesyao)出任“CEO/总裁办公室”首席AI科学家,向腾讯总裁刘炽平汇报 [1] - 姚顺雨同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报 [1] 新设部门职责 - 新成立的AI Infra部将负责大模型训练和推理平台技术能力建设 [1]
刚刚!OpenAI前核心研究员姚顺雨加盟腾讯,出任首席AI科学家
是说芯语· 2025-12-17 11:47
腾讯AI人才与战略布局 - 2025年12月17日,人工智能领域顶尖学者、OpenAI前核心研究员姚顺雨正式加盟腾讯集团,出任CEO/总裁办公室首席AI科学家,直接向集团总裁刘炽平汇报,同时兼任新成立的AI Infra部及大语言模型部负责人,向技术工程事业群总裁卢山汇报,此次任命标志着公司在AI核心人才布局上的重大突破,凸显了其加码大模型研发、构建AI基础设施核心竞争力的战略决心 [2] - 姚顺雨作为27岁的青年领军者,学术与职业履历亮眼,出身“清华姚班”,于普林斯顿大学获得计算机科学博士学位,其博士阶段提出的“思维树”框架大幅提升了AI模型的复杂问题决策能力,已成为业界主流技术范式 [2] - 在OpenAI任职期间,姚顺雨作为核心研究员参与了智能体产品Operator与Deep Research等关键项目的研发,其提出的ReAct方法首次构建“推理—行动”结合的智能体范式,为语言智能体的商业化应用奠定基础,该方法与“思维树”框架的引用次数均超4000次,其个人学术总引用量已突破1.5万次,并于2025年5月入选《麻省理工科技评论》“35岁以下科技创新35人”中国区名单,成为该届最年轻的入选者 [3] 腾讯AI研发架构升级 - 与姚顺雨的任命同步,公司宣布启动大模型研发架构升级,新成立AI Infra部、AI Data部及数据计算平台部,撤销原机器学习平台部,形成“算力-数据-算法”三位一体的大模型研发体系 [3] - 姚顺雨牵头的AI Infra部将聚焦大模型分布式训练、高性能推理服务等核心技术,为腾讯混元大模型的迭代及业务落地提供底层支撑,而大语言模型部则将在其带领下持续推进技术攻坚,强化混元系列模型的核心竞争力 [3] - 公司相关负责人表示,此次架构升级与顶尖人才的引入,是为了在巩固工程化优势的基础上,进一步提升AI研究能力,实现研究与工程的深度融合 [6] 腾讯AI投入与成果 - 据公开数据显示,公司近年来在AI领域投入持续加码,过去一年大模型相关战略性资本开支超1000亿元 [6] - 公司自研的混元大模型已发布30余个新模型,在文生图、3D生成等多个国际榜单中位居榜首,目前已在微信、腾讯会议等内部900余款产品及金融、医疗等30多个行业大规模落地 [6] 姚顺雨加盟的预期价值与行业影响 - 业内分析指出,姚顺雨的加盟将为公司带来三方面核心价值:一是将OpenAI的先进研发理念与技术方法论融入混元大模型的迭代过程,二是引领AI Infra基础设施建设,破解大模型训练的算力瓶颈,三是推动语言智能体技术与公司丰富的应用场景深度结合,加速AI商业化价值释放 [6] - 在全球AI人才竞争日趋激烈的背景下,此次公司与姚顺雨的携手,为中国科技企业吸引顶尖人才、提升全球AI竞争力提供了标杆范例 [7] - 姚顺雨在入职沟通中提及,选择加盟的核心原因是公司完善的AI生态与坚定的战略投入,未来将聚焦大模型的技术突破与产业落地,助力公司在AI“下半场”竞争中构建领先优势 [7]
用手机就能当导演,硬刚Sora2的万相2.6接入千问APP
新浪财经· 2025-12-17 11:36
产品发布与功能创新 - 12月16日,阿里千问APP上线最新视频生成模型万相2.6,并向所有用户免费开放[2] - 基于万相2.6,千问APP上线“AI小剧场”功能,在国内首次实现“角色合拍”玩法,用户可与朋友或名人同框出演AI短片[2] - 万相2.6是全球功能最全的视频生成模型,支持音画同步、多镜头生成及声音驱动等功能,也是国内首个支持角色扮演功能的视频模型[4] - “AI小剧场”玩法基于角色扮演功能,目前全球仅OpenAI的Sora2大模型有类似功能[4] - 万相2.6的某些功能如音频驱动生视频,Sora2尚未实现[5] 技术实力与行业地位 - 千问APP接入影视级视觉大模型,使AI不仅是专业工具,也能释放普通人的想象力[5] - 公司拥有全栈自研的强大技术底座,今年9月在国内率先发布音画同步的视频生成模型万相2.5[5] - 在权威大模型评测集LMArena上,万相图生视频位居国内第一[5] - 在语言模型领域,阿里千问已具备比肩GPT的实力,英伟达开源的多个模型基座来自千问[6] - 爱彼迎Airbnb CEO表示公司大量依赖阿里千问,认为其比OpenAI更好更便宜[6] - 在大模型赛道,公司已成为实力全面硬刚OpenAI的中国科技公司[6] - 公司已在全球开源300多款模型,在全球主要模型社区的下载量突破7亿,衍生模型突破18万个[6] - 阿里千问超越美国Meta的Llama,成为全球第一的开源模型家族[6] 应用表现与用户增长 - 千问APP公测一个月,迭代速度惊人,共计更新18个版本,在创作、学习、办公三大场景能力持续增强[5] - 用户数量增长破纪录,公测一周下载量即破千万[5] - 公测23天,月活跃用户数(含APP、Web、PC端)突破3000万,成为全球增长最快的AI应用[5]
深城交拟定增募资不超18亿元 用于交通行业大模型、具身智能交通等相关项目
智通财经· 2025-12-17 11:34
公司融资计划 - 深城交计划向不超过35名特定对象发行A股股票 [1] - 发行价格不低于定价基准日前20个交易日公司股票交易均价的80% [1] - 发行数量不超过1.58亿股,该数量不超过本次发行前公司总股本的30% [1] - 本次发行募集资金总额不超过18亿元 [1] 募集资金用途 - 募集资金在扣除发行费用后将全部用于四个项目 [1] - 资金将用于面向全域智能体协同的交通行业大模型与生态应用 [1] - 资金将用于低空、自动驾驶等具身智能交通设备及装备研发与规模化应用 [1] - 资金将用于全球化业务拓展项目 [1] - 资金将用于补充流动资金 [1]
深城交(301091.SZ)拟定增募资不超18亿元 用于交通行业大模型、具身智能交通等相关项目
智通财经网· 2025-12-17 11:30
公司融资计划 - 深城交计划向不超过35名特定对象发行A股股票 [1] - 发行价格不低于定价基准日前20个交易日公司股票交易均价的80% [1] - 发行数量不超过本次发行前公司总股本的30%,即不超过1.58亿股 [1] - 本次发行募集资金总额不超过18亿元 [1] 募集资金用途 - 募集资金在扣除发行费用后将全部用于四个项目 [1] - 资金将用于面向全域智能体协同的交通行业大模型与生态应用 [1] - 资金将用于低空、自动驾驶等具身智能交通设备及装备研发与规模化应用 [1] - 资金将用于全球化业务拓展项目 [1] - 资金将用于补充流动资金 [1]
前OpenAI研究员姚顺雨加入腾讯,腾讯AI会起什么变化?
新浪财经· 2025-12-17 10:37
12月17日,腾讯宣布升级大模型研发架构,新成立AI Infra部、AI Data部和数据计算平台部,旨在全面强化大模型的研发体系与核心能力。其中,Vinces Yao 出任"CEO/总裁办公室"首席AI科学家,向腾讯总裁刘炽平汇报;同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报。 据智通财经了解,新成立的腾讯AI Infra部将负责大模型训练和推理平台技术能力建设,聚焦大模型分布式训练、高性能推理服务等核心技术能力,为大模 型算法研发和业务场景落地提供技术支持。 而架构升级后的AI Data部、数据计算平台部,将分别负责大模型数据及评测体系建设、大数据和机器学习的数据智能融合平台建设工作。王迪继续担任大 语言模型部副总经理,向Vinces Yao汇报。刘煜宏担任AI Data部负责人、陈鹏担任数据计算平台部负责人,均向公司副总裁蒋杰汇报。 "过去几十年我们专注于把模型训得更强,如今游戏规则彻底反转——接下来比拼的不是训练,而是如何定义并评估真正有用的任务。换言之,第一阶段的 看家法宝是Transformer、深度强化学习和大规模预训练;而第二阶段,你得像产品经理一样重新思考:A ...
腾讯AI,悄然加速
华尔街见闻· 2025-12-17 10:25
文章核心观点 - 2025年中国AI竞争已从模型参数转向资本效率、基础设施与流量入口的综合博弈,形成阿里(重资产)、字节(流量)、腾讯(内生验证+外溢赋能)三足鼎立格局 [1] - 腾讯AI战略正从“研判期”、“多模型策略期”进入“主动出击期”,通过组织架构升级、产品迭代和生态渗透加速布局 [2][4][6][7] - 腾讯的核心策略是依托其庞大的用户生态和“超级连接”能力,将AI深度内化于业务场景并通过云平台外溢赋能,不追求单点技术领先,而注重场景渗透与风险最小化的长期竞争 [8][11][15][19] 行业竞争格局 - 国内AI战场呈现“三国杀”局面:阿里选择重资产投入、字节选择流量突围、腾讯选择“内生验证+外溢赋能” [1] - AI时代的竞争终局是场景渗透率的竞争,大量AI Chatbot面临高尝鲜、低留存的困境,本质是缺乏真实场景 [11] - 海外市场,谷歌通过整合搜索、云、安卓与AI形成生态闭环,腾讯正试图在中国市场复制类似的“数据-场景-技术”飞轮路径 [16] 腾讯AI战略演进 - **2023年之前(研判期)**:公司将AI定义为“几百年不遇的机遇”,但保持“不急”的防御姿态,聚焦底层技术研发与场景预研,未急于商业化 [6] - **2024年(转折点)**:采取“坚定投入自研模型+开放拥抱先进开源模型”的多模型策略,积极拥抱如DeepSeek等外部模型 [6][7] - **2025年(主动出击期)**:通过组织重构和生态渗透主动出击,标志性动作包括挖来OpenAI人才、重组混元团队 [7] - 公司面对新技术习惯等市场路径清晰后再全力冲刺,追求风险最小化,类似其在移动支付和云服务竞争中的策略 [7] 组织架构与研发投入 - 2024年12月17日,公司升级大模型研发架构,正式成立AI Infra部、AI Data部、数据计算平台部,从组织层面强化研发体系 [4] - AI Infra部将作为大模型体系底座,负责分布式训练、高性能推理等核心技术 [4] - Vincesyao出任首席AI科学家,直接向总裁刘炽平汇报,并兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报,汇报关系扁平化以提升研发效率 [4] - 此举与谷歌将AI团队并入DeepMind由哈萨比斯统一领导的逻辑类似,旨在统一反馈链路,加速迭代 [4] 产品与技术进展 - **模型迭代**:过去一年,腾讯混元大模型迭代了30多个版本,在文生图、3D生成等领域保持全球领先水平 [7] - **近期发布**:近两个月陆续发布混元2.0、混元3D 3.0和混元图像3.0,其中混元图像3.0在LMArena文生图榜单中位列第一 [7] - **世界模型**:腾讯混元世界模型1.5(WorldPlay)正式上线,是国内首个支持“实时互动”的世界模型,用户可生成并自由探索3D虚拟世界 [5] - **工程能力**:公司采取“自研+接插件”模式,在微信、元宝等产品中同时接入自研混元和DeepSeek等外部开源模型 [8] 生态应用与内化成果 - 混元大模型已在公司内部超过900个场景和应用落地,尤其在广告、游戏等核心业务场景增效明显 [9] - AI为公司在广告精准定向、游戏用户参与度、编程、游戏及视频制作等领域带来效率提升 [9] - 公司奉行“狗粮自吃”原则,在对外输出能力前,先让AI成为提升自身业务效率的“发动机” [8] - 公司生态内十几亿用户的社交、办公、消费行为数据与微信、QQ等场景深度绑定,形成“数据反哺模型优化,模型提升场景体验”的闭环 [11] C端战略:元宝与生态连接 - 元宝用户规模稳居国内AI应用前三,成为最受新中产欢迎的AI原生应用 [12] - 元宝的战略是成为腾讯生态的“连接器”,而非单纯靠投流买量的新入口 [12] - 元宝正与腾讯生态深度融合:连接社交(微信联系人、QQ“聊天总结”)、连接内容(QQ音乐“搜歌即听”、腾讯视频)、连接服务(进驻公众号与视频号评论区) [12] - 目标是构建“社交×服务×AI”的闭环系统,让AI能力像器官一样长在产品里,用户无感使用 [11][13] B端战略:腾讯云与智能体平台 - 腾讯云智能体开发平台(ADP)通过“低代码/无代码”方式,让企业可在几分钟内构建专属智能体 [14] - 平台优势在于能一键将智能体发布到微信公众号、小程序,打通B端开发与C端触达的“C2B”链路 [14] - 在金融、政务、出行等30多个典型场景中,腾讯云的AI代码助手已辅助生成公司内部50%的新增代码 [15] - 公司推行“双轨Agent”策略:一类是通用Agent(如元宝),另一类是背靠微信通信、社交、内容、支付与商业五大生态的生态Agent,后者被认为是真正的差异化壁垒 [16][17] 市场认可与估值 - 资本市场认可公司在AI上的高确定性参与方式 [9] - 国海证券研报根据SOTP估值方法,给予2026年腾讯控股各项业务合计目标市值6.5万亿元人民币/7.1万亿港元,对应目标价773港元 [9] - 国信证券分析师认为,公司生态里用户+场景的天然优势使其成为AI时代最佳卡位的企业之一 [11]
“雷军的AI秘密武器”罗福莉首秀:详解小米AGI之路
创业邦· 2025-12-17 10:19
公司AI战略与模型发布 - 小米于2025年12月17日举办“人车家全生态合作伙伴大会”,前DeepSeek核心成员罗福莉首次公开演讲,标志着公司AI研发走向“正规军化”和“极客化”[6] - 公司发布了面向智能体的新一代基座模型MiMo-V2-Flash,并已开源所有模型权重、技术报告,并提供API和体验Web[40] - 罗福莉阐述了公司的AGI愿景,认为真正的智能需从交互中产生,最终目标是打造一个能推演世界运作逻辑、具备物理一致性的虚拟宇宙,而不仅仅是语言程序[6][42] 模型MiMo-V2-Flash核心特点 - 模型采用MoE架构,总参数达3090亿,但激活参数仅为150亿,通过MTP技术实现高效推理,生成速度达150 tokens/秒,带来约2.5倍加速[7][32] - 模型采用创新的Hybrid SWA注意力机制,锁定128 tokens的“神奇窗口”,支持256K长上下文,并固定KV缓存以降低硬件压力,在代码生成上刷新了SOTA[10] - 在落地层面追求高性价比,后训练阶段采用MOPD技术,用极低计算量(不到标准流程1/50)复刻教师模型性能,旨在降低大规模部署成本[10] 模型性能与成本优势 - 在代码能力和智能体能力上,该模型在全球开源模型评估榜单中进入Top 1-2行列,大部分评估基准超过或与总参数量为其2-3倍的DeepSeek-V3、Kimi、Qwen等模型相当[24] - 在价格与速度的权衡中,该模型定位为低成本、高速度,其推理速度比DeepSeek-V3.2快约3倍,而推理成本比综合性能相当的Gemini 2.5 Pro便宜20倍[27] 技术创新细节 - 模型架构围绕“极致推理效率”设计,采用Hybrid Attention结构,其中Sliding Window Attention与Full Attention的比例约为5:1,以兼顾性能并适配主流推理框架[29] - 深度挖掘MTP技术潜力,在训练和微调中加入MTP层以提升基座潜能,最终推理时使用三层MTP进行加速并行Token验证,实现2.2到2.6倍的推理加速[31][32] - 提出MOPD训练范式,利用稠密的令牌级奖励进行监督学习,可高效将各领域专家能力蒸馏到学生模型上,并尝试通过学生模型自我迭代实现持续提升[34][36] 对AI发展路径的思考 - 从生物进化视角看,智能发展遵循从控制身体与环境互动、到强化学习、再到大脑模拟未来、最后掌握语言的路径,而当前大模型的发展是“倒叙”,先掌握了语言[16][19] - 大模型通过海量文本的下一词预测学习,本质上是压缩了人类数十亿年对世界的认知同构,解码了人类思维在文本空间的投影,这是一种自顶向下的捷径[19] - 公司认为AI进化的下一个起点是构建物理模型,让智能体具备从“回答问题”到“完成任务”的能力,这需要统一的全模态感知能力和对物理规律的理解[40][42] 现状与挑战 - 尽管模型追求高效推理,但其150亿的激活参数对当前旗舰手机等移动设备而言依然过高,端侧AI的舒适区仍停留在30亿到70亿参数之间[11] - 模型当前的“高效推理”更多指在云端数据中心实现高吞吐量,对用户终端而言仍是一个重度依赖网络的“云端模型”,并未打破端侧AI的算力天花板[11] - 公司旨在通过高效推理与智能体技术,推动AI从“语言交互”跨越到“物理世界”以赋能“人车家全生态”,但这一理想仍在路上,现有硬件尚难完全支撑[9]
腾讯大模型研发架构升级,成立AI Infra部
财经网· 2025-12-17 10:19
公司组织架构升级 - 腾讯于12月17日升级大模型研发架构,新成立了AI Infra部、AI Data部、数据计算平台部 [1] - 此次架构升级旨在全面强化公司大模型的研发体系与核心能力 [1] 核心人事任命 - Vincesyao出任“CEO/总裁办公室”首席AI科学家,向腾讯总裁刘炽平汇报 [1] - Vincesyao同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报 [1] - 王迪继续担任大语言模型部副总经理,向Vincesyao汇报 [1] - 刘煜宏担任AI Data部负责人,陈鹏担任数据计算平台部负责人,均向公司副总裁蒋杰汇报 [1] 新部门职责与战略定位 - AI Infra部负责大模型训练和推理平台技术能力建设,聚焦大模型分布式训练、高性能推理服务等核心技术 [1] - AI Infra部的目标是构建大模型AI Infra核心竞争力,为大模型算法研发和业务场景落地提供稳定高效的技术支持和服务 [1] - AI Data部将负责大模型数据及评测体系建设 [1] - 数据计算平台部将负责大数据和机器学习的数据智能融合平台建设工作 [1]
腾讯宣布升级大模型研发架构 前OpenAI研究员姚顺雨任要职
新浪财经· 2025-12-17 09:25
【腾讯宣布升级大模型研发架构 前OpenAI研究员姚顺雨任要职】《科创板日报》17日讯,腾讯宣布升 级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,全面强化其大模型的研发体系与 核心能力。Vincesyao(即前Open AI研究员姚顺雨)出任"CEO/总裁办公室"首席AI科学家,向腾讯总裁 刘炽平汇报;同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报。据悉,AI Infra部将负责大模型训练和推理平台技术能力建设。(记者 李佳怡) 转自:智通财经 ...