罗福莉首秀,雷军的AI新战事
小米集团小米集团(HK:01810) 36氪·2025-12-18 00:09

文章核心观点 - 小米公司近期发布了其MiMo-V2-Flash大模型,该模型以高性价比、快速推理和强大的代码与智能体(Agent)能力为核心特点,旨在为公司的“人车家全生态”战略提供AI基座,标志着小米在AI领域正进行大规模、高强度的战略投入 [1][5][26] 模型性能与特点 - 新模型MiMo-V2-Flash参数规模为309B,激活参数为15B,被定位为服务于智能体(Agent)的基座模型 [1] - 模型在代码能力和Agent能力上,据称已进入全球开源模型Top 1-2行列,大部分评估基准超过或与DeepSeek-V3、Kimi K2-Thinking、Qwen等模型相当,而参数仅为后者的1/2至1/3 [1] - 在SWE-Bench Multilingual基准测试中,该模型的表现超过了包括GPT-5在内的一众闭源大模型 [11] - 模型优化侧重于高效沟通(强化代码与工具调用)、加速带宽(高推理效率)和发力后训练(Post-train)以激发强化学习潜能 [8][9][10] 效率与成本优势 - 模型生成速度达到每秒150 tokens,具备极高的推理效率 [1] - 与Claude Sonnet 4.5相比,小米新模型的推理价格仅为其2.5%,生成速度是其2倍 [12] - API定价具备竞争力,输入为0.7元/百万tokens,输出为2.1元/百万tokens [12] - 采用5:1的滑动窗口注意力(SWA)与全局注意力(GA)混合结构以优化成本与速度,其SWA在长文和推理能力上优于主流线性注意力机制 [14] 公司AI战略与投入 - 小米的AI战略核心是“轻量化+端侧部署”,旨在利用其全球超过10亿台设备的存量优势 [6][25] - 2025年,公司研发投入预计超过300亿元,其中约75亿元(四分之一)将直接投向AI领域,并计划未来五年总投入超过2000亿元 [21] - 公司已搭建自有AI Infra平台,并着手建设GPU万卡集群,团队成立时已拥有6500张GPU资源 [21] - 组织上形成了“双核”配置:罗福莉负责基础大模型,陈龙负责智驾团队,后者团队开源了全球首个打通自驾与具身操作的跨具身基座模型MiMo-Embodied [21] 业务应用与生态整合 - AI对于小米的战略意义在于同时赋能智能终端与智能驾驶两大业务线 [5][16] - 在智能终端侧,目标是通过轻量化模型进行端侧部署,升级“超级小爱”和澎湃OS,将AI深度接入手机等设备 [5][18] - 在智能驾驶侧,急需大模型作为基座来提升智驾能力的上限 [5][18] - 公司试图通过一套通用的AI逻辑(如MiMo-Embodied模型)驱动其庞大的硬件生态,实现从手机、智能家居到智驾的知识迁移与协同 [25] 产品发布节奏与目标 - 2025年小米在AI模型发布上呈现“急行军”态势:4月开源MiMo-7B系列,5月发布MiMo-VL-7B,11月推出MiMo-Embodied具身智能大模型,12月由MiMo-V2-Flash压轴登场 [19][20][21] - 发布MiMo-V2-Flash的目标不仅是技术展示,更是向资本市场和用户讲述小米从硬件公司向拥有高效“大脑”(AI模型)和广泛“身体”(生态)的智能时代公司进化的新故事 [26] - 公司未来的优化将拆解为两条线:一是死磕端侧模型落地;二是攻克物理模型以补足智驾能力 [15]