罗福莉首秀，雷军的AI新战事

文章核心观点 - 小米公司近期发布了其MiMo-V2-Flash大模型，该模型以高性价比、快速推理和强大的代码与智能体（Agent）能力为核心特点，旨在为公司的“人车家全生态”战略提供AI基座，标志着小米在AI领域正进行大规模、高强度的战略投入 [1][5][26] 模型性能与特点 - 新模型MiMo-V2-Flash参数规模为309B，激活参数为15B，被定位为服务于智能体（Agent）的基座模型 [1] - 模型在代码能力和Agent能力上，据称已进入全球开源模型Top 1-2行列，大部分评估基准超过或与DeepSeek-V3、Kimi K2-Thinking、Qwen等模型相当，而参数仅为后者的1/2至1/3 [1] - 在SWE-Bench Multilingual基准测试中，该模型的表现超过了包括GPT-5在内的一众闭源大模型 [11] - 模型优化侧重于高效沟通（强化代码与工具调用）、加速带宽（高推理效率）和发力后训练（Post-train）以激发强化学习潜能 [8][9][10] 效率与成本优势 - 模型生成速度达到每秒150 tokens，具备极高的推理效率 [1] - 与Claude Sonnet 4.5相比，小米新模型的推理价格仅为其2.5%，生成速度是其2倍 [12] - API定价具备竞争力，输入为0.7元/百万tokens，输出为2.1元/百万tokens [12] - 采用5:1的滑动窗口注意力（SWA）与全局注意力（GA）混合结构以优化成本与速度，其SWA在长文和推理能力上优于主流线性注意力机制 [14] 公司AI战略与投入 - 小米的AI战略核心是“轻量化+端侧部署”，旨在利用其全球超过10亿台设备的存量优势 [6][25] - 2025年，公司研发投入预计超过300亿元，其中约75亿元（四分之一）将直接投向AI领域，并计划未来五年总投入超过2000亿元 [21] - 公司已搭建自有AI Infra平台，并着手建设GPU万卡集群，团队成立时已拥有6500张GPU资源 [21] - 组织上形成了“双核”配置：罗福莉负责基础大模型，陈龙负责智驾团队，后者团队开源了全球首个打通自驾与具身操作的跨具身基座模型MiMo-Embodied [21] 业务应用与生态整合 - AI对于小米的战略意义在于同时赋能智能终端与智能驾驶两大业务线 [5][16] - 在智能终端侧，目标是通过轻量化模型进行端侧部署，升级“超级小爱”和澎湃OS，将AI深度接入手机等设备 [5][18] - 在智能驾驶侧，急需大模型作为基座来提升智驾能力的上限 [5][18] - 公司试图通过一套通用的AI逻辑（如MiMo-Embodied模型）驱动其庞大的硬件生态，实现从手机、智能家居到智驾的知识迁移与协同 [25] 产品发布节奏与目标 - 2025年小米在AI模型发布上呈现“急行军”态势：4月开源MiMo-7B系列，5月发布MiMo-VL-7B，11月推出MiMo-Embodied具身智能大模型，12月由MiMo-V2-Flash压轴登场 [19][20][21] - 发布MiMo-V2-Flash的目标不仅是技术展示，更是向资本市场和用户讲述小米从硬件公司向拥有高效“大脑”（AI模型）和广泛“身体”（生态）的智能时代公司进化的新故事 [26] - 公司未来的优化将拆解为两条线：一是死磕端侧模型落地；二是攻克物理模型以补足智驾能力 [15]