小米MiMo - 财报，业绩电话会，研报，新闻

小米MiMo

搜索文档

程序员的那些事· 2025-11-13 11:24

罗福莉加入小米事件 - 罗福莉于11月12日首次官方宣布加入小米，担任MiMo团队负责人[1][3] - 罗福莉在X平台上高调宣布正式加入小米，出任MiMo团队负责人[3] - 此次任命标志着此前约一年的传闻最终落地[5] 小米的AI战略方向 - 小米在汽车业务步入正轨后，宣布将全力进军AI的深水区[9] - 小米AI的目标是推动智能从语言世界走向物理世界，解锁多模态的空间智能[4] - 空间智能被定义为具备感知、推理、生成与行动的能力，是实现通用人工智能（AGI）的关键一步[4][24] - 小米MiMo团队致力于推动空间智能发展，这与公司拥有的“人、车、家全生态”场景天然适配[24][26] 事件时间线与背景 - 2023年12月25日，DeepSeek-V3版本上线并宣布全面开源[6] - 2023年12月26日，媒体曝出小米正在组建GPU万卡集群[7] - 2023年12月31日，雷军在跨年直播中公开披露小米在AI方面的野心[8] - 坊间传闻雷军以千万年薪挖角DeepSeek核心开发者罗福莉[10] - 上个月，小米AI团队论文作者栏已出现罗福莉名字，但标注为“独立研究者”[11] 罗福莉的专业背景 - 罗福莉本科毕业于北京师范大学计算机专业，硕士就读于北京大学计算语言学[15] - 曾任职阿里巴巴达摩院机器智能实验室研究员，负责开发多语言预训练模型VECO并推动AliceMind项目开源[17] - 2022年加入DeepSeek母公司幻方量化，后担任DeepSeek的深度学习研究员，参与研发DeepSeek-V2等模型[17] - 学术论文总引用次数超过1.1万次，仅2024年就新增约八千次引用[18] - 在DeepSeek最新的Nature封面论文中，罗福莉名列作者之一[20] MiMo团队与空间智能 - 小米MiMo是公司推进大模型研发的核心招牌[24] - 空间智能概念旨在打通信息AI和物理AI，实现比特世界和原子世界的智能贯通[26] - AI教母李飞飞于11月10日发表万字长文，首次系统阐释“空间智能”概念及其对具身智能和AGI的意义[25] - 罗福莉作为独立研究员时，已在小米MiMo论文成果中起到承接作用，连接小米和北大团队[23]

小米集团(HK:01810)

空间智能

通用人工智能（AGI）

Artificial Intelligence

Artificial Intelligence

小米MiMo

DeepSeek-V2

VECO

罗福莉C位亮相小米，离职DeepSeek后首次官宣

36氪· 2025-11-13 10:26

公司核心人事任命 - 罗福莉于11月12日正式官宣加入小米，出任MiMo团队负责人[1] - 罗福莉此前为DeepSeek核心开发者，坊间传闻小米以千万年薪将其挖角[4][7] - 罗福莉学术背景深厚，论文总引用次数超过1.1万次，今年新增约八千次引用[13][17] 公司AI战略方向 - 小米MiMo团队明确剑指空间智能，旨在实现从语言世界到物理世界的智能进化[3][23] - 空间智能被定义为具备感知、推理、生成与行动的能力，是实现通用人工智能的关键一步[4][23] - 雷军在跨年直播中披露，汽车业务步入正轨后，公司将全力进军AI深水区[7] - 小米AI战略与公司人、车、家全生态场景天然适配[25] 公司技术布局时间线 - 2023年12月25日DeepSeek-V3上线并开源，次日媒体曝出小米正在组建GPU万卡集群[5][6] - 2023年底传闻雷军挖角罗福莉，上月小米AI论文作者栏已出现罗福莉以独立研究员身份署名[7][8] - 罗福莉在小米最新MiMo论文中起到承接作用，连接小米与北大团队，通讯作者为其北大恩师[21]

小米集团(HK:01810)

空间智能

通用人工智能（AGI）

Artificial Intelligence

Artificial Intelligence

小米MiMo

AliceMind

DeepSeek-V3

中国电子：国产开源模型千帆竞发，阿里 Qwen-3、小米 MiMo、DeepSeek Prover 集中发布

海通国际证券· 2025-04-30 15:15

报告行业投资评级未提及报告的核心观点 - 阿里 Qwen 当前位列开源大模型排行榜首，凭借领先性能及完善开源策略，未来有望在能力与生态变现方面持续领先，且部署成本显著降低 [2] - 随着国产模型开源增多，未来应用和商业化会面临同质化竞争问题，开源模型将向定制化演进，成熟 Agent 会改写行业格局，是 AI 商业化下个突破口 [5] 根据相关目录分别进行总结事件 - 2025 年 4 月 28 日，阿里发布新一代 Qwen - 3 系列大语言模型，含多个量级版本 [1] - 2025 年 4 月 30 日，小米发布并开源首个专为推理任务设计的大语言模型 Xiaomi MiMo；DeepSeek 团队在 Hugging Face 平台发布最新大语言模型 DeepSeek - Prover - V2 - 671B [1] 阿里 Qwen - 3 - 具备多尺寸覆盖能力，推出多个参数规模模型，能满足不同场景推理需求 [1] - 性能显著提升，在多项公开评测基准上，相较前代模型准确率提升 10–30% [1] - 引入先进稀疏注意力机制和推理加速技术，相同硬件资源下推理速度提高 20%–40%，增强实用性和部署效率 [1] 小米 Xiaomi MiMo - 70 亿参数规模，在数学推理和代码生成等任务中性能卓越，超越部分更大规模模型 [3] - 采用三阶段逐步提升难度训练方法，总计训练 25T tokens 增强推理能力 [3] - 后训练阶段引入“测试难度驱动奖励”机制，结合“简单数据重采样”策略和“无缝推出系统”，提升强化学习稳定性和训练效率，使强化学习训练速度提升 2.29 倍、验证过程加快 1.96 倍 [3] DeepSeek - Prover - V2 - 671B - 在数学定理证明任务中表现出色，特别是形式化数学证明领域 [4] - 发布展示了 DeepSeek 在大模型领域技术实力，预示其在形式化推理和专业领域应用的战略布局 [4] - 上线可能为即将发布的 DeepSeek - R2 模型做能力验证或预热，显示推动 AI 技术向更深层次发展的决心 [4]

DeepSeek-Prover-V2-671B

DeepSeek-Prover-V2-671B