小米MiMo
搜索文档
DeepSeek前骨干罗福莉C位亮相小米,曾网传雷军千万年薪挖她
程序员的那些事· 2025-11-13 11:24
罗福莉加入小米事件 - 罗福莉于11月12日首次官方宣布加入小米,担任MiMo团队负责人[1][3] - 罗福莉在X平台上高调宣布正式加入小米,出任MiMo团队负责人[3] - 此次任命标志着此前约一年的传闻最终落地[5] 小米的AI战略方向 - 小米在汽车业务步入正轨后,宣布将全力进军AI的深水区[9] - 小米AI的目标是推动智能从语言世界走向物理世界,解锁多模态的空间智能[4] - 空间智能被定义为具备感知、推理、生成与行动的能力,是实现通用人工智能(AGI)的关键一步[4][24] - 小米MiMo团队致力于推动空间智能发展,这与公司拥有的“人、车、家全生态”场景天然适配[24][26] 事件时间线与背景 - 2023年12月25日,DeepSeek-V3版本上线并宣布全面开源[6] - 2023年12月26日,媒体曝出小米正在组建GPU万卡集群[7] - 2023年12月31日,雷军在跨年直播中公开披露小米在AI方面的野心[8] - 坊间传闻雷军以千万年薪挖角DeepSeek核心开发者罗福莉[10] - 上个月,小米AI团队论文作者栏已出现罗福莉名字,但标注为“独立研究者”[11] 罗福莉的专业背景 - 罗福莉本科毕业于北京师范大学计算机专业,硕士就读于北京大学计算语言学[15] - 曾任职阿里巴巴达摩院机器智能实验室研究员,负责开发多语言预训练模型VECO并推动AliceMind项目开源[17] - 2022年加入DeepSeek母公司幻方量化,后担任DeepSeek的深度学习研究员,参与研发DeepSeek-V2等模型[17] - 学术论文总引用次数超过1.1万次,仅2024年就新增约八千次引用[18] - 在DeepSeek最新的Nature封面论文中,罗福莉名列作者之一[20] MiMo团队与空间智能 - 小米MiMo是公司推进大模型研发的核心招牌[24] - 空间智能概念旨在打通信息AI和物理AI,实现比特世界和原子世界的智能贯通[26] - AI教母李飞飞于11月10日发表万字长文,首次系统阐释“空间智能”概念及其对具身智能和AGI的意义[25] - 罗福莉作为独立研究员时,已在小米MiMo论文成果中起到承接作用,连接小米和北大团队[23]
罗福莉C位亮相小米,离职DeepSeek后首次官宣
36氪· 2025-11-13 10:26
公司核心人事任命 - 罗福莉于11月12日正式官宣加入小米,出任MiMo团队负责人[1] - 罗福莉此前为DeepSeek核心开发者,坊间传闻小米以千万年薪将其挖角[4][7] - 罗福莉学术背景深厚,论文总引用次数超过1.1万次,今年新增约八千次引用[13][17] 公司AI战略方向 - 小米MiMo团队明确剑指空间智能,旨在实现从语言世界到物理世界的智能进化[3][23] - 空间智能被定义为具备感知、推理、生成与行动的能力,是实现通用人工智能的关键一步[4][23] - 雷军在跨年直播中披露,汽车业务步入正轨后,公司将全力进军AI深水区[7] - 小米AI战略与公司人、车、家全生态场景天然适配[25] 公司技术布局时间线 - 2023年12月25日DeepSeek-V3上线并开源,次日媒体曝出小米正在组建GPU万卡集群[5][6] - 2023年底传闻雷军挖角罗福莉,上月小米AI论文作者栏已出现罗福莉以独立研究员身份署名[7][8] - 罗福莉在小米最新MiMo论文中起到承接作用,连接小米与北大团队,通讯作者为其北大恩师[21]
中国电子:国产开源模型千帆竞发,阿里 Qwen-3、小米 MiMo、DeepSeek Prover 集中发布
海通国际证券· 2025-04-30 15:15
报告行业投资评级 未提及 报告的核心观点 - 阿里 Qwen 当前位列开源大模型排行榜首,凭借领先性能及完善开源策略,未来有望在能力与生态变现方面持续领先,且部署成本显著降低 [2] - 随着国产模型开源增多,未来应用和商业化会面临同质化竞争问题,开源模型将向定制化演进,成熟 Agent 会改写行业格局,是 AI 商业化下个突破口 [5] 根据相关目录分别进行总结 事件 - 2025 年 4 月 28 日,阿里发布新一代 Qwen - 3 系列大语言模型,含多个量级版本 [1] - 2025 年 4 月 30 日,小米发布并开源首个专为推理任务设计的大语言模型 Xiaomi MiMo;DeepSeek 团队在 Hugging Face 平台发布最新大语言模型 DeepSeek - Prover - V2 - 671B [1] 阿里 Qwen - 3 - 具备多尺寸覆盖能力,推出多个参数规模模型,能满足不同场景推理需求 [1] - 性能显著提升,在多项公开评测基准上,相较前代模型准确率提升 10–30% [1] - 引入先进稀疏注意力机制和推理加速技术,相同硬件资源下推理速度提高 20%–40%,增强实用性和部署效率 [1] 小米 Xiaomi MiMo - 70 亿参数规模,在数学推理和代码生成等任务中性能卓越,超越部分更大规模模型 [3] - 采用三阶段逐步提升难度训练方法,总计训练 25T tokens 增强推理能力 [3] - 后训练阶段引入“测试难度驱动奖励”机制,结合“简单数据重采样”策略和“无缝推出系统”,提升强化学习稳定性和训练效率,使强化学习训练速度提升 2.29 倍、验证过程加快 1.96 倍 [3] DeepSeek - Prover - V2 - 671B - 在数学定理证明任务中表现出色,特别是形式化数学证明领域 [4] - 发布展示了 DeepSeek 在大模型领域技术实力,预示其在形式化推理和专业领域应用的战略布局 [4] - 上线可能为即将发布的 DeepSeek - R2 模型做能力验证或预热,显示推动 AI 技术向更深层次发展的决心 [4]