小米MiMo大模型
搜索文档
“天才少女”罗福莉首秀:小米MiMo大模型,比DeepSeek更便宜、推理速度快三倍
钛媒体APP· 2025-12-17 07:15
小米大模型技术进展 - 小米AI实验室大模型团队负责人罗福莉首次公开亮相,详述了公司在大模型领域的最新进展[2] - 公司推出了全新一代面向智能体的基座模型MiMo-V2-Flash,其总参数为309B,激活参数为15B[2] - MiMo-V2-Flash在代码能力和智能体能力上已进入全球开源模型Top 1-2行列,其大部分评估基准已超过或与DeepSeek-V3、Kimi、Qwen等模型相当,而这些模型的总参数量通常是MiMo-V2-Flash的两到三倍[2] 模型性能与成本优势 - 在推理价格和速度方面,MiMo-V2-Flash比DeepSeek-V3.2更便宜,且推理速度约为其三倍[3] - 与综合性能相当、推理速度差不多的Gemini 2.5 Pro相比,MiMo-V2-Flash的推理成本便宜了整整20倍[3] 开源战略与下一代智能体愿景 - MiMo-V2-Flash已经开源了所有模型权重,同步了技术报告细节,并提供了API供开发者接入Web Coding IDE[5] - 公司认为下一代智能体系统需要从“回答问题”转变为“完成任务”,这需要记忆、推理、规划及全模态感知能力,以便无缝嵌入智能终端[5] - 下一代智能体需要构建物理模型,以理解物理规律和推演世界运作逻辑,实现与真实环境的交互,这是AI能力的本质跨越[5] 研发投入与生态建设 - 公司宣布未来五年将在研发上投入2000亿元,长期目标是成为全球硬核科技的引领者[6] - 具体到2025年,预计研发投入将达到320-330亿元,2026年预计投入约400亿元[6] - 自2025年4月以来,公司陆续推出了Xiaomi MiMo语言、多模态、语音系列基座大模型并开源,11月还发布了智能家居方案Xiaomi Miloco和具身大模型MiMo-Embodied,同样全面开源[6] 操作系统与平台生态数据 - 公司为物联网定制的轻量化操作系统Xiaomi Vela的开源版本openvela,其全球合作伙伴已突破100家,深度赋能1500个种类产品,搭载该系统的设备数已超过1.6亿台[6] - 公司全球月活跃用户数达到7.42亿[7] - 硬件生态方面,小米AIoT平台连接设备数达到10.4亿,硬件合作伙伴数量突破15000家[7] - 软件生态方面,全球开发者规模达到120万,国内应用生态每月应用分发量突破11亿[7] 汽车生态开放进展 - 小米汽车CarIoT已向汽车行业全面开放,为汽车厂商和硬件制造伙伴提供统一的生态硬件接口和车载生态件产品[7] - 目前CarIoT已开放品类超过30种,并与比亚迪、广汽丰田等4家车企达成深度合作[7]
“天才少女”罗福莉小米首秀:国内外模型代差从三年缩至数月
贝壳财经· 2025-12-17 04:01
新京报贝壳财经讯(记者陈维城)12月17日,95后AI"天才少女"罗福莉以小米MiMo大模型负责人的身 份首秀2025小米"人车家全生态"合作伙伴大会。罗福莉认为,下一代智能体系统不是一个"语言模拟 器",而是一个真正理解我们世界,并与之共存的"智能体"。 当年年底,有媒体报道,罗福莉被小米集团创始人、董事长兼CEO雷军以千万年薪挖走,或将担任小米 AI实验室的大模型团队负责人。 今年11月,罗福莉在朋友圈官宣加入小米。12月初,小米集团合伙人、总裁卢伟冰回应罗福莉相关问题 时表示,小米在前几个季度已开始在AI上的压强式投入,进展远超预期。小米希望能够给优秀的人才 提供好的发展平台。 编辑 杨娟娟 校对 杨利 罗福莉进一步解释,"智能体"要有两个能力,一是Agent执行,从"回答问题"到"完成任务",包括记 忆、推理、自主规划、决策、执行;二是Omni 感知,统一多模态感知(为理解物理世界打基础)嵌入 眼镜等智能终端,融入日常工作流。 罗福莉表示,在2020年,中国开源模型距离世界顶尖闭源模型的代差至少有三年。如今,大家都能看 到,中国的开源模型,距离世界顶尖闭源模型的差距可能仅有数月。 2024年,AI大模 ...
卢伟冰:AI和芯片是小米两大关键战略
中国经营报· 2025-05-29 03:39
核心观点 - 公司宣布2025年第一季度业绩为史上最强单季度财报,并重申2026-2030年将投入2000亿元研发费用,聚焦硬科技领域,尤其是AI和芯片两大子战略 [2] - 公司提出未来十年发展目标,致力于成为全球硬核科技引领者,2021-2025年研发投入预计超1020亿元,2025年单年研发投入预估达300亿元 [2][3] - 公司计划从高端向超高端市场突破,强化手机、汽车等全品类高端化,并推动全球化战略 [3][4] 财务与研发投入 - 公司2026-2030年研发投入目标为2000亿元,旨在构建技术护城河 [2][3] - 2021-2025年研发投入预计超1020亿元,2025年单年研发投入预估达300亿元 [2] - 芯片部门自2021年重启大芯片项目以来,累计研发投入超135亿元,团队规模超2500人,位列中国境内前三 [6] 业务战略 - 智能手机业务在中低端市场占据优势,但高端市场仍面临品牌形象、用户忠诚度和技术溢价能力不足的挑战,短期内难以撼动苹果和三星的地位 [2] - 智能汽车业务处于成长初期,SU7交付量亮眼,但面临毛利率偏低、研发投入高、供应链复杂等问题,盈利模式尚未清晰 [2] - 公司计划从高端向超高端市场突破,手机目标价格段为6000元以上,汽车业务同步推进高端化 [3] 技术布局 - AI领域:公司发布开源大模型Xiaomi MiMo,7B参数规模在数学推理和代码竞赛测评中表现优异 [5] - 芯片领域:发布首款3nm旗舰手机SoC芯片玄戒O1(190亿晶体管)和首款自研4G基带芯片玄戒T1,技术处于全球第一梯队水平 [5] - 公司将持续投入芯片研发,未来十年至少投资500亿元,芯片部门为突破硬核科技的核心赛道 [6] 全球化与生态战略 - 公司计划将中国市场的经验和方法推向全球,巩固东南亚、拉美等新兴市场,拓展欧洲、中东等成熟市场 [3][4] - 深化"人车家全生态"融合,通过手机、家电、汽车、穿戴设备等终端的互联互通,构建统一生态系统平台 [4]
两位大模型从业者群友如何评价小米MiMo大模型?
理想TOP2· 2025-04-30 13:04
大模型性能对比 - Llama-3 8B在BBH基准测试中得分为64 2 显著低于Gemma-2 9B的69 4和Qwen2 5 7B的70 4 而MiMo-7B以75 2领先[1] - 在GPQA-Diamond测试中 Qwen2 5以35 4的准确率表现最佳 超过MiMo-7B的25 8[1] - MiMo-7B在SuperGPQA测试中获得25 1分 略优于Qwen2 5的24 6[1] - 数学能力方面 MiMo-7B在AIME 2024测试中取得32 9的高分 远超Qwen2 5的10 1[1] - 代码能力上 MiMo-7B在LiveCodeBench v5测试中获得32 9分 显著高于Qwen2 5的5 0[1] 中文能力表现 - Qwen2 5在C-Eval中文测试中获得81 8的高分 明显优于MiMo-7B的68 7[1] - CMMLU中文测试中 Qwen2 5以82 7分领先 MiMo-7B得分为70 9[1] - 预训练结果显示Qwen在中文问答方面具有明显优势 而MiMo-7B表现相对较弱[1] 模型训练策略 - MiMo-7B通过预训练偏重数学和代码能力 导致其他能力下降[1] - 强化学习主要提升数学和代码能力 但提升幅度不大 未见显著创新[1] - 7B模型在AIME测试中获得20多分是通过牺牲其他能力实现的技巧性高分 而非结构创新[1] - 小尺寸模型可能采用蒸馏技术训练 效果优于直接训练[4] - MiMo-7B使用"先进推理模型"合成数据进行训练[4] 行业讨论 - 参数规模差异大的模型不适合直接比较 如MindGPT是千亿参数级别[3] - 小参数模型训练更快 可专注特定指标展示实力[3] - 当前行业普遍采用合成数据策略 MindGPT也使用类似方法[7] - 理想汽车计划在2025年5月举办AI Talk第二季活动[9]