MiMo
搜索文档
“天才少女”罗福莉亮相背后:曾被雷军亲自点将,能成小米新王牌?
搜狐财经· 2025-12-18 12:26
小米大模型战略与关键人事 - 小米MiMo大模型团队新任负责人罗福莉首次公开亮相,其因“AI天才少女”标签及此前在ACL顶级会议发表8篇论文的经历而备受关注[1] - 罗福莉于2024年11月官宣加入小米,此前有报道称小米创始人雷军开出千万年薪邀请其加入从事大模型研究[1] - 罗福莉的研究方向聚焦于下一代智能体,认为其需从“回答问题”转向“完成任务”,并具备与世界交互的能力[2] 大模型技术路径与核心观点 - 罗福莉认为当代智能体需具备高效的沟通语言,主要体现在代码能力和工具调用能力上,并需围绕推理效率重新设计模型结构[1] - 其指出AI进化的下一个关键点是能够与真实环境持续交互的物理模型,真正的智能要在交互中“活出来”[4] - 罗福莉对“物理AI”兴趣浓厚,其团队已开源跨具身基座模型MiMo-Embodied,尝试打通自动驾驶与具身智能领域[4] 小米大模型产品布局与进展 - 2024年以来,小米几乎以月为单位推进模型发布,覆盖推理、视觉、多模态、音频与具身等多个层级[2][6] - 具体模型包括:4月的推理模型MiMo,5月的多模态MiMo-VL,9月的端到端语音MiMo-Audio,11月面向家庭场景的Miloco[2] - 2024年12月16日,小米公布了MiMo-V2-Flash开源MoE模型,总参数量3090亿,活跃参数量150亿,罗福莉表示该模型实现了低成本、高速度,已初步具备模拟世界的能力[5] - 截至2024年第三季度,小米AIoT平台全球连接设备数首次突破10亿,达到10.4亿台[2] 智能家居战略与行业影响 - 小米推出智能家居未来探索方案Xiaomi Miloco,旨在让智能家居设备从“被动响应指令”走向“主动理解与服务”[6] - Miloco方案的核心优势在于用户可通过口语化表达需求,由系统自动调用工具创建智能规则,无需手动设置复杂触发条件[11] - 该方案依托自研的Xiaomi MiMo-VL-Miloco-7B端侧视觉语言大模型,结合家庭摄像头实时视觉数据,让智能家居从“单一条件触发”升级到“多维度场景感知”[11] - 行业观点认为,小米Miloco这类方案能打破设备孤岛,实现靠本地大模型自动感知需求、切换场景,并保护隐私,让智能家居从“听指挥”变为“主动服务”[6] - 分析指出,智能家居领域可能出现类似AI手机的集中式操作系统,小米Miloco概念展现出通过本地化AI中枢统一调度跨品牌设备的趋势[12] 大模型与公司生态融合 - 罗福莉的加入及研究方向,与小米核心的“人、车、家”生态战略相呼应,旨在解决模型在该生态中如何理解世界并持续参与的问题[2] - 在“人、车、家”生态体系中,AI需嵌入具体业务场景,承担感知、决策与执行的角色,智能驾驶和具身智能可能成为小米大模型从“认知工具”走向“行动主体”的关键落点[5]
“天才少女”罗福莉走向台前
华尔街见闻· 2025-12-17 12:35
作者 | 周智宇 编辑 | 张晓玲 一位95后科学家的现身,让小米一次例常的会议,吸睛无数。 12月17日,罗福莉现身小米合作伙伴大会。这位前DeepSeek核心成员、被业内冠以"天才少女"之名的95后科学家,以小米MiMo大模型负责人的身份完成首 秀。 罗福莉站在台前略显生涩,与向来以营销老练著称的小米相比,透着一丝"违和感"。但无论是她带来的开源模型MiMo-V2-Flash,还是小米集团总裁卢伟冰 宣布的未来五年2000亿元研发投入规划,都让外界得以一窥这家硬件厂商在AI时代的野心。 当下,传统硬件制造的利润空间持续压缩,而以大模型为核心的智能服务,已成为推动商业模式转型、拉升企业市值的关键变量。为了不让小米错失下一个 十年,雷军不惜重金将罗福莉招致麾下,这不仅是一次技术层面的"补课",更是一场基于商业理性的战略防御。 科技商业的权力版图正不断被重塑。唯有真正掌握核心智能"大脑",小米庞大的硬件生态才能守住自身的护城河,而非为他人做嫁衣。 罗福莉展示的MiMo-V2-Flash疯狂在做减法。她采用的MoE(混合专家)架构,虽然总参数高达309B,但在实际运行时只激活15B。也只有这样轻量化的模 型,才能 ...
China's Xiaomi says returns from AI investments 'far exceed expectations'
Yahoo Finance· 2025-12-05 09:30
公司战略与AI投资回报 - 小米公司总裁卢伟冰表示,公司在2025年从人工智能支出中获得的回报“远超预期” [1] - 公司正从过去几个季度对通用人工智能的重度投资,转向具身人工智能 [2] - 公司相信AI与物理世界的深度融合代表了下一代智能技术 [3] AI技术进展与产品 - 公司于2024年4月发布了首个AI模型MiMo,近期又开源了在自动驾驶和具身AI任务中均展现“最先进性能”的模型MiMo-Embodied [4] - 公司将AI应用于电动汽车和机器人领域,其路径与埃隆·马斯克在特斯拉汽车和Optimus人形机器人上的计划相似 [2] - 公司于2025年2月推出了集成其Hyper-Autonomous Driving智能驾驶系统的旗舰车型SU7 Ultra [5] 业务拓展与市场趋势 - 中国电动汽车领域对AI应用的兴趣激增 [5] - 将AI技术集成到物理系统中的具身人工智能领域也受到越来越多的关注 [6] - 公司在2021年推出机器狗和2022年推出人形机器人原型后,加大了对机器人领域的投资 [6] 人才与团队建设 - 公司强调对人才的渴求,其MiMo团队近期聘请了来自中国AI初创公司DeepSeek的前研究员罗福立,他是DeepSeek V2模型的关键贡献者 [7] - 罗福立作为MiMo团队负责人,定于12月17日在小米开发者大会上发表演讲 [7] 财务表现 - 公司的智能电动汽车、人工智能及其他新业务在第三季度首次实现盈利 [8] - 这些新业务在第三季度共同创造了创纪录的290亿元人民币(合41亿美元)营收,同比增长199% [8] - 公司第三季度总营收同比增长22%,达到1131亿元人民币 [8]
罗福莉官宣后,小米放出首个AI大招,10亿IoT设备一键接入大模型
36氪· 2025-11-14 11:16
产品发布与定位 - 公司推出首个“大模型+智能家居”解决方案Xiaomi Miloco,全称为Xiaomi Local Copilot(小米本地协同智能助手)[1] - 该方案很可能代表智能家居的“ChatGPT时刻”,公司AIoT平台截至今年6月已连接的IoT设备数(不含智能手机、平板及笔记本计算机)达9.89亿台[3] 技术核心与架构 - 方案以米家摄像头为视觉信息源,以自研大语言模型MiMo-VL-Miloco-7B为核心,连接家中所有物联网设备[2] - MiMo-VL-Miloco-7B模型基于公司4月发布的MiMo模型调优而来,是公司自研的设备端视觉语言大模型[2][11] - 依托于端侧视觉语言大模型与“硬件-能力-应用-用户”四层完整架构的支撑[9] - 部署硬件要求为x64架构,图形处理器在英伟达30系列及以上,存储需16GB及以上[6] 功能特性与交互方式 - 用户可通过自然语言与智能家居系统对话,经大模型推理自动完成家庭生活中的各类智能需求和规则[5] - 具备四大特征:基于大语言模型的新交互范式、利用摄像头数据流作为感知信息新用途、采用设备端大语言模型保障隐私、与米家生态连接[5][6] - 通过标准化的MCP协议封装,实现米家生态与全球最大开源智能家居社区Home Assistant生态的打通,并支持第三方IoT平台接入[6] 模型性能与团队背景 - MiMo-VL-7B模型在数学推理和代码竞赛公开测评集上,仅用7B参数量,得分超过了OpenAI的闭源推理模型o1-mini和阿里Qwen开源推理模型QwQ-32B-Preview[12] - 原DeepSeek核心成员罗福莉官宣加盟Xiaomi MiMo团队[12]
罗福莉C位亮相小米,离职DeepSeek后首次官宣
猿大侠· 2025-11-14 04:11
罗福莉加入小米事件概述 - 罗福莉正式官宣加入小米,出任MiMo团队负责人 [1][4] - 罗福莉在X平台宣布将带领团队推动多模态空间智能发展,这是实现通用人工智能的关键一步 [4] 事件背景与时间线 - 2023年底已有传闻称雷军以千万年薪将罗福莉从DeepSeek挖至小米 [5][10] - 2023年12月25日DeepSeek-V3版本上线并宣布全面开源 [6] - 2023年12月26日媒体曝出小米正在组建GPU万卡集群 [7] - 2023年12月31日雷军在跨年直播中披露小米AI野心,汽车业务步入正轨后全力进军AI [8][9] - 上月小米AI团队论文作者栏已出现罗福莉名字,但标注为独立研究者 [11][13] 罗福莉专业背景 - 本科毕业于北京师范大学计算机专业,硕士就读于北京大学计算语言学 [15] - 曾任职阿里巴巴达摩院机器智能实验室研究员,负责开发多语言预训练模型VECO及AliceMind项目开源 [17] - 2022年加入DeepSeek母公司幻方量化,后担任DeepSeek深度学习研究员,参与研发DeepSeek-V2等模型 [17] - 学术论文总引用次数超过1.1万次,2024年新增约八千次引用 [18] - 在DeepSeek最新的Nature封面论文中列名,明确了对模型的工作贡献 [19] 小米AI战略方向 - MiMo是小米推进大模型研发的核心招牌,目标指向空间智能 [23][24] - 空间智能旨在从语言世界走向物理世界,具备感知、推理、生成与行动能力,实现比特世界与原子世界的智能贯通 [24][26] - 该技术愿景与小米人、车、家全生态战略天然适配 [26] - 罗福莉的官宣明确了小米MiMo团队的前沿方向 [24]
罗福莉C位亮相小米,离职DeepSeek后首次官宣
量子位· 2025-11-12 08:01
罗福莉加入小米事件 - 罗福莉正式官宣加入小米,出任MiMo团队负责人 [1][7] - 该传闻始于2024年底,称雷军以千万年薪挖角DeepSeek核心开发者罗福莉 [4][10] - 2024年12月,小米AI团队论文作者栏已出现罗福莉名字,但当时身份为“独立研究者” [11] 罗福莉背景与影响力 - 罗福莉拥有北京师范大学计算机本科和北京大学计算语言学硕士背景,曾在阿里巴巴达摩院和DeepSeek任职 [15][17] - 其学术论文总引用次数超过11,000次,仅2024年一年内就新增约8,000次引用 [18] - 她参与了DeepSeek-V2等模型的研发,其名字也出现在DeepSeek最新的Nature封面论文中 [17][19] 小米的AI战略方向 - 在汽车业务步入正轨后,小米宣布将全力进军AI深水区 [9] - 2024年12月26日,媒体曝出小米正在组建GPU万卡集群 [6] - 雷军在跨年直播中公开披露了小米在AI方面的野心 [8] MiMo团队与空间智能技术 - 罗福莉领导的MiMo团队是小米推进大模型研发的核心招牌,目标指向空间智能 [23] - 空间智能旨在从语言世界走向物理世界,具备感知、推理、生成与行动的能力,是实现通用人工智能的关键一步 [3][23] - 该技术理念与小米拥有的“人、车、家全生态”场景天然适配 [25]
官宣!95后「AI天才少女」罗福莉加入小米,雷军终于“挖人”成功
搜狐财经· 2025-11-12 07:43
罗福莉职业经历与专业背景 - 罗福莉为北京师范大学本科背景,后保研至北京大学计算语言学专业,并于2019年在人工智能顶级国际会议ACL上一口气发表8篇论文,获得“AI天才少女”称号[2] - 作为核心开发者参与研发DeepSeek-V2大模型,该模型中文水平跻身全球第一梯队且定价为1元/百万输入Tokens,高性价比使DeepSeek被称为“AI界拼多多”[2] - 2024年底至2025年初因DeepSeek-V2爆火而成为全网焦点,2025年2月从DeepSeek离职,知乎认证信息变更,亲属证实已到新岗位上班[5] 小米公司人才引进与AI战略 - 小米公司以千万年薪挖角罗福莉的传闻使其登上热搜,雷军亲自出面邀请侧面印证其人才价值[3] - 2025年10月小米AI团队与北京大学联合发布的聚焦MoE与强化学习的论文中已出现罗福莉名字,推测其于2025年初离职后加入小米参与相关工作[5] - 小米于2025年4月开源MiMo大模型,正在搭建万卡GPU集群,罗福莉的技术能力可应用于小爱同学智能化升级和小米汽车智能驾驶决策优化[6] AI行业人才竞争态势 - AI圈人才竞争已呈白热化状态,95后顶尖AI人才罗福莉成为各企业争抢的“香饽饽”,凸显顶尖AI人才稀缺现状[6] - 字节跳动张一鸣开办知春未来科技体验营,计划每年招聘30名16-18岁优秀全职预备研究员,学习创造具身智能机器人和AI产品[6][7] - 大模型竞争的最终核心是人才竞争,企业纷纷加大对能真正做出落地产品的技术人才的争夺力度[6][8]
监督学习未死,一题训练五小时起飞!华人学者新方法20倍训练效率释放大模型推理能力
量子位· 2025-08-04 07:00
大模型推理能力研究进展 - 可验证奖励的强化学习(RLVR)技术取得突破,尤其是"一题强化学习"在多个任务中表现亮眼[1] - RL训练面临资源成本高(上百小时A100GPU)和训练不稳定的现实难题[2] - 传统监督式微调(SFT)在低数据量下易过拟合,效果难以保证[2] One-Shot CFT技术原理 - 滑铁卢大学TIGER Lab提出One-Shot Critique Fine-Tuning新方法,通过"逐步分析判断答案好坏"激发LLM推理能力[3] - 方法流程:选取代表性任务→多模型生成解答→强大模型点评→训练目标模型从点评中学习[4] - 仅需一题数据+多个解答+多个点评即可完成微调,训练仅需约5个GPU小时[5] 实验效果验证 - 在数学任务上,Qwen2.5-Math-7B经CFT微调后准确率提升+15%,超越使用4万多个样本的全监督微调模型[9] - Qwen2.5-Math-7B在MATH-500等基准测试中平均提升+14.9分,最高单任务提升+23.1分[9] - 在BBEH逻辑推理任务中获得+10~16%准确率增幅,展现跨任务迁移能力[10] - 效果对具体任务和种子选择不敏感,具有良好的稳定性和复现性[11] 技术优势分析 - 批判性学习:理解"答案为何正确或错误",学习信号更具深度[12] - 多视角输入:一个问题模拟多种推理路径与错误类型,接近人类学习方式[12] - 强泛化性:点评语言包含通用逻辑判断规则,更易迁移至新任务[12] - 更换问题、模型、点评风格时,提升幅度保持稳定[13] 应用前景 - 相比RL方法大幅降低资源需求(5 GPU小时 vs 上百小时)[14] - 为个人研究者、资源有限实验室和初创团队提供高性价比解决方案[15] - 全流程开源(训练脚本、模型参数、数据集等),极大降低复现门槛[17]
苹果Meta狂抓AI,抢人并购
虎嗅· 2025-06-23 23:27
行业竞争格局 - AI领域三巨头微软、亚马逊和谷歌以及OpenAI、Anthropic、xAI等公司已形成领先优势,苹果与Meta面临边缘化风险 [2] - 谷歌基于Gemini模型巩固AI搜索业务地位,并进军AI短视频领域挑战TikTok,可能蚕食Meta的Reels广告市场 [7] - OpenAI正在开发AI硬件,可能成为继MacBook与iPhone后的"第三核心设备",直接威胁苹果生态 [11] 公司战略与困境 - 苹果在WWDC未展示实质性AI创新,端侧设备AI体验进展缓慢,30亿参数模型落后于华为、小米的70亿参数模型 [6][8] - Meta的Llama4开源模型未达预期,旗舰模型发布推迟且未成为行业基准测试首选 [7] - 两家公司均面临缺人、缺方向的困局,战略执行混乱导致人才流失 [12] 并购与人才争夺 - Meta以143亿美元收购Scale AI近半数股份,并试图整合SSI、Perplexity等估值超百亿美元的AI公司 [2][16] - 扎克伯格亲自参与顶尖人才招募,挖角DeepMind、OpenAI等团队核心成员 [15][18] - 苹果考虑收购Perplexity(140亿美元估值)或Mistral(60亿美元估值),但面临欧盟和微软的竞争阻碍 [19][21] 技术发展瓶颈 - 苹果纠结于AI技术是否符合其"完美"用户体验标准,担忧隐私与幻觉问题 [13] - Meta首席科学家Lecun质疑大型语言模型的发展方向,导致内部技术路线分歧 [14] - 两家公司在智能眼镜领域布局均受限于大模型能力不足,Meta暂聚焦拍照/语音交互 [10] 市场动态与财务动作 - 华为推出鸿蒙6操作系统及50+智能体框架,小米开源70亿参数多模态模型MiMo-VL [8] - 苹果去年股票回购达1100亿美元,今年计划回购1000亿美元,可能调整资金用于并购 [22] - 硅谷进入大模型时代第二波并购潮,继谷歌/亚马逊收编AI公司后,苹果与Meta加速布局 [23]
六边形小米,或许仍有悬念
虎嗅· 2025-05-28 13:25
财务表现 - 2025年第一季度营业收入达1112.93亿元,同比增长47.4%,经调整净利润106.8亿元,同比增长64.5%,均超市场预期 [1] - 智能手机业务国内市场出货量同比大涨40%,以18.8%市场份额重回国内第一 [1] - 智能大家电收入同比增加113.8%,可穿戴产品收入同比增加56.5% [1] - 智能电动汽车营收达181亿元,相当于2024年全年该业务营收的55% [2][3] 业务板块亮点 - 智能手机ASP达1211元,同比增长5.8%,创历史新高,中国大陆高端智能手机出货量占比达25%,同比提升3.3个百分点 [3] - IoT与生活消费品业务营收323.4亿元,同比增长58.7%,占集团总营收29.1% [5] - 大家电产品出货量显著增长:空调超110万台(+65%)、冰箱超88万台(+65%)、洗衣机超74万台(+100%) [5] - 连接AIoT平台设备≥5件的用户数从1610万(2024Q2)增至1930万 [5] 战略布局与挑战 - 智能汽车业务亏损从18亿元(2024Q2)收窄至5亿元(2025Q1),年内或实现盈亏平衡 [2] - 武汉智能家电工厂计划2025年底投产,旨在降低成本和实现柔性生产 [10][12] - AI技术研发领先:2023年8月实现13亿参数手机端本地模型,近期开源推理模型MiMo在数学/代码测评中超越竞品 [12] - 当前瓶颈在于AI工程化落地进度滞后于研发,需加速构建跨设备AI决策中台 [12] 市场环境与潜在风险 - 国内手机和IoT业务的"量价齐升"部分受益于补贴政策,可能透支未来需求 [9] - 补贴退出后需完成增长逻辑切换,依靠生态优势降低用户流失率 [9][12] - 需解决从IoT硬件向AI服务跃迁的挑战,实现设备间真正的AI协同 [12]