MiMo
搜索文档
鏖战2025年,大模型围着开源转
36氪· 2025-12-25 10:29
行业格局演变 - 2025年,开源大模型在全球竞争中彻底占据上风,使用人数跃居全球第一,攻守之势发生逆转 [1] - 行业初期,受ChatGPT示范效应影响,闭源一度被视为主流路径,在数据安全、商业变现、响应速度方面有优势,但在AI普惠、生态建设、市场抢占方面存在短板 [3] - 以Meta和阿里巴巴为代表的头部互联网大厂引领开源,形成了开源与闭源两大阵营对峙的格局,部分企业采取了对内闭源、对外通过云平台提供第三方开源模型的折中方案 [5] 关键驱动事件与公司动态 - DeepSeek-R1以约80小时总训练时长和约29.4万美元的低成本,颠覆了传统算力“大力出奇迹”的思维,其开源策略引发“DeepSeek时刻”,显著壮大了开源阵营声势 [7] - 腾讯旗下的混元世界模型1.5首次开源了业界最系统、最全面的实时世界模型框架 [7] - OpenAI开源了参数量仅0.4B、99.9%权重为零的Circuit-Sparsity模型,提出了稀疏化新路径 [8] - Meta战略发生重大转向,计划于2026年第一季度左右上线押注闭源的Avocado大模型,被描述为“一百八十度的战略转向” [10] 技术性能与市场地位 - 根据《中国智能互联网发展报告(2025)》,以DeepSeek、Qwen为代表的中国开源模型在核心性能上已追平甚至超越国际主流产品,实现了从“跟跑”到“并跑”的转变 [8] - 性能基准测试显示,开源模型在多项竞赛中表现优异,例如DeepSeek-V3.2 Speciele版本在HMMT Feb 2025哈佛MIT数学竞赛中得分99.2,在IMOAnswerBench中得分84.5 [9] - 市场竞争焦点已从单纯的性能比拼,转向成本、效率和商业化能力的综合竞争 [8] 开源成为主流趋势的核心动因 - **动因一:拼应用成为共识**:行业共识认为大模型的尽头是AI应用,谁能跑出杀手级应用谁就能掌握更高生态位 [11] - 截至2025年9月,AI应用市场移动端、PC端月活跃用户数分别达到7.29亿、2.00亿,其中豆包月活1.72亿,DeepSeek月活1.45亿 [11] - 开源被视为大模型落地的最短路径,能聚拢分散力量,共同营造繁荣的AI应用生态,寻找超级流量入口 [13] - **动因二:构建大模型生态**:开源大幅降低了开发者创业和创新的门槛,减少了成本、缩短了迭代周期、提升了用户体验 [13] - 庞大的开发者群体可以进行技术反馈,通过开源的知识聚合让大模型加速迭代 [13] - 开源带来的高用户黏性可以带来不可估量的商业价值,成为互联网大厂争夺的战略制高点 [14][15] - **动因三:开源不等于免费,存在清晰的商业化路径** [18] - 商业化路径包括:提供增值功能的企业版收费、通过商业API提供高性能服务收费、以及通过云服务(算力租赁、数据加密等)收费 [19] 主要参与者的开源策略 - 阿里巴巴累计开源超300个模型,衍生模型数量逾17万个,位居全球开源大模型首位,采取赛马路线 [16] - 百度将模型开源与算力自主绑定,自研昆仑芯P800以及万卡集群,走全栈自主路线 [17] - 随着OpenAI、谷歌、英伟达等硅谷巨头入局,开源模型竞争格局从DeepSeek一家独大走向多元竞争 [20][22] 市场数据与份额 - OpenRouter数据显示,开源模型的市场份额已攀升至33% [20] - 技术差距的弥合使得市场竞争的焦点从单纯的性能比拼,迅速转向成本、效率和商业化能力 [8]
“天才少女”罗福莉亮相背后:曾被雷军亲自点将,能成小米新王牌?
搜狐财经· 2025-12-18 12:26
小米大模型战略与关键人事 - 小米MiMo大模型团队新任负责人罗福莉首次公开亮相,其因“AI天才少女”标签及此前在ACL顶级会议发表8篇论文的经历而备受关注[1] - 罗福莉于2024年11月官宣加入小米,此前有报道称小米创始人雷军开出千万年薪邀请其加入从事大模型研究[1] - 罗福莉的研究方向聚焦于下一代智能体,认为其需从“回答问题”转向“完成任务”,并具备与世界交互的能力[2] 大模型技术路径与核心观点 - 罗福莉认为当代智能体需具备高效的沟通语言,主要体现在代码能力和工具调用能力上,并需围绕推理效率重新设计模型结构[1] - 其指出AI进化的下一个关键点是能够与真实环境持续交互的物理模型,真正的智能要在交互中“活出来”[4] - 罗福莉对“物理AI”兴趣浓厚,其团队已开源跨具身基座模型MiMo-Embodied,尝试打通自动驾驶与具身智能领域[4] 小米大模型产品布局与进展 - 2024年以来,小米几乎以月为单位推进模型发布,覆盖推理、视觉、多模态、音频与具身等多个层级[2][6] - 具体模型包括:4月的推理模型MiMo,5月的多模态MiMo-VL,9月的端到端语音MiMo-Audio,11月面向家庭场景的Miloco[2] - 2024年12月16日,小米公布了MiMo-V2-Flash开源MoE模型,总参数量3090亿,活跃参数量150亿,罗福莉表示该模型实现了低成本、高速度,已初步具备模拟世界的能力[5] - 截至2024年第三季度,小米AIoT平台全球连接设备数首次突破10亿,达到10.4亿台[2] 智能家居战略与行业影响 - 小米推出智能家居未来探索方案Xiaomi Miloco,旨在让智能家居设备从“被动响应指令”走向“主动理解与服务”[6] - Miloco方案的核心优势在于用户可通过口语化表达需求,由系统自动调用工具创建智能规则,无需手动设置复杂触发条件[11] - 该方案依托自研的Xiaomi MiMo-VL-Miloco-7B端侧视觉语言大模型,结合家庭摄像头实时视觉数据,让智能家居从“单一条件触发”升级到“多维度场景感知”[11] - 行业观点认为,小米Miloco这类方案能打破设备孤岛,实现靠本地大模型自动感知需求、切换场景,并保护隐私,让智能家居从“听指挥”变为“主动服务”[6] - 分析指出,智能家居领域可能出现类似AI手机的集中式操作系统,小米Miloco概念展现出通过本地化AI中枢统一调度跨品牌设备的趋势[12] 大模型与公司生态融合 - 罗福莉的加入及研究方向,与小米核心的“人、车、家”生态战略相呼应,旨在解决模型在该生态中如何理解世界并持续参与的问题[2] - 在“人、车、家”生态体系中,AI需嵌入具体业务场景,承担感知、决策与执行的角色,智能驾驶和具身智能可能成为小米大模型从“认知工具”走向“行动主体”的关键落点[5]
“天才少女”罗福莉走向台前
华尔街见闻· 2025-12-17 12:35
核心观点 - 小米集团通过引入顶尖AI科学家罗福莉并发布其主导的MiMo大模型,旨在从传统硬件制造商转型为一家以AI驱动的智能服务公司,其核心战略是利用自身庞大的硬件生态作为物理世界入口,发展“具身智能”以构建商业护城河并寻求更高估值 [2][10][11] 公司战略与投入 - 小米集团总裁卢伟冰宣布未来五年研发投入规划达2000亿元,显示公司对AI转型的坚定决心 [2] - 公司重金引入前DeepSeek核心成员、95后科学家罗福莉担任MiMo大模型负责人,这是一次关键的技术补课与战略防御行动 [2] - 公司的目标是利用其全球最大的消费级IoT平台(连接10.4亿台设备)作为训练下一代“具身智能”的直接入口,将硬件作为载体,AI作为溢价核心 [10] 技术路线与产品 - 罗福莉为小米规划了一条“另类”技术路线:不追求“全知全能”的云端大模型,而是专注于打造“知行合一”、能与物理世界交互的“物理大脑”或智能体 [4][6] - 新发布的开源模型MiMo-V2-Flash采用MoE架构,总参数达309B,但实际运行时仅激活15B,以实现轻量化并部署于手机和汽车芯片 [5] - 该模型通过锁定128个Token的滑动窗口等工程策略,牺牲部分文采以换取极致的代码执行和工具调用效率,其展示的推理速度是对手DeepSeek-V3.2的3倍,成本仅为Gemini 2.5 Pro的二十分之一 [5] - 罗福莉认为算力和数据并非真正的护城河,小米的路线比拼的是科学研究文化和对问题的定义能力 [5] 行业背景与竞争格局 - 当前AI行业正从“规模时代”转向“研究时代”,单纯堆砌算力的边际收益递减,模型需要应用落地 [7][8] - 行业竞争维度已从“谁的模型更聪明”转变为“谁拥有物理世界的入口”,软件巨头如字节跳动、阿里、OpenAI等正积极尝试推出硬件以触碰真实世界 [9] - 高盛指出,字节跳动“豆包手机”等激进尝试,反而验证了小米等硬件巨头在AI入口生态战中的结构性优势 [11] - 行业普遍面临挑战:云端ChatBot的高昂推理成本使商业模式难以为继,同时如何在算力受限的端侧设备实现高智商推理也是一大物理挑战 [8][11] 公司面临的挑战与机遇 - 机遇在于小米本身是“物理世界的地主”,其庞大的硬件生态是其在AI时代翻盘的关键基础 [10] - 主要挑战在于必须证明其原生MiMo模型比外来的“豆包”或“ChatGPT”更好用、更听话,否则其10.4亿台设备可能沦为别人的流量入口 [11] - 公司需要让数万名习惯了传统硬件开发的工程师适应大模型时代的开发范式,这是一道现实难题 [11] - 对于小米而言,若不能在AI时代掌握核心模型,其“人车家生态”中的所有硬件可能沦为其他巨头的躯壳,这是无法接受的战略结局 [11]
China's Xiaomi says returns from AI investments 'far exceed expectations'
Yahoo Finance· 2025-12-05 09:30
公司战略与AI投资回报 - 小米公司总裁卢伟冰表示,公司在2025年从人工智能支出中获得的回报“远超预期” [1] - 公司正从过去几个季度对通用人工智能的重度投资,转向具身人工智能 [2] - 公司相信AI与物理世界的深度融合代表了下一代智能技术 [3] AI技术进展与产品 - 公司于2024年4月发布了首个AI模型MiMo,近期又开源了在自动驾驶和具身AI任务中均展现“最先进性能”的模型MiMo-Embodied [4] - 公司将AI应用于电动汽车和机器人领域,其路径与埃隆·马斯克在特斯拉汽车和Optimus人形机器人上的计划相似 [2] - 公司于2025年2月推出了集成其Hyper-Autonomous Driving智能驾驶系统的旗舰车型SU7 Ultra [5] 业务拓展与市场趋势 - 中国电动汽车领域对AI应用的兴趣激增 [5] - 将AI技术集成到物理系统中的具身人工智能领域也受到越来越多的关注 [6] - 公司在2021年推出机器狗和2022年推出人形机器人原型后,加大了对机器人领域的投资 [6] 人才与团队建设 - 公司强调对人才的渴求,其MiMo团队近期聘请了来自中国AI初创公司DeepSeek的前研究员罗福立,他是DeepSeek V2模型的关键贡献者 [7] - 罗福立作为MiMo团队负责人,定于12月17日在小米开发者大会上发表演讲 [7] 财务表现 - 公司的智能电动汽车、人工智能及其他新业务在第三季度首次实现盈利 [8] - 这些新业务在第三季度共同创造了创纪录的290亿元人民币(合41亿美元)营收,同比增长199% [8] - 公司第三季度总营收同比增长22%,达到1131亿元人民币 [8]
罗福莉官宣后,小米放出首个AI大招,10亿IoT设备一键接入大模型
36氪· 2025-11-14 11:16
产品发布与定位 - 公司推出首个“大模型+智能家居”解决方案Xiaomi Miloco,全称为Xiaomi Local Copilot(小米本地协同智能助手)[1] - 该方案很可能代表智能家居的“ChatGPT时刻”,公司AIoT平台截至今年6月已连接的IoT设备数(不含智能手机、平板及笔记本计算机)达9.89亿台[3] 技术核心与架构 - 方案以米家摄像头为视觉信息源,以自研大语言模型MiMo-VL-Miloco-7B为核心,连接家中所有物联网设备[2] - MiMo-VL-Miloco-7B模型基于公司4月发布的MiMo模型调优而来,是公司自研的设备端视觉语言大模型[2][11] - 依托于端侧视觉语言大模型与“硬件-能力-应用-用户”四层完整架构的支撑[9] - 部署硬件要求为x64架构,图形处理器在英伟达30系列及以上,存储需16GB及以上[6] 功能特性与交互方式 - 用户可通过自然语言与智能家居系统对话,经大模型推理自动完成家庭生活中的各类智能需求和规则[5] - 具备四大特征:基于大语言模型的新交互范式、利用摄像头数据流作为感知信息新用途、采用设备端大语言模型保障隐私、与米家生态连接[5][6] - 通过标准化的MCP协议封装,实现米家生态与全球最大开源智能家居社区Home Assistant生态的打通,并支持第三方IoT平台接入[6] 模型性能与团队背景 - MiMo-VL-7B模型在数学推理和代码竞赛公开测评集上,仅用7B参数量,得分超过了OpenAI的闭源推理模型o1-mini和阿里Qwen开源推理模型QwQ-32B-Preview[12] - 原DeepSeek核心成员罗福莉官宣加盟Xiaomi MiMo团队[12]
罗福莉C位亮相小米,离职DeepSeek后首次官宣
猿大侠· 2025-11-14 04:11
罗福莉加入小米事件概述 - 罗福莉正式官宣加入小米,出任MiMo团队负责人 [1][4] - 罗福莉在X平台宣布将带领团队推动多模态空间智能发展,这是实现通用人工智能的关键一步 [4] 事件背景与时间线 - 2023年底已有传闻称雷军以千万年薪将罗福莉从DeepSeek挖至小米 [5][10] - 2023年12月25日DeepSeek-V3版本上线并宣布全面开源 [6] - 2023年12月26日媒体曝出小米正在组建GPU万卡集群 [7] - 2023年12月31日雷军在跨年直播中披露小米AI野心,汽车业务步入正轨后全力进军AI [8][9] - 上月小米AI团队论文作者栏已出现罗福莉名字,但标注为独立研究者 [11][13] 罗福莉专业背景 - 本科毕业于北京师范大学计算机专业,硕士就读于北京大学计算语言学 [15] - 曾任职阿里巴巴达摩院机器智能实验室研究员,负责开发多语言预训练模型VECO及AliceMind项目开源 [17] - 2022年加入DeepSeek母公司幻方量化,后担任DeepSeek深度学习研究员,参与研发DeepSeek-V2等模型 [17] - 学术论文总引用次数超过1.1万次,2024年新增约八千次引用 [18] - 在DeepSeek最新的Nature封面论文中列名,明确了对模型的工作贡献 [19] 小米AI战略方向 - MiMo是小米推进大模型研发的核心招牌,目标指向空间智能 [23][24] - 空间智能旨在从语言世界走向物理世界,具备感知、推理、生成与行动能力,实现比特世界与原子世界的智能贯通 [24][26] - 该技术愿景与小米人、车、家全生态战略天然适配 [26] - 罗福莉的官宣明确了小米MiMo团队的前沿方向 [24]
罗福莉C位亮相小米,离职DeepSeek后首次官宣
量子位· 2025-11-12 08:01
罗福莉加入小米事件 - 罗福莉正式官宣加入小米,出任MiMo团队负责人 [1][7] - 该传闻始于2024年底,称雷军以千万年薪挖角DeepSeek核心开发者罗福莉 [4][10] - 2024年12月,小米AI团队论文作者栏已出现罗福莉名字,但当时身份为“独立研究者” [11] 罗福莉背景与影响力 - 罗福莉拥有北京师范大学计算机本科和北京大学计算语言学硕士背景,曾在阿里巴巴达摩院和DeepSeek任职 [15][17] - 其学术论文总引用次数超过11,000次,仅2024年一年内就新增约8,000次引用 [18] - 她参与了DeepSeek-V2等模型的研发,其名字也出现在DeepSeek最新的Nature封面论文中 [17][19] 小米的AI战略方向 - 在汽车业务步入正轨后,小米宣布将全力进军AI深水区 [9] - 2024年12月26日,媒体曝出小米正在组建GPU万卡集群 [6] - 雷军在跨年直播中公开披露了小米在AI方面的野心 [8] MiMo团队与空间智能技术 - 罗福莉领导的MiMo团队是小米推进大模型研发的核心招牌,目标指向空间智能 [23] - 空间智能旨在从语言世界走向物理世界,具备感知、推理、生成与行动的能力,是实现通用人工智能的关键一步 [3][23] - 该技术理念与小米拥有的“人、车、家全生态”场景天然适配 [25]
官宣!95后「AI天才少女」罗福莉加入小米,雷军终于“挖人”成功
搜狐财经· 2025-11-12 07:43
罗福莉职业经历与专业背景 - 罗福莉为北京师范大学本科背景,后保研至北京大学计算语言学专业,并于2019年在人工智能顶级国际会议ACL上一口气发表8篇论文,获得“AI天才少女”称号[2] - 作为核心开发者参与研发DeepSeek-V2大模型,该模型中文水平跻身全球第一梯队且定价为1元/百万输入Tokens,高性价比使DeepSeek被称为“AI界拼多多”[2] - 2024年底至2025年初因DeepSeek-V2爆火而成为全网焦点,2025年2月从DeepSeek离职,知乎认证信息变更,亲属证实已到新岗位上班[5] 小米公司人才引进与AI战略 - 小米公司以千万年薪挖角罗福莉的传闻使其登上热搜,雷军亲自出面邀请侧面印证其人才价值[3] - 2025年10月小米AI团队与北京大学联合发布的聚焦MoE与强化学习的论文中已出现罗福莉名字,推测其于2025年初离职后加入小米参与相关工作[5] - 小米于2025年4月开源MiMo大模型,正在搭建万卡GPU集群,罗福莉的技术能力可应用于小爱同学智能化升级和小米汽车智能驾驶决策优化[6] AI行业人才竞争态势 - AI圈人才竞争已呈白热化状态,95后顶尖AI人才罗福莉成为各企业争抢的“香饽饽”,凸显顶尖AI人才稀缺现状[6] - 字节跳动张一鸣开办知春未来科技体验营,计划每年招聘30名16-18岁优秀全职预备研究员,学习创造具身智能机器人和AI产品[6][7] - 大模型竞争的最终核心是人才竞争,企业纷纷加大对能真正做出落地产品的技术人才的争夺力度[6][8]
监督学习未死,一题训练五小时起飞!华人学者新方法20倍训练效率释放大模型推理能力
量子位· 2025-08-04 07:00
大模型推理能力研究进展 - 可验证奖励的强化学习(RLVR)技术取得突破,尤其是"一题强化学习"在多个任务中表现亮眼[1] - RL训练面临资源成本高(上百小时A100GPU)和训练不稳定的现实难题[2] - 传统监督式微调(SFT)在低数据量下易过拟合,效果难以保证[2] One-Shot CFT技术原理 - 滑铁卢大学TIGER Lab提出One-Shot Critique Fine-Tuning新方法,通过"逐步分析判断答案好坏"激发LLM推理能力[3] - 方法流程:选取代表性任务→多模型生成解答→强大模型点评→训练目标模型从点评中学习[4] - 仅需一题数据+多个解答+多个点评即可完成微调,训练仅需约5个GPU小时[5] 实验效果验证 - 在数学任务上,Qwen2.5-Math-7B经CFT微调后准确率提升+15%,超越使用4万多个样本的全监督微调模型[9] - Qwen2.5-Math-7B在MATH-500等基准测试中平均提升+14.9分,最高单任务提升+23.1分[9] - 在BBEH逻辑推理任务中获得+10~16%准确率增幅,展现跨任务迁移能力[10] - 效果对具体任务和种子选择不敏感,具有良好的稳定性和复现性[11] 技术优势分析 - 批判性学习:理解"答案为何正确或错误",学习信号更具深度[12] - 多视角输入:一个问题模拟多种推理路径与错误类型,接近人类学习方式[12] - 强泛化性:点评语言包含通用逻辑判断规则,更易迁移至新任务[12] - 更换问题、模型、点评风格时,提升幅度保持稳定[13] 应用前景 - 相比RL方法大幅降低资源需求(5 GPU小时 vs 上百小时)[14] - 为个人研究者、资源有限实验室和初创团队提供高性价比解决方案[15] - 全流程开源(训练脚本、模型参数、数据集等),极大降低复现门槛[17]
苹果Meta狂抓AI,抢人并购
虎嗅· 2025-06-23 23:27
行业竞争格局 - AI领域三巨头微软、亚马逊和谷歌以及OpenAI、Anthropic、xAI等公司已形成领先优势,苹果与Meta面临边缘化风险 [2] - 谷歌基于Gemini模型巩固AI搜索业务地位,并进军AI短视频领域挑战TikTok,可能蚕食Meta的Reels广告市场 [7] - OpenAI正在开发AI硬件,可能成为继MacBook与iPhone后的"第三核心设备",直接威胁苹果生态 [11] 公司战略与困境 - 苹果在WWDC未展示实质性AI创新,端侧设备AI体验进展缓慢,30亿参数模型落后于华为、小米的70亿参数模型 [6][8] - Meta的Llama4开源模型未达预期,旗舰模型发布推迟且未成为行业基准测试首选 [7] - 两家公司均面临缺人、缺方向的困局,战略执行混乱导致人才流失 [12] 并购与人才争夺 - Meta以143亿美元收购Scale AI近半数股份,并试图整合SSI、Perplexity等估值超百亿美元的AI公司 [2][16] - 扎克伯格亲自参与顶尖人才招募,挖角DeepMind、OpenAI等团队核心成员 [15][18] - 苹果考虑收购Perplexity(140亿美元估值)或Mistral(60亿美元估值),但面临欧盟和微软的竞争阻碍 [19][21] 技术发展瓶颈 - 苹果纠结于AI技术是否符合其"完美"用户体验标准,担忧隐私与幻觉问题 [13] - Meta首席科学家Lecun质疑大型语言模型的发展方向,导致内部技术路线分歧 [14] - 两家公司在智能眼镜领域布局均受限于大模型能力不足,Meta暂聚焦拍照/语音交互 [10] 市场动态与财务动作 - 华为推出鸿蒙6操作系统及50+智能体框架,小米开源70亿参数多模态模型MiMo-VL [8] - 苹果去年股票回购达1100亿美元,今年计划回购1000亿美元,可能调整资金用于并购 [22] - 硅谷进入大模型时代第二波并购潮,继谷歌/亚马逊收编AI公司后,苹果与Meta加速布局 [23]