Workflow
AliceMind
icon
搜索文档
95后“AI天才”罗福莉首秀:中国模型距顶尖差距从三年缩至数月!她出身农村普通家庭,曾被雷军千万元年薪挖角
每日经济新闻· 2025-12-17 07:16
公司动态:小米AI大模型进展与人才引进 - 公司于2025年“人车家全生态”合作伙伴大会上,正式宣布开源并上线Xiaomi MiMo-V2-Flash大模型 [1] - 公司MiMo大模型负责人罗福莉首次公开亮相,其于11月已通过社交媒体宣布加入公司,负责小米首个推理大模型Xiaomi MiMo的研究 [1][11] - 公司高管卢伟冰在12月初通过视频形式侧面回应罗福莉加盟,表示“小米渴望并尊重顶尖人才” [15] 技术产品:MiMo-V2-Flash模型核心特性 - Xiaomi MiMo-V2-Flash是一个小型模型,总参数为309B,激活参数为15B [4] - 该模型在大部分评测基准上超过了DeepSeek V3.2和K2-Thinking,同时参数量减少了二分之一至三分之二 [6] - 模型具备强大的代码能力,据称已进入全球前二水平,并实现了低成本、高速度,已初步具备模拟世界的能力 [4][6] 技术愿景:下一代智能体发展方向 - 公司认为下一代智能体系统应是一个真正理解人类世界并与之共存的“智能体”,而非“语言模拟器” [9] - 智能体能力应从“回答问题”转向“完成任务”,具备记忆、推理、自主规划、决策、执行等能力 [9] - 应实现统一的多模态感知(Omni感知),为理解物理世界打下基础,从而更好地嵌入眼镜等智能终端 [9] 行业观点:开源价值与国内AI进展 - 公司认为开源的价值是实现AGI(通用人工智能)普惠化,是确保所有人类智慧共同进化的唯一路径 [9] - 国内开源模型(如DeepSeek、MiMo)与世界顶尖闭源模型的差距已从2020年时的约三年缩短至目前的可能只有数月 [9] 团队背景:核心负责人履历 - MiMo大模型负责人罗福莉为95后技术专家,本科毕业于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所 [9] - 其职业生涯始于阿里达摩院,主导开发多语言预训练模型VECO,后加入DeepSeek母公司幻方量化及DeepSeek团队,参与研发DeepSeek-V2等模型 [10] - 据此前媒体报道,公司创始人雷军曾希望以千万年薪邀请其加入公司领导AI大模型研究 [11] 公司战略:AI领域投入与布局 - 公司已在AI领域启动“压强式投入”,大模型与应用进展“远超预期” [15] - 未来将聚焦“AI与物理世界的深度结合”这一核心方向 [15] - 根据已公布的时间表,公司已推出包括推理大模型MiMo-7B、视觉推理大模型MiMo-VL、音频生成模型MiMo-Audio、端侧视觉语言大模型MiMo-VL-Miloco以及具身大模型MiMo-Embodied在内的系列模型 [15]
对话AI“老炮”邹阳:AGI不是你该关心的,现在的技术足够改变世界
36氪· 2025-12-09 12:28
文章核心观点 - 当前AI技术发展已进入边际效益递减阶段,短期内难以复现类似GPT-4的阶跃式突破,行业焦点应从追求通用人工智能(AGI)转向现有技术的规模化商业应用[8][13][18] - AI最大的价值在于将企业内80%-90%重复、高频、规则化的“照章办事”型脑力工作自动化,通过构建“数字专家”潜入产业流程,实现降本增效[9][29][32] - 技术落地的关键并非模型本身的持续突破,而在于具备将行业知识结构化、并利用现有模型能力嵌入业务流程的工程应用型人才[33][34][35] 对AI技术发展现状与趋势的判断 - 技术演进进入平台期:GPT-4代表了基于Transformer架构的一次革命性飞跃,但此后模型能力的提升进入边际递减阶段,新模型在真实业务场景中仅带来几个百分点的提升,行业工作转向工程化优化[13][14][15] - 资本投入的边际效用下降:下一次AI范式突破属于极少数顶尖科学家团队,依赖正确的问题和新的方法,而非无限堆砌资本和算力[17] - Scaling Laws可能已结束:这意味着资源分配应转向将现有技术嵌入业务、做工程化闭环,同时模型能力增量的稳定化反而为应用落地带来了更明确的窗口期[18] AI商业化落地的路径与机会 - 落地重心在于产业流程:真正的战场不是聊天机器人,而是潜入电力、能源、制造等重行业,替代企业内80%重复、高频、规则与判断聚合的脑力工作[5][9] - 核心价值是“隐性经验”的结构化复制:通过访谈专家、解读过程文档,将老师傅等一线人员的经验逻辑转化为大模型可理解的结构化知识,构建可规模复制的“数字专家”系统[25][27][32] - 应用场景广泛且可规模化:以电网故障研判为例,一个变压器可能有100个场景,一个变电站可能有1000个,国家电网有约十万一线检测员工,类似场景在各行业大量存在,且解决方案的边际复制成本趋近于零[29][32] 对行业生态与参与者的影响 - 人才需求转变:最稀缺的是既懂业务又理解模型能力边界的工程应用型人才,而非纯算法工程师,这类人才能将AI能力嵌入任务流程[33][35] - To B生态可能重塑:大型企业可能内化大部分外部开发能力,未来能存活的服务商主要是掌握行业Know-how或有数据积累的公司[37][38] - 垂直Agent存在价值:垂直大模型性价比低,但垂直Agent作为“最后一公里”的解决方案,通过将碎片化行业规则转化为可调用的指令流程而具有商业价值[39] 中美AI发展路径的差异 - 中国路径:受算力限制(如某大厂仅5000张卡),且更务实强调系统性落地,将AI深入生产核心环节(排产、工艺、供应链),国企愿意为长期效率进行前期投入[41][43][45] - 美国路径:自下而上,聚焦于法律、财务等边界清晰、易验证和变现的商业场景工具化产品[44] - 结果差异:中国公司选择深入产业现场解决具体问题以沉淀通用能力,而美国公司更多走向快速变现的产品[45]
DeepSeek前骨干罗福莉C位亮相小米,曾网传雷军千万年薪挖她
程序员的那些事· 2025-11-13 11:24
罗福莉加入小米事件 - 罗福莉于11月12日首次官方宣布加入小米,担任MiMo团队负责人[1][3] - 罗福莉在X平台上高调宣布正式加入小米,出任MiMo团队负责人[3] - 此次任命标志着此前约一年的传闻最终落地[5] 小米的AI战略方向 - 小米在汽车业务步入正轨后,宣布将全力进军AI的深水区[9] - 小米AI的目标是推动智能从语言世界走向物理世界,解锁多模态的空间智能[4] - 空间智能被定义为具备感知、推理、生成与行动的能力,是实现通用人工智能(AGI)的关键一步[4][24] - 小米MiMo团队致力于推动空间智能发展,这与公司拥有的“人、车、家全生态”场景天然适配[24][26] 事件时间线与背景 - 2023年12月25日,DeepSeek-V3版本上线并宣布全面开源[6] - 2023年12月26日,媒体曝出小米正在组建GPU万卡集群[7] - 2023年12月31日,雷军在跨年直播中公开披露小米在AI方面的野心[8] - 坊间传闻雷军以千万年薪挖角DeepSeek核心开发者罗福莉[10] - 上个月,小米AI团队论文作者栏已出现罗福莉名字,但标注为“独立研究者”[11] 罗福莉的专业背景 - 罗福莉本科毕业于北京师范大学计算机专业,硕士就读于北京大学计算语言学[15] - 曾任职阿里巴巴达摩院机器智能实验室研究员,负责开发多语言预训练模型VECO并推动AliceMind项目开源[17] - 2022年加入DeepSeek母公司幻方量化,后担任DeepSeek的深度学习研究员,参与研发DeepSeek-V2等模型[17] - 学术论文总引用次数超过1.1万次,仅2024年就新增约八千次引用[18] - 在DeepSeek最新的Nature封面论文中,罗福莉名列作者之一[20] MiMo团队与空间智能 - 小米MiMo是公司推进大模型研发的核心招牌[24] - 空间智能概念旨在打通信息AI和物理AI,实现比特世界和原子世界的智能贯通[26] - AI教母李飞飞于11月10日发表万字长文,首次系统阐释“空间智能”概念及其对具身智能和AGI的意义[25] - 罗福莉作为独立研究员时,已在小米MiMo论文成果中起到承接作用,连接小米和北大团队[23]
罗福莉C位亮相小米,离职DeepSeek后首次官宣
36氪· 2025-11-13 10:26
公司核心人事任命 - 罗福莉于11月12日正式官宣加入小米,出任MiMo团队负责人[1] - 罗福莉此前为DeepSeek核心开发者,坊间传闻小米以千万年薪将其挖角[4][7] - 罗福莉学术背景深厚,论文总引用次数超过1.1万次,今年新增约八千次引用[13][17] 公司AI战略方向 - 小米MiMo团队明确剑指空间智能,旨在实现从语言世界到物理世界的智能进化[3][23] - 空间智能被定义为具备感知、推理、生成与行动的能力,是实现通用人工智能的关键一步[4][23] - 雷军在跨年直播中披露,汽车业务步入正轨后,公司将全力进军AI深水区[7] - 小米AI战略与公司人、车、家全生态场景天然适配[25] 公司技术布局时间线 - 2023年12月25日DeepSeek-V3上线并开源,次日媒体曝出小米正在组建GPU万卡集群[5][6] - 2023年底传闻雷军挖角罗福莉,上月小米AI论文作者栏已出现罗福莉以独立研究员身份署名[7][8] - 罗福莉在小米最新MiMo论文中起到承接作用,连接小米与北大团队,通讯作者为其北大恩师[21]
热搜第一!“AI才女”官宣
中国基金报· 2025-11-12 10:46
罗福莉职业背景与成就 - 罗福莉为95后 本科毕业于北京师范大学计算机专业 硕士毕业于北京大学计算语言学专业 [3] - 2019年在国际顶级会议ACL上发表8篇论文 其中2篇为第一作者 [3] - 职业生涯始于阿里巴巴达摩院 主导开发多语言预训练模型VECO并推动AliceMind开源 [3] - 2022年加入幻方量化从事深度学习策略建模和算法研究 后加入DeepSeek担任深度学习研究员 参与研发MoE大模型DeepSeek-V2 [3] - 2024年5月曾评价DeepSeek-V2模型中文水平处于国内外闭源模型第一梯队 价格仅为GPT4的1/100 [3] 罗福莉加入小米及其影响 - 2025年11月12日 罗福莉通过朋友圈宣布加入小米 致力于构建从语言迈向物理世界的AGI [1] - 2024年底网传小米创始人雷军以千万年薪邀请其担任小米AI实验室大模型团队负责人 2025年2月从DeepSeek离职 [3] - 业内人士分析认为 罗福莉的加盟意味着小米在向物理世界的智能迈进 AGI领域投入和研究力量将显著增强 [4] - 2024年10月 小米AI团队与北京大学联合发布的聚焦MoE与强化学习的论文中出现了罗福莉的名字 被视为其加入小米后的首个公开研究成果 [4] - 2025年9月 罗福莉的知乎账号赞同了小米语音大模型开源的相关话题 [7] 小米在AI领域的战略与进展 - 公司正在积极搭建自己的GPU万卡集群 以加大对AI大模型的投入力度 雷军在计划中扮演重要领导角色 [4] - 雷军高度重视AI硬件 认为手机是AI硬件领域的核心 公司必须全力以赴 [4] - 2023年4月成立AI实验室大模型团队 栾剑为大模型团队负责人 [7] - 2025年4月开源首个推理大模型Xiaomi MiMo 并公开新成立的小米大模型Core团队 [7] - 2025年9月宣布开源首个原生端到端语音大模型Xiaomi-MiMo-Audio 基于创新预训练架构和上亿小时训练数据 首次在语音领域实现基于ICL的少样本泛化 [7]
“雷军千万年薪招揽”?前DeepSeek研究员罗福莉宣布加入小米
新华网财经· 2025-11-12 10:44
罗福莉职业变动与行业影响 - 前DeepSeek研究员罗福莉正式宣布加入小米公司,并加入其首个推理大模型Xiaomi MiMo团队[2] - 罗福莉在朋友圈表示,团队致力于构建从语言迈向物理世界的AGI(通用人工智能)[2] - 此前有传闻称小米创始人雷军曾希望以千万年薪挖角罗福莉,邀请其带领AI大模型团队,该消息一度登上社交平台热搜[2] 罗福莉个人背景与专业成就 - 罗福莉1995年出生于四川宜宾,本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所计算语言学专业[4] - 求学期间,她于2019年在人工智能领域顶级国际会议ACL上发表了8篇论文,其中2篇为第一作者[4] - 职业生涯始于阿里巴巴达摩院,主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作[4] - 2022年加入DeepSeek母公司幻方量化从事深度学习相关工作,后担任DeepSeek的深度学习研究员,参与研发DeepSeek-V2等模型[4] 小米AI战略布局 - 小米在2023年4月成立了AI实验室大模型团队,栾剑为大模型团队负责人[4] - 2024年4月30日,小米开源其首个推理大模型Xiaomi MiMo,同时公开了此前未露面的小米大模型Core团队[4] - 小米方面称MiMo是新成立不久的小米大模型Core团队的初步尝试[4]
前DeepSeek研究员罗福莉官宣加入小米,曾传雷军千万年薪挖角
搜狐财经· 2025-11-12 08:46
公司人事变动 - 前DeepSeek研究员罗福莉正式官宣加入小米 参与Xiaomi MiMo推理大模型的研发工作[1] - 罗福莉拥有北京师范大学计算机本科及北京大学计算语言学硕士学位 2019年在人工智能顶级会议ACL发表8篇论文其中2篇为第一作者[3] - 其职业生涯始于阿里巴巴达摩院 主导开发多语言预训练模型VECO并推动AliceMind开源 后加入幻方量化及DeepSeek参与研发DeepSeek-V2等模型[3] 公司技术战略 - 小米首个推理大模型Xiaomi MiMo致力于构建从语言迈向物理世界的AGI未来[1] - 罗福莉此前曾因“雷军千万年薪挖角”传闻引发广泛关注 消息一度登上社交平台热搜[3]
“95后AI才女”罗福莉官宣加入小米,此前是DeepSeek研究员,曾被雷军千万年薪挖角
搜狐财经· 2025-11-12 08:18
核心人事变动 - 前DeepSeek研究员、AI领域关键人才罗福莉正式加入小米,担任Xiaomi MiMo团队研究员[1][2] - 罗福莉被业内称为95后AI“天才少女”,是爆火大模型DeepSeek-V2的关键开发者之一[2] - 小米创始人雷军此前已开出千万元年薪招聘罗福莉,以领导小米AI大模型团队[3] 公司AI战略与投入 - 小米正积极搭建自有GPU万卡集群,以加大对AI大模型的投入力度[3] - 小米大模型团队在成立之初已拥有6500张GPU资源,万卡集群计划已实施数月,雷军在其中扮演重要领导角色[3] - 公司高度重视AI硬件,认为手机是AI硬件领域的核心,必须全力以赴[3] 技术进展与成果 - 小米首个推理大模型Xiaomi MiMo已于今年4月开源,是公司为推理而生的大模型[3][7] - 在公开测评中,MiMo仅用7B参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen-32B-Preview开源模型[8] - 2024年10月,小米AI团队与北京大学联合发布了聚焦MoE与强化学习的论文,罗福莉已作为作者参与[2] - Xiaomi MiMo是全新成立的小米大模型Core团队的初步尝试,团队认为AGI征途漫长,将从务实创新出发进行探索[8] 人才背景与行业影响 - 罗福莉拥有北京师范大学计算机本科和北京大学计算语言学硕士学位,曾在阿里达摩院、幻方量化和DeepSeek从事AI研究与开发[2][3] - 其在阿里达摩院负责AliceMind开源项目,主导开发了多语言预训练模型VECO,具备丰富的行业经验[3] - 罗福莉加入小米,回应了其朋友圈所述“智能终将从语言迈向物理世界”的愿景,致力于与团队构建AGI未来[2]
罗福莉C位亮相小米,离职DeepSeek后首次官宣
量子位· 2025-11-12 08:01
罗福莉加入小米事件 - 罗福莉正式官宣加入小米,出任MiMo团队负责人 [1][7] - 该传闻始于2024年底,称雷军以千万年薪挖角DeepSeek核心开发者罗福莉 [4][10] - 2024年12月,小米AI团队论文作者栏已出现罗福莉名字,但当时身份为“独立研究者” [11] 罗福莉背景与影响力 - 罗福莉拥有北京师范大学计算机本科和北京大学计算语言学硕士背景,曾在阿里巴巴达摩院和DeepSeek任职 [15][17] - 其学术论文总引用次数超过11,000次,仅2024年一年内就新增约8,000次引用 [18] - 她参与了DeepSeek-V2等模型的研发,其名字也出现在DeepSeek最新的Nature封面论文中 [17][19] 小米的AI战略方向 - 在汽车业务步入正轨后,小米宣布将全力进军AI深水区 [9] - 2024年12月26日,媒体曝出小米正在组建GPU万卡集群 [6] - 雷军在跨年直播中公开披露了小米在AI方面的野心 [8] MiMo团队与空间智能技术 - 罗福莉领导的MiMo团队是小米推进大模型研发的核心招牌,目标指向空间智能 [23] - 空间智能旨在从语言世界走向物理世界,具备感知、推理、生成与行动的能力,是实现通用人工智能的关键一步 [3][23] - 该技术理念与小米拥有的“人、车、家全生态”场景天然适配 [25]