小米开源MiMo推理大模型 - 公司宣布开源首个为推理而生的大模型Xiaomi MiMo,其MiMo-7B-RL模型仅用70亿参数在多项权威基准测试中得分超过OpenAI的o1-mini和阿里通义千问320亿参数的QwQ-32B-Preview [1][3] - MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上表现优异,实现"以小博大" [3][6] - 模型性能提升源于预训练和后训练的多层组合创新,包括改进的GRPO算法、测试难度驱动的奖励机制、易数据过滤和重采样策略等技术细节 [6] - 公司已开源MiMo-7B全系列模型,包括预训练模型MiMo-7B-Base、监督微调模型MiMo-7B-SFT以及强化学习模型MiMo-7B-RL和MiMo-7B-RL-Zero [6] 技术团队与研发投入 - 模型由新成立的"小米大模型Core团队"开发,公司AI团队规模已达3000多人,覆盖视觉、语音、NLP等多领域技术能力 [6][8] - 公司以千万年薪招揽DeepSeek-V2关键开发者罗福莉领导AI大模型团队,并搭建GPU万卡集群提升算力储备 [8] - 2025年将投入70亿元以上资金用于AI研发(占总研发经费1/4),重点聚焦AI基础设施、大模型开发及应用场景搭建 [8] 市场反应与战略布局 - 消息公布后小米股价涨5.37%,关联公司金山云和金山软件分别大涨14.20%和7.07% [1] - 公司主攻轻量化、本地部署路线,是业界首个在手机芯片上跑通十亿参数规模大语言模型的企业 [9] - 战略定位为通过端侧小模型实现隐私保护与个性化定制,致力于参数效率与效果的均衡,技术能力已接入手机、汽车、AIoT等业务板块 [9] 行业影响 - 业内人士认为MiMo开源标志AI发展从追求参数规模转向注重算法效率和能力密度的理性阶段 [6] - 中信建投研报指出端侧AI将带来广泛硬件升级,Meta、字节、小米等巨头正布局AI Agent入口,重点关注算力、存储等硬件环节 [9]
“小米系”暴涨!啥情况?最新发布→