Workflow
“小米系”暴涨!啥情况?最新发布→

小米开源大模型MiMo - 公司宣布开源首个为推理而生的大模型Xiaomi MiMo,其MiMo-7B-RL模型仅用70亿参数,在多项权威基准测试中得分超过OpenAI的o1-mini和阿里通义千问320亿参数的QwQ-32B-Preview [1][2] - 在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo-7B超越更大规模的开源推理模型 [2] - 模型性能提升源于预训练和后训练的多层组合创新,包括改进的GRPO算法、测试难度驱动的奖励机制等技术创新 [4] - MiMo-7B全系列已开源,包括预训练模型、监督微调模型和强化学习模型 [6] 技术团队与研发投入 - 小米大模型Core团队已组建3000多人的AI团队,覆盖视觉、语音、NLP等多领域技术能力 [8] - 公司搭建GPU万卡集群提升算力储备,2025年将投入70亿元以上资金用于AI研发,占总研发经费1/4 [8] - 公司以千万年薪招揽DeepSeek-V2关键开发者罗福莉领导AI大模型团队 [8] 市场反应与战略定位 - 消息公布后小米股价涨5.37%,金山云和金山软件分别大涨14.20%和7.07% [1] - 公司主攻轻量化、本地部署路线,是首个在手机芯片上跑通十亿参数规模大语言模型的企业 [9] - 战略定位是将大模型能力下放到端侧,实现隐私保护和个性化定制,与手机、汽车、AIoT等业务深度协同 [9] 行业趋势 - 行业从盲目追求参数规模转向注重算法效率和能力密度,小模型可实现"性价比革命" [6] - Meta、字节、小米等巨头布局端侧AI,AI嵌入将带来广泛的硬件升级,重点关注算力、存储等硬件环节 [10]