Mistral的首个强推理模型：拥抱开源，推理速度快10倍

模型发布 - 欧洲人工智能公司Mistral AI发布全新大语言模型系列Magistral，具备强大推理能力，可解决复杂任务[3][4] - 发布两个版本：专有模型Magistral Medium（企业客户）和开源模型Magistral Small（24B参数，Apache 2.0许可）[5] - 开源版本可自由商用，专有版本通过Le Chat界面和La Plateforme API访问[5] 性能表现 - Magistral Medium在AIME2024基准测试中得分73.6%（多数投票64%，最高90%），Small版本得分70.7%和83.3%[6] - 在GPQA Diamond（研究生级问答）和LiveCodeBench（编程挑战）等高要求测试中表现优异[7] - 编程能力突出，单次生成代码即可模拟重力、摩擦力等物理现象[10] - 支持多语言高保真推理（英语、法语、西班牙语、德语、意大利语、阿拉伯语、俄语、中文等）[11] 技术突破 - 采用自研可扩展强化学习流水线，完全依赖自有模型和基础设施[15] - 文本强化学习保持多模态理解能力，核心设计原则为"用户语言推理"[16] - 通过fastText分类器实现语言一致性奖励机制，减少混合语言输出[16][17] - 系统提示优化（如"尽可能随意/长"）显著提升模型探索能力[18] - Flash Answers技术实现10倍于竞品的token吞吐量，支持实时推理[14] 商业化进展 - 专有模型定价为输入2美元/百万token、输出5美元/百万token，较前代Mistral Medium 3（输入0.4美元、输出2美元）大幅上涨[21] - 横向对比显示价格竞争力：输入成本低于OpenAI最新型号，与Gemini 2.5 Pro持平，输出成本显著低于竞品[22] - 即将登陆Amazon SageMaker、Azure AI、IBM WatsonX和Google Cloud Marketplace等主流云平台[20] 迭代计划 - 公司计划以Magistral为起点加速模型迭代[25]