产品发布概述 - Mistral AI发布新一代开放模型Mistral 3系列 包括多个模型 所有模型均采用Apache 2.0许可证发布[4] - 该系列模型发布标志着欧洲重返由中美主导的AI竞赛[4] - 公司声称Ministral模型代表同类产品中最佳性价比 Mistral Large 3跻身前沿指令微调开源模型行列[4] Mistral Large 3模型详情 - Mistral Large 3是混合专家模型 总参数量675B 激活参数41B 在3000台NVIDIA H200 GPU上从头训练[5][7] - 该模型在通用提示词上达到与市场最好指令微调开放权重模型同等水平 具备图像理解能力 在多语言对话中表现一流[7] - 在LMArena排行榜的OSS非推理模型类别中首次亮相即排名第2 在所有开放模型中排名第6[14] - 模型还有推理版本即将推出[16] Ministral 3模型详情 - Ministral 3系列针对边缘和本地用例 提供3B 8B和14B参数三种尺寸[19] - 每种尺寸均发布基础版 指令版和推理版变体 全部具备图像理解能力且采用Apache 2.0许可证[19] - 公司强调Ministral 3实现所有开源模型中最佳性价比 其指令模型性能相当或更好 同时生成token数量通常少一个数量级[22] - Ministral推理变体14B版本在AIME '25上达到85%准确率[23] 合作伙伴与部署优化 - Mistral与NVIDIA vLLM和Red Hat合作 提供更快更易用的Mistral 3[17] - 发布采用NVFP4格式的检查点 可使用vLLM在Blackwell NVL72系统及单个8×A100或8×H100节点上高效运行Mistral Large 3[17] - 所有新Mistral 3模型在NVIDIA Hopper GPU上训练 利用HBM3e内存处理前沿规模工作负载[17] - NVIDIA为DGX Spark RTX PC笔记本电脑及Jetson设备提供Ministral模型优化部署方案[18] 平台可用性与定制服务 - Mistral 3即日起可在Mistral AI Studio Amazon Bedrock Azure Foundry Hugging Face等平台使用 即将在NVIDIA NIM和AWS SageMaker上线[25] - 公司提供定制模型训练服务 为组织微调或完全适配模型以满足特定需求 确保企业级部署的AI解决方案安全高效[27] 战略背景分析 - Mistral此次全线回归Apache 2.0协议 被视为对DeepSeek激进开源策略的战略调整[28] - 发布可看作公司对DeepSeek的正面追赶 通过在MoE架构上深耕和端侧模型差异化优势 在中美巨头挤压中寻找机会[28]
刚刚,「欧洲的DeepSeek」发布Mistral 3系列模型,全线回归Apache 2.0
机器之心·2025-12-03 00:06