时隔两月，Mistral AI终于上新Medium 3，近期还有「One more thing」

Mistral AI发布Mistral Medium 3模型 - Mistral AI推出Mistral Medium 3模型，性能介于轻量级和大规模模型之间，在关键基准测试中优于GPT-4o和Claude 3.7 Sonnet [2] - 该模型未开源，可通过Mistral官网、API及合作伙伴平台使用，即将登陆亚马逊云科技Sagemaker、微软Azure AI Foundry和谷歌Vertex AI平台 [2] - 模型专为企业设计，性能达到Claude 3.7 Sonnet的90%以上，但成本仅为后者的1/8，输入每百万token仅需0.4美元，输出每百万token仅需2美元 [2] Mistral Medium 3性能表现 - 在HumanEval和MultiPL-E等编程测试中表现与Claude 3.7 Sonnet和GPT-4o不相上下甚至更优 [5] - 在Math500 Instruct 0-shot测试中得分91.0%，高于GPT-4o的76.4%和Claude 3.7 Sonnet的83.0% [6] - 在多模态任务中表现出色，DocVQA得分0.953，AI2D得分0.937，ChartQA得分0.826 [6] - 在第三方人工评测中，82%编程场景优于Llama 4 Maverick，70%案例超过Command-A [7] 多语言和企业应用能力 - 在英语(67%)、法语(71%)、西班牙语(73%)和阿拉伯语(65%)中表现优于Llama 4 Maverick [8] - 针对企业整合优化，支持混合部署和本地部署，已在金融服务、能源和医疗保健等行业测试应用 [8] Le Chat Enterprise发布 - Mistral推出面向企业的聊天机器人服务Le Chat Enterprise，现已全面上市 [10][11] - 提供AI智能体构建器等工具，集成Gmail、Google Drive和SharePoint等第三方服务 [13] - 即将支持MCP标准，实现AI助手与数据系统的连接 [13] 未来产品规划 - 公司预告将在未来几周内发布一款"大型"产品，性能将远超现有旗舰开源型号 [3]