Workflow
时隔两月,Mistral AI终于上新Medium 3,近期还有「One more thing」
机器之心·2025-05-08 05:51

Mistral AI发布Mistral Medium 3模型 - Mistral AI推出Mistral Medium 3模型,性能介于轻量级和大规模模型之间,在关键基准测试中优于GPT-4o和Claude 3.7 Sonnet [2] - 该模型未开源,可通过Mistral官网、API及合作伙伴平台使用,即将登陆亚马逊云科技Sagemaker、微软Azure AI Foundry和谷歌Vertex AI平台 [2] - 模型专为企业设计,性能达到Claude 3.7 Sonnet的90%以上,但成本仅为后者的1/8,输入每百万token仅需0.4美元,输出每百万token仅需2美元 [2] Mistral Medium 3性能表现 - 在HumanEval和MultiPL-E等编程测试中表现与Claude 3.7 Sonnet和GPT-4o不相上下甚至更优 [5] - 在Math500 Instruct 0-shot测试中得分91.0%,高于GPT-4o的76.4%和Claude 3.7 Sonnet的83.0% [6] - 在多模态任务中表现出色,DocVQA得分0.953,AI2D得分0.937,ChartQA得分0.826 [6] - 在第三方人工评测中,82%编程场景优于Llama 4 Maverick,70%案例超过Command-A [7] 多语言和企业应用能力 - 在英语(67%)、法语(71%)、西班牙语(73%)和阿拉伯语(65%)中表现优于Llama 4 Maverick [8] - 针对企业整合优化,支持混合部署和本地部署,已在金融服务、能源和医疗保健等行业测试应用 [8] Le Chat Enterprise发布 - Mistral推出面向企业的聊天机器人服务Le Chat Enterprise,现已全面上市 [10][11] - 提供AI智能体构建器等工具,集成Gmail、Google Drive和SharePoint等第三方服务 [13] - 即将支持MCP标准,实现AI助手与数据系统的连接 [13] 未来产品规划 - 公司预告将在未来几周内发布一款"大型"产品,性能将远超现有旗舰开源型号 [3]