Workflow
OpenAI频繁调整产品更新路线图,最新面世推理模型o3和o4-mini
第一财经·2025-04-17 04:53

产品发布与路线调整 - OpenAI于4月16日推出过渡模型o3和o4-mini 取代前代o1和o3-mini模型 [2] - 公司原计划直接推出GPT-5集成o3功能 但因整合困难推迟GPT-5发布 改为先单独推出过渡模型 [2] - 新模型面向ChatGPT Plus/Pro/Team及API用户 企业及教育用户后续开放使用 [2] 模型性能提升 - o3在困难现实任务中重大错误率比o1减少20% [3] - o3和o4-mini在AIME 2025数学测试得分88.9和92.7 显著超过o1的79.2 [3] - 代码能力测试Codeforces中o3和o4-mini分别获得2706和2719分 远超o1的1891分 [3] - o3-high和o4-mini-high代码编辑准确率达81.3%和68.9% 高于o1-high的64.4% [3] - 新模型具备视觉思考能力 可解析图表/草图并融入思维链进行推理 [3] 多模态应用案例 - o3能解析时间表图片并生成详细行程计划 确保覆盖所有景点和表演 [4][5] - 模型可分析体育新规则对比赛的影响 自动搜索资料并进行统计分析 [4] - 支持图像问答 能识别照片中最大船只名称及停靠位置等视觉信息 [4] 产品战略与成本优化 - 同步推出开源编程代理工具Codex CLI 并引入GPT-4.1系列API模型 [7] - o3在AIME 2025测试中性价比高于o1 新模型定价比o1更便宜 [7] - 公司弃用2月发布的GPT-4.5预览版 产品矩阵复杂度显著增加 [7] - 面临整合推理o系列与GPT数字系列(如GPT-4/GPT-5)的技术挑战 [1][7]