OpenAI图像生成模型升级 - 推出新版ChatGPT图像功能 图像生成质量更好 生成速度更快 图像编辑精确性迎来重要进步 [1] - 基于最新旗舰图像生成模型的ChatGPT图像功能 能够在保持细节完整的同时进行精确编辑 更有可能呈现出用户希望看到的效果 [4] - 生成速度提升至多4倍 [4] 新模型核心功能与演示 - 新模型擅长多种类型的精确编辑 包括添加 删除 合并 混合和转置 在获取修图效果的同时 保留图片本身的特点 [4] - 演示案例包括将90年代末洛杉矶街头摄影中人物的衬衫改成红色 帽子改成黄色 限速改为15 卡车改成消防车 [5] - 演示案例包括在图像左侧加一群观看的人 右侧人行道上栖着一只鹰 远处有一只飞船在天空中飞过 [5] - 演示案例包括生成带有该图像全包印花的T恤挂在晾衣绳上 [7] - 演示案例包括将那件T恤给穿到滑板手身上 [9] - 在创造性改造现有图片方面有进步 例如将公司CEO奥尔特曼的个人照转换成美国80年代的健美操教练 或把他的脸放进世界名画《戴珍珠耳环的少女》中 [12] 文本生成与多语言能力 - 该模型在文本呈现上更进一步 能够处理更密集 更小的文字 向谷歌的传统优势项目生成富含文字信息的示意图发起挑战 [11] - 新模型在生成中文 阿拉伯语 希伯来语方面仍存在局限性 [13] - 在中文文字图像生成方面 Nano Banana依然是彻底碾压ChatGPT的存在 [14] 成本与定价 - 新图像生成模型更强 也更便宜了 与GPT Image 1相比 升级后的GPT Image 1.5图像输入和输出成本均降低20% [16] GPT-5.2模型发布 - OpenAI宣布推出GPT-5.2 这是迄今为止最先进的用于专业工作和长期运行智能体的前沿模型系列 [13] - 平均ChatGPT Enterprise用户表示AI每天为他们节省40-60分钟 重度用户表示每周节省超过10小时 [13] - GPT-5.2在创建电子表格 构建演示文稿 编写代码 感知图像 理解长上下文 使用工具以及处理复杂多步骤项目方面表现更好 [13] - GPT-5.2在许多基准测试中创造了新的技术水平 在GDPval基准测试中 在涵盖44个职业的明确知识工作任务上表现优于行业专业人士 [13] GPT-5.2基准测试表现 - 在GDPval知识工作任务基准测试中 GPT-5.2 Thinking取得70.9%的成绩 GPT-5.1 Thinking为38.8% [13] - 在SWE-Bench Pro软件工程基准测试中 GPT-5.2取得55.6%的成绩 GPT-5.1为50.8% [13] - 在SWE-bench Verified软件工程基准测试中 GPT-5.2取得80.0%的成绩 GPT-5.1为76.3% [13] - 在GPQA Diamond科学问题基准测试中 GPT-5.2取得92.4%的成绩 GPT-5.1为88.1% [13] - 在CharXiv Reasoning科学图表问题基准测试中 GPT-5.2取得88.7%的成绩 GPT-5.1为80.3% [13] - 在AIME 2025竞赛数学基准测试中 GPT-5.2取得100.0%的成绩 GPT-5.1为94.0% [13] - 在FrontierMath高级数学基准测试中 GPT-5.2在Tier 1-3取得40.3%的成绩 GPT-5.1为31.0% 在Tier 4取得14.6%的成绩 GPT-5.1为12.5% [13] - 在ARC-AGI抽象推理基准测试中 GPT-5.2在ARC-AGI-1取得86.2%的成绩 GPT-5.1为72.8% 在ARC-AGI-2取得52.9%的成绩 GPT-5.1为17.6% [13] 合作伙伴反馈与模型部署 - Notion Box Shopify Harvey和Zoom观察到GPT-5.2展示了最先进的长视野推理和工具调用性能 [13] - Databricks Hex和Triple Whale发现GPT-5.2在智能体数据科学和文档分析任务方面表现卓越 [13] - Cognition Warp Charlie Labs JetBrains和Augment Code报告GPT-5.2提供了最先进的智能体编码性能 在交互式编码 代码审查和错误查找等领域有显著改进 [13] - 在ChatGPT中 GPT-5.2 Instant Thinking和Pro版本将于今日开始向付费计划用户逐步推出 [13] - 在API中 这些模型现已向所有开发者开放 [13] - 总体而言 GPT-5.2在通用智能 长上下文理解 智能体工具调用和视觉方面带来显著改进 使其在执行复杂的端到端现实任务方面优于以往任何模型 [13]
ChatGPT图像功能大升级