ChatGPT图像功能大升级

OpenAI图像生成模型升级 - 推出新版ChatGPT图像功能图像生成质量更好生成速度更快图像编辑精确性迎来重要进步 [1] - 基于最新旗舰图像生成模型的ChatGPT图像功能能够在保持细节完整的同时进行精确编辑更有可能呈现出用户希望看到的效果 [4] - 生成速度提升至多4倍 [4] 新模型核心功能与演示 - 新模型擅长多种类型的精确编辑包括添加删除合并混合和转置在获取修图效果的同时保留图片本身的特点 [4] - 演示案例包括将90年代末洛杉矶街头摄影中人物的衬衫改成红色帽子改成黄色限速改为15 卡车改成消防车 [5] - 演示案例包括在图像左侧加一群观看的人右侧人行道上栖着一只鹰远处有一只飞船在天空中飞过 [5] - 演示案例包括生成带有该图像全包印花的T恤挂在晾衣绳上 [7] - 演示案例包括将那件T恤给穿到滑板手身上 [9] - 在创造性改造现有图片方面有进步例如将公司CEO奥尔特曼的个人照转换成美国80年代的健美操教练或把他的脸放进世界名画《戴珍珠耳环的少女》中 [12] 文本生成与多语言能力 - 该模型在文本呈现上更进一步能够处理更密集更小的文字向谷歌的传统优势项目生成富含文字信息的示意图发起挑战 [11] - 新模型在生成中文阿拉伯语希伯来语方面仍存在局限性 [13] - 在中文文字图像生成方面 Nano Banana依然是彻底碾压ChatGPT的存在 [14] 成本与定价 - 新图像生成模型更强也更便宜了与GPT Image 1相比升级后的GPT Image 1.5图像输入和输出成本均降低20% [16] GPT-5.2模型发布 - OpenAI宣布推出GPT-5.2 这是迄今为止最先进的用于专业工作和长期运行智能体的前沿模型系列 [13] - 平均ChatGPT Enterprise用户表示AI每天为他们节省40-60分钟重度用户表示每周节省超过10小时 [13] - GPT-5.2在创建电子表格构建演示文稿编写代码感知图像理解长上下文使用工具以及处理复杂多步骤项目方面表现更好 [13] - GPT-5.2在许多基准测试中创造了新的技术水平在GDPval基准测试中在涵盖44个职业的明确知识工作任务上表现优于行业专业人士 [13] GPT-5.2基准测试表现 - 在GDPval知识工作任务基准测试中 GPT-5.2 Thinking取得70.9%的成绩 GPT-5.1 Thinking为38.8% [13] - 在SWE-Bench Pro软件工程基准测试中 GPT-5.2取得55.6%的成绩 GPT-5.1为50.8% [13] - 在SWE-bench Verified软件工程基准测试中 GPT-5.2取得80.0%的成绩 GPT-5.1为76.3% [13] - 在GPQA Diamond科学问题基准测试中 GPT-5.2取得92.4%的成绩 GPT-5.1为88.1% [13] - 在CharXiv Reasoning科学图表问题基准测试中 GPT-5.2取得88.7%的成绩 GPT-5.1为80.3% [13] - 在AIME 2025竞赛数学基准测试中 GPT-5.2取得100.0%的成绩 GPT-5.1为94.0% [13] - 在FrontierMath高级数学基准测试中 GPT-5.2在Tier 1-3取得40.3%的成绩 GPT-5.1为31.0% 在Tier 4取得14.6%的成绩 GPT-5.1为12.5% [13] - 在ARC-AGI抽象推理基准测试中 GPT-5.2在ARC-AGI-1取得86.2%的成绩 GPT-5.1为72.8% 在ARC-AGI-2取得52.9%的成绩 GPT-5.1为17.6% [13] 合作伙伴反馈与模型部署 - Notion Box Shopify Harvey和Zoom观察到GPT-5.2展示了最先进的长视野推理和工具调用性能 [13] - Databricks Hex和Triple Whale发现GPT-5.2在智能体数据科学和文档分析任务方面表现卓越 [13] - Cognition Warp Charlie Labs JetBrains和Augment Code报告GPT-5.2提供了最先进的智能体编码性能在交互式编码代码审查和错误查找等领域有显著改进 [13] - 在ChatGPT中 GPT-5.2 Instant Thinking和Pro版本将于今日开始向付费计划用户逐步推出 [13] - 在API中这些模型现已向所有开发者开放 [13] - 总体而言 GPT-5.2在通用智能长上下文理解智能体工具调用和视觉方面带来显著改进使其在执行复杂的端到端现实任务方面优于以往任何模型 [13]