反超Nano Banana！OpenAI旗舰图像生成模型上线

模型发布与核心定位 - OpenAI正式发布了憋了大半年的旗舰级图像生成模型GPT-Image-1.5，旨在全面对标谷歌的Nano Banana [2][13] - 该模型的核心产品理念是提升“实用性”，主要亮点包括更严谨的指令遵循、精确编辑、细节保留以及生成速度比以前快4倍 [3][5][14] - 模型已全面开放，将在ChatGPT中面向所有用户推出，并在API中作为GPT Image 1.5推出 [12][38] 核心性能与功能改进 - 在图像编辑方面，模型对指令的遵循更加严谨，能确保光照、构图、人物外观等关键要素在输入、输出及多轮编辑中保持高度一致 [15] - 图像生成的真实感有明显提升，例如在生成特定年代和场景的逼真照片时，新模型效果显著优于旧模型 [21] - 文本渲染能力进步明显，能够处理更密集、更小字号的文字，甚至可以生成类似技术报告的内容 [28] - 在创意任务中，模型能够稳定保留关键信息与人物特征，例如根据人物图片制作特定风格的好莱坞电影海报 [23][26] 市场表现与基准测试 - 根据评测机构Artificial Analysis的数据，GPT-Image-1.5在文本转图像和图像编辑的排行榜中均位列第一，超过谷歌的Nano Banana Pro [33] - 在文本转图像榜单中，GPT Image 1.5的ELO评分为1,273分；在图像编辑榜单中，其ELO评分为1,260分 [34] - 在更强调精细化图像编辑能力的GenAI Image Editing Showdown中，该模型虽未反超谷歌，但其指令遵守率高达90%，断层式领先 [34][35] 商业化与定价策略 - 公司采取了“精细编辑+降价”的策略，意图将图像功能推向生产力工具 [41] - GPT-Image-1.5的API定价相较上一代GPT Image 1，输入与输出成本整体下降了20% [39] - 具体价格因分辨率而异，生成高质量图像的成本约为每千张133美元，低质量图像约为每千张9美元 [40] 行业竞争与市场反馈 - 模型发布被视作对谷歌Nano Banana的正面回应，行业竞争加剧 [13] - 尽管性能领先，但有行业人士指出，GPT-Image-1.5在“理解世界”的层面似乎仍不如Nano Banana，后者被认为更像一个世界模型 [45][46][47] - OpenAI高管Sebastien Bubeck亲自为模型站台，并对部分质疑进行了回应 [42][46]