模型发布与核心定位 - OpenAI正式发布了憋了大半年的旗舰级图像生成模型GPT-Image-1.5,旨在全面对标谷歌的Nano Banana [2][13] - 该模型的核心产品理念是提升“实用性”,主要亮点包括更严谨的指令遵循、精确编辑、细节保留以及生成速度比以前快4倍 [3][5][14] - 模型已全面开放,将在ChatGPT中面向所有用户推出,并在API中作为GPT Image 1.5推出 [12][38] 核心性能与功能改进 - 在图像编辑方面,模型对指令的遵循更加严谨,能确保光照、构图、人物外观等关键要素在输入、输出及多轮编辑中保持高度一致 [15] - 图像生成的真实感有明显提升,例如在生成特定年代和场景的逼真照片时,新模型效果显著优于旧模型 [21] - 文本渲染能力进步明显,能够处理更密集、更小字号的文字,甚至可以生成类似技术报告的内容 [28] - 在创意任务中,模型能够稳定保留关键信息与人物特征,例如根据人物图片制作特定风格的好莱坞电影海报 [23][26] 市场表现与基准测试 - 根据评测机构Artificial Analysis的数据,GPT-Image-1.5在文本转图像和图像编辑的排行榜中均位列第一,超过谷歌的Nano Banana Pro [33] - 在文本转图像榜单中,GPT Image 1.5的ELO评分为1,273分;在图像编辑榜单中,其ELO评分为1,260分 [34] - 在更强调精细化图像编辑能力的GenAI Image Editing Showdown中,该模型虽未反超谷歌,但其指令遵守率高达90%,断层式领先 [34][35] 商业化与定价策略 - 公司采取了“精细编辑+降价”的策略,意图将图像功能推向生产力工具 [41] - GPT-Image-1.5的API定价相较上一代GPT Image 1,输入与输出成本整体下降了20% [39] - 具体价格因分辨率而异,生成高质量图像的成本约为每千张133美元,低质量图像约为每千张9美元 [40] 行业竞争与市场反馈 - 模型发布被视作对谷歌Nano Banana的正面回应,行业竞争加剧 [13] - 尽管性能领先,但有行业人士指出,GPT-Image-1.5在“理解世界”的层面似乎仍不如Nano Banana,后者被认为更像一个世界模型 [45][46][47] - OpenAI高管Sebastien Bubeck亲自为模型站台,并对部分质疑进行了回应 [42][46]
反超Nano Banana!OpenAI旗舰图像生成模型上线
量子位·2025-12-17 01:04