产品发布与核心升级 - OpenAI正式推出最新图像视觉模型GPT-Image-1.5,这是继GPT-5.2之后红色警报计划中的又一重要产品 [1] - 模型核心升级在于“精准编辑”,能够准确理解并执行对图像特定部分的修改指令,保持光线、构图、人物特征在编辑闭环中的一致性 [3] - 模型生成速度比之前版本快4倍 [1] 技术能力与性能表现 - 模型能够理解画面结构,在复杂编辑中保持逻辑,例如将多个元素合成到特定风格照片中并进行一系列连贯修改 [5] - 具备强大的指令遵循能力,能处理复杂细致的排列要求,例如按要求布置6x6网格图的内容 [17] - 文本渲染能力提升,能更好地处理密集、小字体内容,并可将Markdown格式内容呈现为自然的报纸文章布局 [19] - 具备将线稿转换为真实图片的基础能力 [18] - 在物体知识储备上表现在线,例如能准确生成展示“往水中加盐后鸡蛋状态”的图片 [26][29] - 有观点认为其生成效果大致达到竞争对手Nano Banana Pro的“专业级”水准,但在“智商/推理能力”上明显落后,尤其在数学、物理类问题上表现更差 [30] 产品集成与用户体验 - OpenAI在ChatGPT中开辟了专属的图像创作入口,网页和移动端侧边栏均可访问,内置预设滤镜和热门提示词并定期更新 [32] - 用户上传一次肖像后,可生成多张包含该肖像的图片,无需反复喂图 [32] - 当用户要求生成预设方案时,OpenAI会公开预设的提示词 [37] - 提供了制作贺卡、创建专辑封面、修复老照片、拍摄专业求职照片等实用预设方案 [39] - 公司CEO表示ChatGPT正从以文本为核心的产品,向更直观、贴合多任务需求的多模态工具转变,图像创作入口的设立是为了提供更专业的视觉创意环境 [41] 商业模式与定价 - 开发者可通过API使用GPT-Image-1.5,相比前代具备更强的品牌元素与关键视觉保持能力,适合电商、品牌营销等需要生成大量变体图片的场景 [46] - 图像输入输出费用降低20%,在同样预算下可生成更多图像 [46] - 根据定价表,图像令牌(Image tokens)的输入费用为每百万令牌8.00美元,缓存输入为2.00美元,输出为32.00美元 [48] 战略合作与行业影响 - 迪士尼已宣布向OpenAI投资10亿美元并达成为期三年的授权协议,OpenAI旗下的Sora和图像生成模型将能生成迪士尼、漫威、皮克斯和星球大战旗下角色,相关功能计划在明年初上线 [49] - GPT-Image-1.5的发布标志着图像生成工具正从“玩具”向“工具”转变,通过提供后期编辑能力、控制细节和画面连贯性,解决了市面上许多AI改图工具“一改就崩”的问题 [51][52] - 公司通过更完善的图片生成预设方案及功能设置来应对竞争,专属入口、预设滤镜库等产品设计击中了普通用户追求快速上手、结果可用的痛点 [53] - 行业竞争的关键不仅在于模型能力领先,更在于如何将能力转化为好用、易用、爱用的产品 [54]
刚刚,OpenAI 版 Nano Banana 发布:奥特曼秒变性感男模|附实测
36氪·2025-12-17 00:55