谷歌发布图像生成模型Gemini 2.5 Flash Image：多方面优于GPT-4o

产品发布 - 谷歌DeepMind正式推出最先进的图像生成与编辑模型Gemini 2.5 Flash Image [1] - 该模型可根据文字指令在保持人物与动物外观一致的情况下提高修改图片精度 [1] - 支持通过文本提示进行精确局部编辑包括模糊背景去除瑕疵添加颜色或擦除整个物体 [1] 技术优势 - 与原生图像生成工具相比根据文字进行图像修改的准确率更高 [1] - 在多项任务中优于ChatGPT所用的GPT-4o模型特别是在编辑图像时能根据文字提示进行编辑 [1] - 支持一次融合最多三张图像 [1] 商业化进展 - 用户可通过Gemini App和API方式访问该模型 [1] - API定价为每百万输出token 30美元单张图像成本约0.039美元 [1]