登顶苹果应用榜!谷歌火遍全网的“纳米香蕉”,凭啥击败ChatGPT?
证券时报·2025-09-16 07:54

公司市场表现与产品动态 - 谷歌市值达到3万亿美元,其AI应用Gemini在美区AppStore免费应用下载榜超越ChatGPT位列第一,并在加拿大、印度、摩洛哥等国同样登顶[1] - 谷歌DeepMind发布的新一代AI图像生成与编辑模型Gemini 2.5 Flash Image(代号Nano Banana)累计完成超2亿次图像编辑,并带动超1000万新用户尝试Gemini应用[2] - 受益于反垄断裁决结果好于预期及Nano Banana的市场表现,谷歌股价持续上涨,花旗集团将谷歌母公司Alphabet目标价从225美元上调至280美元[7] 产品技术优势分析 - Nano Banana实现自然语言驱动图像编辑,用户通过简单指令即可实现精准编辑,无需传统图层或遮罩操作[3] - 模型在连续编辑中保持角色面貌与特征一致,并在多图融合中实现自然过渡,基于世界知识执行符合现实逻辑的编辑任务[3] - 技术突破体现在从“复杂工具栏”到“一句自然语言”、从“渲染缓慢”到“秒级出图”、从“效果不稳定”到“跨图一致性”,大幅降低使用门槛和成本[7] - 模型能理解复杂提示词,例如将手中物体变成3D透明线条艺术全息图,或生成高清的3D宠物手办图片[3][5] 行业竞争格局与趋势 - Nano Banana的走红类似此前GPT-4o推出图像生成功能引发的“吉卜力”风格创作风潮,当时ChatGPT一小时新增百万用户,其活跃用户和下载量创下纪录[7] - 国内厂商迅速对标,字节跳动Seed团队推出豆包图像创作模型Seedream 4.0,生数科技推出Vidu Q1参考生图功能,正面对标Nano Banana[8] - 原生多模态模型架构获业界认可,OpenAI和谷歌的模型在性能、延时、部署上展现优势,多模态为主的产品商业化快于文本产品[8] - 多模态大模型和应用发展的奇点将至,从大模型到多模态被视为商业化的必由之路[8] 产业链投资机会 - 多模态在算力侧带来投资机会,原生多模态模型需要比非原生模型更多算力,视频推理算力需求远大于文字,视频Agent落地催生推理算力需求[9] - 应用侧投资机会体现在广告、零售、创作、教育等领域的AI化需求,同时国内视频生成模型在供给端领先[9]