太炸裂了!全网实测Nano Banana Pro,网友:这模型里到底装了什么鬼东西!
量子位·2025-11-21 06:29

产品核心特点 - 谷歌推出最新最强文生图模型Nano Banana Pro,又名Gemini 3 Pro Image,整合了Gemini 3 Pro的多模态理解能力以及谷歌搜索的知识库,能理解现实语义与物理逻辑[11][12] - 主要升级包括支持2K、4K高清分辨率及多种宽高比,文字渲染能力大幅提升支持多语言直接渲染或翻译,支持最多14张图像融合生成,基于Gemini 3 Pro的多模态理解能力支持生成复杂专业图表[13][15] - 产品拥有最先进的图像生成和编辑功能,具备更高级的世界知识、文本渲染、精度和控制能力,基于Gemini 3构建,非常擅长制作复杂的图表[46] 功能性能演示 - 模型能够秒秒钟将英伟达最新财报PDF文件生成重点突出、内容精致的图表,一次性将未加工的Graphviz图表代码生成带logo的可视化效果图,直接生成论文流程图和核心概念解释图如Transformer架构图[2][4][6] - 生成自行车车架及组件的爆炸视图技术蓝图,拥有已拆卸的齿轮和链条,以毫米为单位进行尺寸标注,经过ChatGPT逐项打分认定完成度很高[14][17] - 实现14只娃娃坐在一起看电视的图像融合,整体氛围感符合要求,细节如落地灯光影和玩偶在窗户里的背影都考虑到,但娃娃数量未完全达到14只[18][20][21] 用户应用案例 - 用户将谷歌博客照搬进杂志,配图排版均由模型自动搞定,将灵魂草图转化为撕漫感插画并能拿捏人物神态,根据人物参考图1分钟生成带故事情节的条漫[29][32][34] - 通过口头描述直接生成世界杯对决海报,轻松制作各种结构分解图,用于生成精美的手册和指南如奥地利州狩猎参考指南[37][39][42] - 模型对物理世界理解增强,生成的透明物体能够经受住光影考验,展现更强的现实语义理解能力[44] 市场反响 - 模型出世后短短几小时即掀起全网疯玩热潮,硅谷VC大佬Deedy率先分享实测案例引发广泛关注[1][10] - 网友脑洞大开利用模型进行各种奇思妙想的创作,谷歌CEO皮猜亲自贡献生成图像并为产品站台[28][46] - 普通用户可在Gemini应用中免费体验但有限额,Google AI Plus、Pro和Ultra订阅用户享有更高配额[13]