Nano Banana Pro(Gemini 3 Pro Image)
搜索文档
AI漫剧迎政策红利期,高品质内容及技术平台有望受益
中泰证券· 2025-11-25 07:05
行业投资评级 - 行业评级为增持(维持)[2] 核心观点 - AI漫剧行业正迎来政策红利期,高品质内容及技术平台有望受益[1] - 监管趋严将加速低质量内容淘汰,为懂合规、有审美的高质量专业创作方创造更大机会[4] - 字节系平台调整分成系数,进一步鼓励高质量内容并希望与内容方建立深度合作,将推动漫剧供给提高仿真人和2D/3D内容比重[4] - 谷歌Nano Banana Pro模型实现多项关键突破,为AI漫剧创作增添强力助手,助力创作者以极低成本实现高质量视觉效果[4] 行业动态与市场表现 - 抖音端原生单日新增播放量已突破4亿大关[4] - 爱奇艺Q3财报称正拓展漫剧业务,开发自制漫剧,并已上线漫剧专属频道[4] - 腾讯正在测试"火星动漫"等两款漫剧微信小程序[4] - 网易推出"网易羚羊漫剧"小程序,支持周结和自主提现[4] - 咪咕发布AI漫剧共创计划,剧本单价2万元+分润,编剧享永久分账[4] - 快手联合可灵AI升级漫剧创投计划,支持2万至50万现金,其原生漫剧单日播放突破500万[4] - 百度介绍漫剧星跃计划,开放IP版权并征集剧本,成绩突出可进行分润[4] - 行业总市值为17,718.81亿元,行业流通市值为16,379.84亿元[2] 监管动态 - 国家广电总局下发工作提示,即日起至2026年3月开展专项治理,将各类动画形式微短剧纳入分类分层审核体系[4] - 灵矩动漫漫剧《高考落榜,忽悠同学上冥牌大学》因过度宣扬封建迷信被全网下架,开出漫剧市场第一张罚单[4] 技术进展 - 谷歌Nano Banana Pro(Gemini 3 Pro Image)模型实现4K高清、竖屏输出、精准文本渲染、更多素材融合、作业专业化等多项关键突破[4] 重点公司关注建议 - 漫画、网文等IP源头公司建议关注:荣信文化、欢瑞世纪、中文在线、掌阅科技、阅文集团、中信出版等[4] - AI技术和平台优势公司建议关注:易点天下、快手-W、哔哩哔哩-W、昆仑万维、华智数媒、捷成股份等[4]
谷歌一周双模型,Agent能力跃迁,多模态重点突破
中邮证券· 2025-11-24 05:22
行业投资评级 - 行业投资评级为“强于大市”且维持该评级 [2] 核心观点 - 谷歌一周内连续发布Gemini 3.0 Pro和Nano Banana Pro双模型,印证其作为平台型企业在生成式AI时代的核心优势 [5][7][9] - 谷歌依托“自有TPU算力供给与优化-模型团队技术领先-搜索等产品矩阵加速渗透”的全栈协同能力,模型的加速突破是Agent产品达成用户使用意愿的关键 [9] - 模型的突破将激活用户需求并反向催生更多算力消耗,形成正向循环 [9] 谷歌模型技术突破 - Gemini 3.0 Pro在基准测试取得最新SOTA:Humanity's Last Exam(无工具)得分37.5%,ARC-AGI-2达31.1%,GPQA Diamond(无工具)91.9% [6] - 深度思考模式进一步提升性能:HLE(Tools off)达41%,GPQA Diamond 93.8%,ARC-AGI-2 45.1% [6] - 多模态理解重点突破:MMMU-Pro 81%,Video-MMMU 87.6%,屏幕理解ScreenSpot-Pro 72.7% [6] - 模型在长任务规划与工具使用方面表现优异:Vending-Bench 2显示运营净值均值为$5478.16 [6] - Nano Banana Pro支持最高64K输入token与32K输出token,分辨率可达4K,具备多轮次对话式编辑、多图像合成(最多14张输入图像合成1张输出图像)等功能 [7] 谷歌全栈能力优势 - 硬件层具备自研TPU芯片及专为大规模训练打造的数据中心与计算集群 [8] - 研究层以Google DeepMind为核心开展世界级前沿研究 [8] - 模型与工具层依托硬件与研究优势构建Gemini等基础模型 [8] - 产品与平台层将模型能力深度集成至谷歌搜索、云服务、Gemini应用等覆盖数十亿用户的核心产品矩阵中 [8] - 从2.5向3.0的升级延续了Scaling Law,通过整个AI开发管线的优化创造了性能乘数 [8] 投资建议关注领域 - 港股互联网:腾讯控股、阿里巴巴、网易、快手、小米集团、京东集团等 [9] - 多模态:万兴科技、虹软科技、当虹科技、中科创达、大华股份、海康威视等 [9] - Agent:鼎捷数智、视源股份、泛微网络、致远互联、用友网络、汉得信息等 [9] - 国内算力:寒武纪、云天励飞、亿都(国际控股)、浪潮信息、曙光数创、超讯通信等 [10] - 海外算力:新易盛、中际旭创、天孚通信、长光华芯、长芯博创、源杰科技等 [10]
Nano Banana Pro 之后,谷歌 CEO Pichai 要的不是“好看”,是好用
36氪· 2025-11-21 00:57
文章核心观点 - 谷歌CEO桑达尔·皮查伊认为,人工智能的发展重心正从对话交流转向完成真实任务的“智能体”体验,谷歌DeepMind发布的Nano Banana Pro(Gemini 3 Pro Image)是这一转变的重要例证,它标志着图像AI从创作工具转变为能处理数据、完成工作任务的工作站[1][3] - 当前AI热潮并非泡沫,而是行业进行合理且史无前例的“基建投资”阶段,谷歌和整个行业正在投入数万亿美元构建底层设施[1][6][7] - 谷歌致力于将图像AI打造成连接其全线产品的“入口”,而非孤立应用,其战略是通过端到端的全链条路径实现产品真正“好用”[1][18][24] - 要实现AI的真正“好用”,必须解决能源、版权和信任三大关键挑战[1][25] AI行业投资与基建 - 谷歌CEO认为当前AI投资整体是理性的,市场存在真实客户需求,而满足需求的能力尚跟不上,因此投资热潮是合理的[6] - 将当前阶段类比20多年前的互联网热潮,认为AI将引发根本性革命,现在是提前下重注的时间点,未来几年将建成原本需要10到20年才能完成的东西[7] - 谷歌今年在AI基建上的支出将超过900亿美元[7] - 全行业在AI相关基础建设上的投资已累计超过1万亿美元[7] - 谷歌采取全链条、端到端的路径,覆盖从底层物理设施、芯片、数据中心、研究到最终应用于搜索、YouTube、Android等产品的完整价值链[10] AI发展方向:从对话到行动 - AI的重心正从交流转向帮助用户做事,接下来的12个月,AI将开始做更复杂的事情[12] - 这种转变被称为“智能体”体验,即让AI成为能完成任务的智能体[13] - 以购买生日礼物为例,展示了AI未来可代为完成此类生活化任务的前景[12] Nano Banana Pro的产品定位与能力 - 产品标志着图像AI的角色转变:从一个图像创作工具转变为一个能接入搜索、处理数据、完成工作任务的AI工作站[3] - 核心能力升级一:能看懂实时信息。可连接谷歌搜索调取最新数据,例如根据地点生成天气图,根据财报数据截图制作图表,或拉取资料自动设计结构化图像[14] - 核心能力升级二:能把内容直接变成图像。能生成文字正确、不乱码的图像,支持多语言直接输出,并能将一段故事变成电影式分镜图[14] - 核心能力升级三:能微调和控制,提供如改变图像纵横比、修改画面焦点、调整光线等按钮级操作,使普通人也能进行专业图像创作[16][17] - 其真正价值在于帮助用户节省表达和沟通时间,而非让用户变成艺术家[23] 图像AI作为战略入口 - 谷歌的战略是将图像AI打造成连接各个产品的入口,而非独立应用[19][20] - Nano Banana Pro被同时部署到谷歌搜索、谷歌广告、Workspace、Gemini App以及API和AI Studio等多个产品线中,实现全线铺开[20] - 选择图像作为入口,是因为许多实际任务(如医疗诊断、财报分析、信息解读)都需要图像作为媒介,而旧的工具只能出图,不能“用”图[21] - 该产品的目标是让AI生成的图像能自己说清用意,并能引导用户进行下一步行动[22] - 这种“入口”思维是谷歌之后布局AI产品的关键逻辑[24] 实现AI“好用”的关键挑战 - **能源挑战**:数据中心耗电量巨大,预计到本十年末可能比整个印度还高,比所有电动车耗电总和多50%[26]。谷歌坚持2030年净零碳排目标,但承认速度受影响,正通过投资新能源应对,措施包括签署全球最大商业核聚变能源采购协议、投资小型核反应堆等地热能源、以及计划在2026年实现英国数据中心95%无碳电力覆盖[27] - **版权挑战**:针对使用图书、音乐、新闻内容训练模型的问题,谷歌强调机制,允许用户选择退出被训练,并在生成内容时尊重版权,致力于与内容生态共赢[28] - **信任挑战**:承认最先进的AI仍然可能出错(如“披萨配胶水”等错误信息)[29]。应对策略包括将AI模型与谷歌搜索结合以提高准确性,以及为Nano Banana Pro生成的图像嵌入SynthID数字水印,方便用户验证图像来源[30]。强调不能盲信AI,而应有方法去理解、验证和使用它[30]