刚刚，谷歌Veo 3.1迎来重大更新，硬刚Sora 2

模型发布与核心升级 - 谷歌发布最新AI视频生成模型Veo 3.1，是其前代Veo 3的升级版本 [2][5] - 新模型提升了提示词遵循度，并在以图生视频时提供更高的视听质量 [3] - 由其驱动的AI电影创作工具Flow同步更新，可实现更精细的视频片段编辑和颗粒化控制 [3] 增强的叙事与音频控制 - Veo 3.1增强了对对话、环境音效及其他音频效果的支持 [5] - 在Flow的多个核心功能中，如连帧成片、素材生成视频和延展，均已支持原生音频生成 [6] - 原生音频的引入让用户能更好地掌控视频的情绪、节奏与叙事基调，以往需后期制作的能力现可在生成阶段完成 [10] - 在企业场景中，该集成式创作方式有助于减少独立音频制作流程，适用于培训内容、营销视频等制作 [10] 更丰富的输入与编辑能力 - 模型可接受文本提示、图像以及视频片段作为输入 [12] - 支持参考图像（最多三张）以引导输出画面的外观与风格，支持首帧与末帧插值以生成平滑过渡场景，支持场景延展让动作持续发展 [12] - 引入新功能如插入（向场景添加物体）和移除（删除元素或角色） [13] 技术规格与输出能力 - Veo 3.1支持输出720p或1080p分辨率的视频，帧率为24帧/秒 [18] - 使用文本提示或上传图像生成视频时，时长可选4秒、6秒或8秒 [22] - 使用Extend功能，视频最长可扩展至148秒（超过两分半） [22] - 新功能带来对主体与环境的更精确控制，有助于保持品牌外观特征与风格一致性，简化零售、广告等行业的创意生产流程 [19] 多平台部署与定价 - Veo 3.1可通过谷歌旗下AI服务访问，包括Flow、Gemini API和Vertex AI [15][20] - 模型目前处于预览阶段，仅在Gemini API的付费层级中可用 [16] - 收费结构与Veo 3一致，标准模型为每秒视频0.40美元，快速模型为每秒视频0.15美元 [21] - 采用视频成功生成后才计费的方式，为企业团队提供可预测的预算模式 [16]