拍我AI上线V5.5AI视频大模型,支持“导演级”音画同步一键生成
新浪财经·2025-12-02 10:33
爱诗科技发布PixVerse V5.5 AI视频大模型 - 公司爱诗科技于12月2日发布了PixVerse V5.5 AI视频大模型,其国内版本为“拍我AI V5.5” [2][6] - 此次更新是在Sora2发布后,公司率先实现了“分镜+音频”的一键直出升级 [2][6] - 该模型能让创作者在几秒钟内生成完整的视频故事,无需再从素材中拼接 [2][6] 模型核心功能与技术升级 - V5.5模型的核心进步源于底层模型的全面升级,首次支持音频与多镜头同步生成 [2][6] - 模型强化了多角色音画同步能力,能根据用户提示词自动理解并生成完整的故事段落,而非单一镜头素材 [2][6] - 用户只需输入简短提示,AI即可完成镜头推进、景别切换、人物对白、环境声和背景音乐的生成,直接输出可用的叙事片段 [2][6] 用户控制与创作体验 - 在拍我AI中,用户可在开启多镜头和音画同步状态下,生成5秒、8秒、10秒的视频 [3][7] - 用户现可在提示词中直接控制“音效、台词、音色、音乐、镜头”,AI能自动理解叙事意图并设计推拉、摇移、切换等镜头语言 [3][7] - AI的运镜节奏更自然,紧贴真实制作逻辑,旨在带给用户“成为导演”般的创作体验 [3][7] 产品性能与市场影响 - 与以往只能产出单镜头或零散画面的模型不同,V5.5可以生成具备叙事结构的短片,视频质量接近“成片” [2][6] - 从体验角度看,V5.5进一步缩短了创作工作流的时间差,生成速度大幅提升,镜头语言更加丰富 [3][7] - 控制方式更加直观,使得C端用户和创作者都能以更低门槛,迅速将抽象灵感转化为可观看的成品视频 [3][7]