核心观点 - 火山引擎正式发布豆包视频生成模型Seedance 1.5 Pro,该模型在音视频联合生成、视觉表现力及多语言支持等方面实现显著升级,旨在彻底改变AI视频制作流程,并已具备影视级叙事能力 [2][4] 产品发布与市场影响 - 模型于火山引擎FORCE大会上正式发布,上线后引发广泛关注,已有网红大V使用其制作爆款视频 [2] - 个人用户可通过豆包APP、即梦AI体验,企业用户可通过火山方舟体验中心体验,模型API将于12月23日起在火山引擎上线 [4] 核心技术升级与性能 - 支持原生音视频联合生成,抛弃了先生成视频再匹配音频的级联式架构,采用双分支扩散Transformer,实现音画在毫秒级的精确同步 [4][28][30] - 视觉冲击力与运动效果突破上限,能驾驭影视级镜头语言、叙事张力,并捕捉细微表情与动作 [4][8] - 具备细腻的情绪捕捉能力,即使无台词也能通过表情变化延伸情绪,呈现富有层次的细腻质感 [10] - 优化了运镜控制和动态张力,能从容演绎高动态、高冲击力的运动场景,并执行高难度的镜头运动 [24] - 依托多阶段蒸馏技术,模型推理速度暴涨10倍,使其从实验室走向工业界,成为一线生产力工具 [34] 功能特性与应用场景 - 实现多人多语言生成,彻底解决人物口型与台词错位问题,支持方言及多语言对白,为短剧、喜剧、国风等内容创作增添利器 [19][20][21][22] - 在产业级场景如广告电商中有广阔应用,例如生成人物用标准普通话为产品打广告的视频 [25] - 即将上线的Draft样片功能可先输出低分辨率视频锁定关键元素,确认后再生成高清成片,此举最高可节约60%的推理成本 [35][38] 行业定位与竞争格局 - 该模型在音频能力上被定义为市面上所有模型中的“八边形战士”,设定了顶尖模型的新基准 [31] - 与Sora 2等模型相比,Seedance 1.5 Pro不仅展示了对物理世界的视觉想象力,更赋予了AI倾听与表达的感官通感 [34] - 在强敌环伺的竞争环境中,该模型通过实现声画交融、直接输出影视级成品,稳稳站在行业浪潮前端 [38]
奥特曼飙河南话,小扎马斯克真人约架!豆包新模型把AI视频玩成「活人」
搜狐财经·2025-12-18 12:26