快手可灵2.6模型上线 “音画同出”重构AI视频创作工作流
证券时报网·2025-12-04 03:14

产品技术升级 - 快手旗下可灵AI正式推出视频生成2.6模型,核心能力为“音画同出”,改变了传统AI视频生成“先无声画面、后人工配音”的工作流程 [1] - 模型升级了文生音画、图生音画两大功能,能在单次生成中输出包含自然语言、动作音效及环境氛围音的完整视频,极大提升创作效率 [1] - 通过对物理世界声音与动态画面的深度语义对齐,该模型在音画协同、音频质量和语义理解上表现亮眼,中文语音生成效果全球领先,支持生成中英文视频,视频长度最长可达10秒 [1] - 可灵AI公布了多段涉及赛事解说、多人对白、音乐表演等场景的视频,展示其音画自然、同步且流畅的效果 [1] - 可灵AI自诞生以来经历多次重要迭代,今年9月底推出的2.5 Turbo模型在文本响应、动态效果、风格保持、美学质量等多个维度实现提升 [1] 商业化进展与战略规划 - 可灵AI在商业化营收上不断取得突破,预计2025年全年收入将达到1.4亿美元(约10亿元人民币),较年初制定的6000万美元(约4.3亿元人民币)目标提升超过100% [2] - 公司明确可灵AI的愿景为“让每个人都能用AI讲出好故事”,将聚焦于AI影视创作这一核心目标,聚合资源深入打磨技术与产品能力 [2] - 在具体迭代方向上,可灵将围绕技术领先性与产品想象力双线推进,结合多模态交互理念(如MVL)和用户需求洞察,持续升级基础模型与产品能力 [2] 资本开支与算力投入 - 在可灵收入增长与AI业务整体进展超预期的背景下,公司正不断追加算力投入 [3] - 鉴于用户对视频生成模型的需求持续增强,快手已多次扩充可灵在推理侧的算力,同时随着模型加速迭代,公司也开始提升训练算力以保持技术前沿性和竞争力 [3] - 除可灵本身外,公司在其他AI业务赋能方面也同步增加了相关资本开支,预计2025年集团整体Capex支出将较去年实现中高双位数的增长 [3]