阿里发布通义万相2.6系列视频生成模型,上线国内首个角色扮演功能 | 钛快讯
钛媒体APP·2025-12-16 05:22

公司产品发布 - 阿里巴巴发布新一代万相2.6系列模型 该模型面向专业影视制作和图像创作场景进行了全面升级[1] - 万相2.6是国内首个支持角色扮演功能的视频生成模型 同时支持音画同步、多镜头生成及声音驱动等功能[1] - 该模型被描述为目前全球功能最全的视频生成模型[1] 产品功能与技术升级 - 万相2.6在画质、音效、指令遵循等能力上较前代有所提升 单次视频时长达到国内最高的15秒[2] - 模型新增角色扮演和分镜控制功能 能一键完成单人、多人、人与物合拍的视频 并自动实现多镜头切换等专业任务[2] - 角色扮演功能可参考输入视频中的角色外观和音色 按照提示词生成视频[3] - 模型集成了多项创新技术 可对输入参考视频进行多模态联合建模与学习 提取时序信息的主体情绪、姿态、视觉特征以及音色、语速等声学特征 实现从画面到声音的全感官一致性保持与迁移[3] - 模型可将简单提示词转换为多分镜脚本 生成包含多个镜头的连贯叙事视频 并在多镜头间保持主体、场景等关键信息的一致性[4] - 通过高层语义理解 模型能将原始输入构建为具备完整故事线与叙事张力的专业级多镜头段落 在镜头切换中保持核心主体、场景布局和环境氛围的统一[4] 应用场景与用户体验 - 角色扮演功能让普通用户也能在影视级画面里表现精湛演技 例如用户上传个人视频并输入科幻悬疑风格提示词 模型能在几分钟内完成分镜设计、角色演绎、画面配音 生成电影级短片[4] - 面向广告设计、短剧制作等专业场景 通过输入连续提示词 模型能生成一段完整叙事的短片 例如生成包含人物角色和商品的广告视频[4] - 万相模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等10多种视觉创作能力[5] - 模型已广泛应用于AI漫剧、广告设计和短视频创作等领域[5] 市场地位与发布历史 - 今年9月 公司率先在国内发布音画同步的视频生成模型万相2.5 在权威大模型评测集LMArena上 其图生视频能力位居国内第一[2] - 此次发布的万相2.6进一步提升了多项能力 巩固了其技术领先地位[2] 产品获取与平台集成 - 即日起 所有人可直接在万相官网体验万相2.6[5] - 企业用户可通过阿里云百炼平台调用模型API[5] - 千问APP也将于近期上线该模型 并提供更丰富的玩法[5]