Character.AI推出AvatarFX模型:让静态图片人物“开口说话”
环球网·2025-04-23 06:07
核心技术突破 - 推出革命性视频生成模型AvatarFX 首次实现静态图片转化为可说话、可互动的动态视频角色 [1] - 基于SOTA DiT-based diffusion video generation model 通过深度学习算法融合静态图像与音频条件化技术 [3] - 采用创新蒸馏与推理策略 精准捕捉音频特征并同步生成唇部运动、表情变化及自然肢体动作 [3] 技术性能特点 - 具备超实时生成能力 支持长序列叙事与多角色对话场景 [3] - 用户仅需上传一张角色图片及对应音频 即可在短时间内生成流畅视频 [3] - 内置男声、女声及多风格语音库 支持自由组合角色形象与声音特征 [3] 应用场景拓展 - 教育领域实现虚拟形象生动化教学 娱乐行业支持虚拟偶像实时互动 [4] - 社交媒体支持快速生成动态头像与短视频内容 [4] - 可应用于影视制作、历史人物复原及文化遗产数字化领域 [4] 平台运营保障 - 内置多层级内容审核机制 通过实时监控与过滤技术确保内容安全 [3] - 用户可通过官方网站直接体验该技术 [5]