Character.AI推出AvatarFX模型：让静态图片人物“开口说话”

核心技术突破 - 推出革命性视频生成模型AvatarFX 首次实现静态图片转化为可说话、可互动的动态视频角色 [1] - 基于SOTA DiT-based diffusion video generation model 通过深度学习算法融合静态图像与音频条件化技术 [3] - 采用创新蒸馏与推理策略精准捕捉音频特征并同步生成唇部运动、表情变化及自然肢体动作 [3] 技术性能特点 - 具备超实时生成能力支持长序列叙事与多角色对话场景 [3] - 用户仅需上传一张角色图片及对应音频即可在短时间内生成流畅视频 [3] - 内置男声、女声及多风格语音库支持自由组合角色形象与声音特征 [3] 应用场景拓展 - 教育领域实现虚拟形象生动化教学娱乐行业支持虚拟偶像实时互动 [4] - 社交媒体支持快速生成动态头像与短视频内容 [4] - 可应用于影视制作、历史人物复原及文化遗产数字化领域 [4] 平台运营保障 - 内置多层级内容审核机制通过实时监控与过滤技术确保内容安全 [3] - 用户可通过官方网站直接体验该技术 [5]