InfiniteTalk - 财报，业绩电话会，研报，新闻

InfiniteTalk

搜索文档

北京商报· 2025-12-18 13:03

公司技术发布与开源 - 公司于12月18日发布并开源了虚拟人视频生成模型 LongCat-Video-Avatar [1] - 该模型基于LongCat-Video，在底层架构上提升了动作拟真度、长视频稳定性与身份一致性 [1] - LongCat-Video-Avatar 是团队针对InfiniteTalk和LongCat-Video在实际场景中的核心痛点进行优化而生的模型 [1] 公司技术发展历程 - 公司在8月开源的InfiniteTalk项目吸引了全球数十万名开发者使用 [1] - 公司在10月底开源了侧重长视频生成的LongCat-Video视频生成模型 [1]

告别「面瘫」配音，InfiniteTalk开启从口型同步到全身表达新范式

机器之心· 2025-08-28 00:55

核心技术突破 - 提出稀疏帧video dubbing新范式将传统嘴部区域修复转变为以稀疏关键帧为引导的全身视频生成实现口型同步及面部表情、头部转动和肢体语言与音频情感的自然对齐[2][14] - 采用流式生成架构处理无限长视频通过上下文帧机制传递动量信息解决长视频生成中的累积误差和片段过渡生硬问题[16] - 创新软条件控制机制通过细粒度参考帧定位动态调整控制强度在动作自然度与参考帧保真度间取得最优平衡[17][19] 技术性能表现 - 在HDTF数据集上取得FID 27.14、FVD 132.54、Sync-C 9.18、Sync-D 6.84、CSIM 0.751的指标表现综合性能优于对比模型[22] - 在CelebV-HQ数据集上实现Sync-C 7.41和CSIM 0.713 同步性与身份保持指标领先[22] - 在EMTD数据集上获得Sync-C 8.34和CSIM 0.709 展现跨数据集的稳定性能[22] 应用场景拓展 - 集成SDEdit或Uni3C插件可精确保留源视频镜头运动提升画面构图和运镜连贯性[21] - 技术可应用于短视频创作、虚拟偶像、在线教育及沉浸式体验领域为创作者提供低成本高效率的内容生成工具[27] - 由美团视觉智能部研发已开源技术论文、代码和权重支持本地生活电商场景的视觉技术能力建设[3][5]