AI虚拟主播木几萌 - 财报，业绩电话会，研报，新闻

AI虚拟主播木几萌

搜索文档

南方都市报· 2025-12-19 04:33

公司技术成就与市场地位 - 广州烁谷科技的自研Vocu V3（海外版，国内版名为悟声）语音合成模型，在全球AI权威平台HuggingFace的TTS Arena榜单中位列第一，超越美国Inworld、英国Eleven Labs等知名厂商[1] - 在TTS Arena榜单的具体排名中，Vocu V3.0 A的ELO评分为1657，位列榜首，领先第二名CastleFlow v1.0 A（ELO 1608）和第三名Inworld TTS MAX A（ELO 1579）[2] - 中国公司中，来自上海的MiniMax（Speech-02-HD）排名第7（ELO 1548），阿里巴巴的通义CosyVoice2.0排名第24位[1][2] 产品性能与核心能力 - Vocu V3模型基于自研的“悟声”语音合成算法，能深度理解文本语义与情感，自动匹配动漫、商务、影视剧等多种音色与口音[4] - 该模型在音色克隆方面能力突出，仅需3秒声音样本即可实现瞬时克隆，相似度高达99.5%以上[4] - 已发布的悟声语音合成算法V3.1版本，专业克隆与音色转换能力进一步升级，全面支持中文、英语、韩语、法语、德语、西班牙语、葡萄牙语等全球数十种语言及粤语等方言[5] - 该模型在情感张力、相似度、稳定性、自然度、语义理解能力等方面表现领先，被评价达到影视级性能[5] 市场应用与用户增长 - Vocu V3新一代语音合成模型于2025年10月发布，上线3个月用户量突破百万大关[4] - “悟声”算法已通过“深度合成服务算法备案”，在智能客服、媒体创作、文旅数字人、互动娱乐等众多领域落地应用[5] - 由烁谷科技另一款通过备案的大模型“元语文字”驱动的AI虚拟主播“木几萌”，自2023年初发布后曾登上多个平台全站热榜前十，其粉丝总量超过其他所有同类竞品的总和[7] 技术原理与行业影响 - HuggingFace TTS Arena榜单采用类似国际象棋的Elo社区评分机制，通过全球用户对两款模型的合成音频进行匿名投票，基于海量真实主观偏好进行排名，被视为衡量语音合成技术实力的“试金石”[4] - 公司在数据采集环节构建了全链路全球化自研管道，并利用AI模型智能把关数据质量与情感提取[7] - 在算法层面持续迭代升级，对底层技术重投入使模型具备“举一反三”能力，能挖掘数据深层关联以提升表达的丰富性和生动性[7] 公司安全体系与融资进展 - 烁谷科技构建了“创造—应用—守护”的安全闭环，以解决音频深度合成的潜在风险[7] - 公司凭借自研的VocaMark音频隐形水印技术与VocaAntiFake音频鉴伪专家大模型，实现对AI生成音频的无痕溯源与高精度鉴别，并能抵御翻录、剪辑等恶意混淆攻击[7] - 公司已获得奇绩创坛的种子轮投资以及多家机构的算力支持，目前正与顶级资本及产业巨头紧密接洽Pre-A轮融资[8]