腾讯云：2025年音视频领域下AIGC的应用与创新探索报告

行业现状与痛点 - 传统有声内容制作面临高成本和高门槛困境，平均一部有声书需经历12道工序、耗时12周、成本高达50万元 [1] 公司技术解决方案 - 公司自主研发长篇章强演绎语音大模型，实现对音频与文本内容的深度理解，并能精准控制56种复合情感 [1] - 采用“双引擎驱动”战略构建AI音频全流程产线，包括语音大模型技术引擎和高度自动化的工业化生产管线 [1] - 语音大模型技术引擎支持10秒克隆商用级声线、4000亿参数剧本生成等智能化创作能力 [32][33] - 智能化生产管线实现24小时内完成整部有声书制作，并配备多维度质量控制系统 [1][38] 技术应用成果 - 成功复现已故评书大师单田芳的声音，上线百余张AI专辑总播放量破亿，其中多部作品播放量超700万 [1] - 完全由AI独立创作的有声书《温柔的背叛》和《妻子的秘密》播放量分别达4000万和5000万以上 [2] - 融合真人与AI协作的《教父三部曲》累计播放高达13.4亿 [2] - 推出“音剪AI创作工具2.0”，使创作者可随时随地开启“数字制片场”，大幅降低专业门槛 [2] 产品功能特性 - AI音频创作具备方言音色演绎、郭德纲式相声、中英混合拟声词等特色演绎能力 [2][48][49] - 技术实现韵律停顿、自发式播客等AIGC功能 [47] - 提供音频指令控制，支持精细化情感轮控制 [29][34]