AI配音

搜索文档
国乙“哑巴新郎”扩列,谁夺走了纸片人的“声带”
36氪· 2025-09-15 00:23
配音演员行业变化 - 配音演员与游戏厂商合作关系从稳定转向脆弱 配音工作曾被视为养老保险 只要私德无问题可工作至游戏关服 但现仅签合同只是开始[2][7] - 玩家对配音演员业务能力要求提高 对不贴合角色或出现低级错误的配音采取抵制行动 如《守望先锋》新英雄无漾配音引发玩家质疑并最终换人[7][9][11] - 配音演员因病或心理压力导致业务能力下滑 如吴磊因健康问题配音质量下降 玩家指出吞音破音等低级错误 最终被更换[1][15][17] 厂商应对策略 - 厂商采取隐藏配音演员身份策略 如《世界之外》《恋与深空》等新游不公开CV信息 通过保密条款约束相关信息披露[26] - 厂商引入AI技术作为替代方案 如《未定事件簿》使用逆熵技术合成原CV声音 《Whispers from the Star》使用AI实时生成角色回应[32] - 厂商通过玩家投票选择新配音演员 如《恋与制作人》提供五位CV试音由玩家投票 并决定未来不公开CV名字[28] 成本与行业影响 - 配音演员报价按句收费 价格区间为100-500元 豪华CV阵容成本较高 厂商在流水下降时考虑降本增效 如《闪耀暖暖》尝试换人但因玩家反对失败[22][24] - 厂商在合同中增加声音采集条款 为AI技术应用做准备 但部分配音演员抵制 如冯骏骅因未获AI相关条款回应终止与《王者荣耀》合作[20][21] - 换角成功案例多见于受众广泛的游戏类型 如《守望先锋》《王者荣耀》 而情感属性强的乙游换角需要更长时间磨合 如《光与夜之恋》更换陆沉CV耗时半年[13][28]
配音演员的“铁饭碗”,不铁了
虎嗅· 2025-09-14 13:42
配音演员行业动态 - 《恋与制作人》宣布与配音演员吴磊结束合作关系 玩家反应积极 [1] - 《光与夜之恋》玩家要求更换同一配音演员吴磊 [2] - 吴磊曾与赵路、夏磊、阿杰等并称为“国乙老公” 体现其行业地位与受欢迎程度 [3] 厂商更换配音演员的挑战 - 更换配音演员涉及大量物料替换及玩家接受度问题 [4] - 厂商因配音演员个人问题导致品牌商誉受损时不得不换角 [4] - 配音演员接乙游工作曾被戏称为“养老保险” 但现此模式正在失灵 [7][12] 近期配音演员换角案例 - 《守望先锋》新英雄无漾的配音演员赵洋因声线与角色不贴合及出现破音、吞字等问题引发玩家质疑 最终被更换为马正阳 [13][14][15] - 《王者荣耀》新英雄孙权原配音鹿喑因声线偏阴骘与角色“沉稳内敛”定位不符引发争议 最终被更换为马正阳 [17][18][19] - 吴磊在《恋与制作人》中配音的李泽言出现吞音、破音等业务能力问题 玩家指出其声音状态明显下滑 [21][22][24] 玩家与行业标准变化 - 玩家对配音演员业务能力有更高衡量标准 不再照单全收 [20] - 部分玩家认为吴磊因看不起乙游品类而消极配音 另一部分认为其因病导致声带状态不稳 [25][26] - 配音演员从幕后走向台前 出现身份及自我定位模糊问题 导致私德塌房风险 [29] 厂商与配音演员关系演变 - 厂商在合同中增加“同意声音采集”条款 以应对AI技术发展及人的不可控性 [32] - 配音演员冯骏骅因《王者荣耀》要求新皮肤试音六句及未回应AI相关条款补充要求而终止合作 [33][34] - 游戏进入生命周期中后期 厂商面临是否继续维持豪华配音阵容的投入决策 [35] 配音演员报价与成本 - 配音演员按句收费 价格区间为100元至500元每句 [37] - 部分知名配音演员报价示例:陈奕雯13500元(10句)+405元每句 张太康13500元(10句)+675元每句 [38] 行业应对策略 - 厂商选择不公开配音演员名单 如《世界之外》《恋与深空》《无限暖暖》《燕云十六声》等新游 [41] - 不同厂商对配音演员约束力不同 有的严格执行保密条款 有的允许配音演员自行认领角色 [42] - 《恋与制作人》将新配音选择权交给玩家 提供五位配音演员试音由玩家投票 并宣布未来不公开配音演员名字 [45] AI技术在配音领域的应用 - 玩家对AI配音存在情感接受度、技术真实性及授权问题担忧 [49] - 《Whispers from the Star》使用AI实时解析玩家语音并生成角色回应 被用作英语陪练 [52] - 《沙威玛传奇》使用AI配音获得玩家容忍 但手游厂商使用可能被视为偷懒 [53] - AI技术介入被视为行业大势所趋 无法阻碍其发展 [55]
B站下场自研AI配音!纯正美音版甄嬛传流出,再不用看小红书学英语了(Doge)
量子位· 2025-07-14 09:08
AI配音技术发展 - B站发布的IndexTTS2模型实现音色、情感与唇形同步的AI配音,支持时长精确控制和自动生成两种模式[3][11][12] - 模型在LibriSpeech-test-clean等测试集中多数达到SOTA水平,情感测试WER仅1.883%[22][24] - 时长控制误差小于0.02%,支持独立调节音频与情绪表达[19][25] 技术实现架构 - 首创自回归零样本TTS模型,结合精确时长控制与自然生成[33] - 三大核心模块:文本到语义(T2S)、语义到语音(S2M)、BigVGANv2声码器[36][38] - 创新采用情感适配器与梯度反转层分离情感与说话者属性[41][42] 性能验证 - 消融实验显示GPT潜在表征提升发音清晰度,S2M模块显著改善合成质量[26][28] - 在AIShell-1测试中SS指标仅落后真实语音0.004,WER误差0.038%[23] - 情感测试SMOST达4.24±0.19,显著优于MaskGCT等对比模型[25] 应用场景拓展 - 模型适用于视频配音等需音视频同步的领域[32] - 可能整合进B站"代号H"AI创作工具,支持视频播客战略[47][49] - 社区反馈显示潜在娱乐应用价值,如搞笑视频制作[9]