AI语音合成技术已进入新阶段最先进工具生成声音与人声无异

许多人仍认为人工智能(AI)生成的语音听起来"机械感"明显，但英国伦敦玛丽女王大学研究团队在新出版的《公共科学图书馆·综合》杂志上发表论文指出，AI语音合成技术已进入新阶段，其生成的"克隆语音"或深度伪造声音，逼真度与真人录音无异。研究团队采用当前最先进的AI语音合成工具，生成两类合成语音：一类是基于真人录音的"克隆"声音，旨在模仿特定说话者；另一类则由大型语音模型生成，不针对具体个人。参与者被要求辨别声音的真实性与可信度。尽管研究未发现AI声音存在"超真实效应"(即比真人更像真人)，但结果显示，"克隆语音"的逼真度已与真人声音不相上下，令人难以分辨。且部分AI生成的声音在可信度评价中甚至超越了真人录音。最新研究显示，公众对高仿真语音认知机制的研究迫在眉睫。AI语音技术的飞速发展有望给教育、人机交互等领域带来创新机遇——在这些领域，定制的高质量合成语音可增强用户体验。但是，合成语音也对伦理、版权和安全构成挑战，尤其在虚假信息、诈骗与身份冒用等方面需加强防范。 (责任编辑：柯晓霁) 研究团队表示，AI语音已渗透日常生活，如Alexa、Siri及各类客服系统。虽然当前系统音色仍具机械特征，但 ...