文本转语音模型
搜索文档
喝点VC|a16z专访百亿美金AI语音独角兽11Labs CEO :首要之务是深入行业内部,花时间理解他们的核心诉求与激励机制
搜狐财经· 2025-12-13 17:40
图片来源:Youtube Z Highlights Mati Stanizewski , ElevenLabs 首席执行官兼联合创始人。本次方案为 a16z 合伙人 Jennifer Li 与 Mati 在 2025 年 11 月 4 日进行的讨论,深入探讨了该团队如何以 闪电般的速度运送研究级人工智能 —— 从文本到语音和完全授权的人工智能音乐到实时语音代理,以及为什么语音是下一个人机交互界面。 速度与深度的博弈:我们如何用"小团队"撬动"大研究" Jennifer Li:我很荣幸欢迎我们的首位演讲者——ElevenLabs联合创始人兼首席执行官Mati。Mati,很高兴你能来到这里。 Mati Staniszewski :非常感谢邀请我来这里。很高兴见到大家,早上好。 Jennifer Li:刚才的欢迎音乐是ElevenLabs生成的吧? Mati Staniszewski :确实如此。我们在音频领域持续拓展。最初从语音技术起步,随后构建了语音助手的编排体系,如今更开发出完全持牌的音乐模型, 能够创作精彩绝伦的音乐作品与之相辅相成。 Jennifer Li :太棒了。我们稍后会详细探讨这些内容。我有幸从E ...
喝点VC|a16z专访百亿美金AI语音独角兽11Labs CEO :首要之务是深入行业内部,花时间理解他们的核心诉求与激励机制
Z Potentials· 2025-12-13 11:09
公司产品与技术演进 - 公司最初从文本转语音技术起步,随后构建了语音助手编排体系,并开发出完全持牌的音乐模型,如今已拓展至AI助手平台 [6] - 研究团队创建了首个能深度理解上下文的文本转语音模型,可精准转化情感语调并捕捉声音特征,实现了声音风格、年龄、性别、方言等要素的精准融合 [8] - 公司产品划分为两大创意领域:面向媒体娱乐创作者的创意平台,提供旁白、配音及音频后期制作服务;以及致力于重塑交互体验的智能助手领域 [8] - 公司拥有约20个产品团队,每个团队规模在5到10人之间,拥有完全自主权推进产品发布,这种小团队模式带来了强烈的主人翁意识和极快的推进速度 [8] - 在转向企业级市场时,核心在于构建系统内的知识库集成,并协助客户将知识库部署到电话服务商等系统中,同时解决从演示到生产环境的部署、测试、版本控制和长期监控优化等关键环节 [23] 研发与产品平衡策略 - 公司决策原则是:若研究工作预计超过三个月,产品团队即可自由添加新模型或扩展功能 [7][9] - 内部研究团队的指导原则是明确本季度希望交付的项目与长期计划,对于长期项目,利用其他工作填补时间差并优化方案 [9] - 公司早期曾为保持产品理念(如不添加语速调节滑块)而在研究层面攻坚九个月未果,最终由产品团队以极简方案解决,赢得了用户认可 [9] - 面向企业客户时,稳定性与可靠性至关重要,公司明确划分Alpha版本与非Alpha版本的界限,合作伙伴可自主决定是否优先获取可能存在不稳定性的Alpha版本 [25] - 在公司内部,项目被划分为“产品市场匹配前”与“产品市场匹配后”的阶段,前者给予6个月验证期,若未能达标则终止该产品 [26] 组织架构与人才管理 - 公司采用扁平化组织架构,实行无头衔制度,员工角色由能力而非资历决定,小团队模式(5-10人)使新成员从加入起就能对公司产生影响 [7][14] - 新组建的团队有六个月时间证明其价值,若能证明即可留存并继续运作 [14] - 公司采用全球化与枢纽办公室混合模式,在伦敦、华沙和旧金山设立枢纽办公室,以帮助新人融入,同时允许习惯远程的员工继续远程工作 [12] - 公司探索非传统招聘路径,例如曾招募一位在呼叫中心工作但拥有顶尖开源文本转语音模型的工程师,他后来成为团队中数据处理领域最杰出的研究员之一 [11] - 公司在某些岗位持续招募非常规背景的人才,并将其与传统背景的员工融合,后者能为前者提供指导,这种组合在销售等领域效果显著 [12] 市场拓展与行业合作 - 公司最初采用产品驱动增长模式,并尝试让工程师承担销售职能,但未奏效;目前采取销售占80%、工程占20%的混合模式,关键在于深度理解客户需求并紧密协作 [21] - 公司创建了声音市场平台,用户可创作并分享声音素材,被使用时即可获得收益;平台已拥有近万种声音资源,并向社区成员返利1000万美元 [17] - 公司与Merlin、Cobalt等四大唱片公司合作,通过授权方式将其音乐资源引入音乐模型,既能生成内容又能授予商业权利,此合作协议花费18个月才敲定 [18] - 行业合作的首要之务是深入理解行业的核心诉求与激励机制,明确哪些环节适合引入AI,哪些需要保留人工操作 [16] - 对于完全陌生的领域(如法律),公司采用引入深耕该领域的全职人员与大量咨询专家相结合的模式,以确保有效沟通和风险共担 [19][20] 企业级转型与规模化挑战 - 公司从服务创作者的品牌成功转向企业级市场,在AI智能助手平台、文本转语音及文本模型领域取得进展 [21] - 企业级应用的核心价值在于基础架构的稳固性,包括安全性、合规性以及高可用性,公司目标是为客户提供99.99%甚至99.999%的可用性保障 [24] - 随着团队规模扩大至350人,市场团队的激励机制变得至关重要;公司意识到配额与佣金是战略的滞后指标,必须确保其与战略目标紧密贴合,以最小化行为偏差 [26][27] - 公司实行独家销售制度,并设置防护措施,例如当销售团队遇到可能损害长期利益的交易时(如为赚取更高佣金而压低价格),可以上报并取消交易,即使这意味着放弃佣金 [27] - 在转向企业市场初期,内部存在怀疑态度,需要让团队相信长期方案的有效性,并在12个月后证明了方案的成功 [24]