AI Music Generation - 财报，业绩电话会，研报，新闻

AI Music Generation

搜索文档

锦秋集· 2025-08-19 15:55

AI音乐生成行业现状 - 自2023年底Suno推出首个"文本生成完整歌曲"产品以来，Udio、Stable Audio等平台相继上线，推动AI音乐创作领域快速迭代 [3] - 行业呈现功能定位分化趋势，国际大模型公司、生成式AI创企与中国科技企业均在布局，包括Suno（估值33亿美元B轮）、Udio（融资1000万美元种子轮）、字节跳动"海绵音乐"、腾讯"TME Studio"等 [6][7] - 主流产品支持多语言多风格生成，版权模式分为订阅用户享有版权、用户与平台共享版权等类型，二次编辑功能差异显著 [7][8] 核心测评维度与方法论 - 测评聚焦7款产品在5类场景的表现：年会BGM、冥想音乐、恐怖片配乐、R&B改编、歌手风格模仿，考察生成速度、成本、歌词匹配、中文发音等量化指标 [4][9] - 测试采用默认设置还原普通用户真实体验，对部分平台受限prompt使用GPT-4o进行语义等效重写以保证公平性 [10] - 高级功能评估侧重段落编辑、Loop化、MIDI导出等对普通用户体验的提升效果 [4] 产品能力矩阵与场景适配性背景音乐生成 - Suno和ElevenLabs在商业年会场景表现最佳，但缺乏Loop化输出功能 [13] - ElevenLabs、Udio与Suno在冥想音乐场景适配度高，多数平台尚不支持自然环境音参数控制 [17] - 悬疑恐怖片配乐场景中Suno沉浸感最强，Udio节奏更强烈适合短视频，TME Studio/海绵音乐偏娱乐向 [18] 流行歌曲创作 - R&B改编任务中Suno结构意识突出，Mureka唱功最佳，海绵音乐中文咬字准确 [28] - 周杰伦风格模仿测试显示技术瓶颈明显，无产品能完整复刻其作曲逻辑与文化语境 [32] - Mureka人声表现力测评最优，海绵音乐呈现抖音网红唱法特征 [35] 技术分化与未来趋势 - 产品分化明显：Suno定位全能型，ElevenLabs侧重结构可视化，Mureka专注歌词/人声，海绵音乐强化中文流行，TME Studio主打辅助工具集 [37] - 未来将沿两条路径发展：工具化模块服务专业创作者，低门槛生成满足大众配乐需求 [40] - 技术演进方向包括分工协作模式、风格版权合规、嵌入式场景落地、跨模态prompt语言等 [41][42][43][44] 商业化应用潜力 - 当前AI音乐最成熟落地场景为配乐生成与流行歌曲创作，风格模仿仍存技术瓶颈 [33] - 非专业用户可通过低门槛路径生成结构完整作品，中文场景中Mureka/海绵音乐优势显著 [38] - 专业场景中Udio/Suno等提供区段编辑与参考音频上传功能，TME Studio支持MIR识别等辅助分析 [39]

超越 Suno，全球首个 CoT 音乐模型Mureka O1 来了！

AI科技大本营· 2025-03-26 10:20

AI音乐生成行业发展 - 2023年全球数字音频工作站市场规模达30亿美元预计2026年70%企业将采用AI辅助创作[1] - AI音乐生成技术显著降低创作门槛支持多语言歌曲生成和音色克隆功能[7][11] - 行业呈现"人人可创作"趋势平台提供音轨分离下载功能便于二次创作[6] Mureka产品技术突破 - 2024年3月发布V6和O1两款大模型 V6采用ICL技术提升声场与人声质感 O1为首个应用CoT技术的音乐模型[19][21] - MusiCoT技术通过预生成音乐结构使旋律连贯性提升35% 歌词契合度提高40%[32][34] - 在评测中O1整体听感得分6.93 超越Suno V4的6.85 乐器多样性达7.10分[22][23] 商业化应用生态 - 开放音乐生成与语音合成两类API 支持私有数据微调模型覆盖游戏配乐等场景[36][38] - 已服务全球100+国家用户提供品牌音乐定制等B端解决方案[21][40] - 模型微调功能严格保障数据隐私不用于基座模型训练[38] 公司战略布局 - 昆仑万维2023年确立"All in AGI与AIGC"战略 2024年更新使命为"实现通用人工智能"[40] - 创始人提出未来30年是"自我表达爆发期" AI将把创作门槛降低1000倍[40] - 技术路线聚焦音乐生成领域创新包括MusiCoT等前沿技术应用[32][40]

昆仑万维(SZ:300418)

AI Music Generation

Chain-of-Thought (CoT)

Chain-of-Thought (CoT)