Workflow
AI音乐
icon
搜索文档
AI 音乐都发展成这样了?藏师教你一键生成爆款 AI 音乐
歸藏的AI工具箱· 2025-10-16 13:19
AI音乐生成技术演进 - Suno V5模型在音乐生成质量上实现显著突破,音频清晰度极高,用户难以分辨AI生成内容与真人演唱的区别[1] - 该模型支持多维度的音乐元素控制,包括风格提示词、自定义歌词、分段落提示词以及音频上传修改功能,超越了早期版本仅能处理简单提示词的限制[5] - 新增Studio专业模式提供分音轨生成和控制能力,类似专业音频软件的操作逻辑[5] 市场应用与传播热度 - AI生成音乐内容在短视频平台呈现爆发式传播,单个作品获得数十万点赞成为普遍现象[3] - 技术应用范围扩展至热门娱乐形式,例如近期流行的《技能五子棋》也采用AI技术生成背景音乐[3] - 模型支持对经典歌曲进行多风格重混音,例如使用陶喆风格演绎《搁浅》或贾斯丁·比伯风格演绎《兰亭序》[6] 技术操作流程设计 - 工作流分为垫音生成(基于原曲调重新混音)和纯提示词生成(完全创新曲调)两种核心模式[6] - 操作界面包含歌词标注系统(方括号内提示词控制演唱风格)、全局风格设置、人声性别选择等专业参数[7] - 关键参数包括怪异值(控制音乐偏离主流程度)和风格遵循度(控制模型自由发挥空间)[8] 提示词工程体系 - 开发出结构化提示词生成模板,通过大型语言模型自动生成符合Suno要求的专业提示词[9] - 全局风格提示词需包含四大要素:核心曲风、标志性乐器编配、音色与演唱技巧、制作与节奏特点[10][11] - 分段指令系统要求智能划分歌词结构(主歌、副歌、桥段等),并为每个段落设计符合歌曲发展逻辑的编曲指令[12] 版权规避与商业化应用 - 针对版权限制提供两种解决方案:用户自主翻唱录制或使用翻唱音频规避版权检测[20] - Audio Influence参数允许控制生成声音与原始音频的相似度,低设置值可避免音色复刻风险[20] - 技术特性使Suno具备替代传统调音师的潜力,特别适用于内容创作者进行音乐后期处理[20] 行业影响评估 - AI音乐技术从纯生成逻辑转向编辑创作逻辑,大幅提升自由度和准确性[21] - 该技术可能打破音乐行业现有格局,使经典音乐作品能够被低成本、高质量地重新混音创作[21] - 与传统音乐平台低质量Remix内容相比,AI生成音乐在艺术质量上具备明显优势[23]
一年下架 7500 万首,Spotify 下力气整治“AI垃圾曲目”
36氪· 2025-09-29 12:12
Spotify平台AI音乐清理行动 - 公司过去一年删除了超过7500万条"垃圾曲目",主要包括违规AI生成音乐、未经授权模仿人声的AI歌曲以及被擅自上传至真实音乐人主页的作品 [1] AI音乐在平台留存现状 - 清理行动后平台上仍存在大量AI音乐内容,包括月听众数量在30万到60万不等的知名AI音乐人(如The Velvet Sundown、Aventhis、The Devil Inside)以及9月份发布的新作品 [2] - 平台仍存在大量使用AI生成头像、快速发专辑的AI音乐人账号,表明清理行动并非一刀切 [2] - 部分AI音乐人通过平台流量实现盈利,例如开通粉丝捐赠通道和线上周边商店 [3] Spotify新政策与措施 - 推出"反冒名政策",针对未经许可模仿人声的AI音乐并开通举报通道,但主要依赖原创音乐人及其团队进行举报 [4] - 与发行商合作测试新预防策略,从源头阻止作品被擅自上传至真实艺人主页,并投入更多资源处理内容错配问题以缩短审核时间 [4] - 计划在秋季推出"音乐垃圾过滤器",识别批量上传、重复歌曲、靠SEO刷关键词和故意做短的歌曲等行为 [4] - 与行业组织DDEX合作制定AI音乐署名标准,要求发行商和唱片公司记录歌曲是否使用AI,但具体披露方式尚未确定 [5] 行业动态与背景 - 唱片公司(环球音乐和索尼音乐)与AI公司Suno诉讼无解后,先后宣布与SoundPatrol Inc合作,采用音频视频指纹识别取证AI模型检测AI音乐版权侵权行为 [6] - Suno公司发布新的创作宿主Suno Studio,融合AI音乐生成技术与专业多轨编辑工具,瞄准专业音乐人市场 [6] - Spotify在此时宣布整顿"垃圾曲目",对外界释放了音乐平台的立场 [5][6]
海淀105款大模型背后:看这些AI玩家如何抢占内容生产制高点
量子位· 2025-09-19 06:07
AIGC重塑内容生产 - AIGC应用显著降低创作门槛 使每个用户都能成为内容生产者 全球已有4500万用户使用视频生成大模型[10][11] - 视频生成技术达到世界领先水平 多项测评指标排名第一[9] - 短剧创作时间缩减至传统方式的三分之一以下 大幅降低时间与物质成本[16] 商业化变现与市场规模 - 快手可灵大模型月付费流水超过1亿元 处于全球第一梯队商业化水平[36] - 每日生成10万条AIGC广告 营销素材日均消耗达3000万元[42] - 海外众筹项目CODE27在不到一个月内筹集超200万美元 显示强劲市场潜力[28] 技术突破与行业应用 - 实现创意平权 音乐创作从数万专业人群扩展至数亿普通用户[16] - 构建高质量数据集 采用好莱坞级影视数据提升生成内容美感[40] - 视频生成技术未来将与人形机器人和具身智能产业结合[44] 版权与合规机制 - AI音乐平台将版权完全归属用户 平台协助代发行且不占有版权[54] - 采用区块链技术实现所有权追溯 减少版权纠纷[59] - 训练数据选择所有权清晰内容 与高校合作获得专业音乐数据库支持[59] 全球化发展与文化输出 - 在巴西设立中国-金砖国家人工智能海外成果转化中心[46] - AIGC短剧成为文化输出新载体 中文在线等企业针对北美市场生成本地化内容[47][52] - 华人创业团队在MaaS和RaaS领域展现全球竞争力 多家企业获海外融资[52][53] 产业生态与投资趋势 - 海淀区备案大模型达105款 占全国总量五分之一[3] - AI原点社区聚集超过300家人工智能创业公司 覆盖大模型与算力基础设施[20] - 投资逻辑聚焦团队能力、市场规模及商业化潜力 重点关注垂直行业痛点解决方案[30] 内容质量保障机制 - 通过技术进步提升生成内容清晰度与审美符合度[39] - 增强模型可控性 支持提示词操控视频帧序列[40] - 确保内容符合法律法规要求 促进视频生态健康发展[41] 人机协同新范式 - AI作为执行工具辅助创意实现 人类保持核心创造力主导地位[48][49] - 在XR乐园等场景部署AI讲解员 增强交互体验并降低运营成本[66][68] - 文旅领域创新应用获得显著传播效果 单条视频播放量达4000万次[73]
趣丸科技“AI乐之乡”走进乡村,以AI音乐激活文化传承新动能
金融界· 2025-09-05 08:06
项目背景与范围 - 趣丸科技在乡村振兴背景下发起"AI乐之乡"项目 以AI技术为核心推动文化传承与创新 [1] - 项目覆盖广东省揭阳 清远 潮州 肇庆等地近70个乡村公益站点 服务近千名乡村儿童 [1] - 项目获得中国网络视听协会网络公益工作委员会指导 并联合广东省岭南教育慈善基金会等组织实施 [1] 音乐教育创新模式 - 通过户外音乐课堂引导儿童聆听自然之声 并用肢体动作或即兴哼唱表达情绪 [2] - 采用有奖问答 趣味游戏和陶笛互动等形式降低音乐学习门槛 [2] - 儿童使用站点配置的iPad在10分钟内即可通过AI工具完成音乐创作 [2] 科技与文化融合实践 - 在连南瑶族自治县将AI与国家级非遗"客家山歌"深度融合 儿童借助AI平台创作融合传统与科技的作品 [3] - 广州龙潭村儿童挖掘800年水乡文化 将龙舟竞技 古榕等元素转化为音乐素材 [3] - 潮州沙溪镇儿童通过"图生曲"功能将绘画作品转换为歌曲 实现科技与文化表达的结合 [3] 项目成果与社会影响 - 创作作品将参评"律动羊城・韵传九州"青少年AI音乐征集大赛 与第十五届全国运动会形成联动 [3] - AI工具成为青少年认识世界和表达自我的"数字画笔" 全流程培养创新思维 [4] - 项目为乡村文化振兴与教育均衡发展注入新动能 使音乐创作不再是遥不可及的梦想 [4]
让东北老铁人人都能当周杰伦
虎嗅APP· 2025-08-25 13:34
AI音乐行业发展历程 - 1938年贝尔实验室成功建造第一台电子语音合成器Voder 标志着AI与音频首次结缘[7] - 1957年通过算法生成人类历史上第一支计算机创作音乐作品《Illiac Suite》[7] - 2016年谷歌推出音乐生成项目Magenta 利用深度学习框架展示AI音乐生成能力[7] - 2024年Suno实现歌词 人声 伴奏等音乐内容一次性AI生成 被称为音乐界ChatGPT[9] 音潮公司核心战略 - 致力于实现音乐平权 让每个人都能用音乐记录生活 类比短视频平权塑造快手抖音的逻辑[10][35] - 通过自研音乐大模型技术 打造端到端生成能力 已建立国内最大音乐数据标注库[32][54] - 采用B端开放API接口与C端按首收费双轨模式 提供免费创作额度与IP收益分成机制[52][53] - 产品迭代周期为移动端三周一次 网页端双周一次 持续增加激发用户创作热情的功能[39][48] 技术突破与行业影响 - 2016年深度学习技术突破解决人声与伴奏分离行业痛点 分离效果异常干净[7][12] - Transformer架构大模型出现推动行业质变 千万级训练数据触发智力涌现现象[9][36] - 国内AI音乐研究人员屈指可数 资源有限导致领域封闭 仅少数高校培养相关人才[14] - 采用国产芯片降低训练推理成本 通过训推一体动态调度实现性价比优化[49] 市场竞争与差异化 - 与Suno形成差异化服务 聚焦MV配乐 YouTube版权音乐等垂直场景[60] - 面对Eleven Labs等国际竞争对手 采取API 创作工具 消费平台 IP衍生服务多维布局[61] - 产品设计融合游戏化社交元素 开发音果混合创作 音缘社交关系等独特功能[45] - 锁定学生群体作为核心用户 通过高频使用与新鲜事物接受度实现破圈传播[46] 团队构建与数据壁垒 - 核心团队包含音乐学院背景人才 算法团队可组成乐团 具备跨学科协同优势[40][62] - 与上海音乐学院建立联合实验室 由数十名学生参与构建音乐数据标注库[54] - 通过用户共创形成数据飞轮 用户花费时间越多则资产增值效应越显著[55] - 产品刚上线即获数十万注册量 通过世界人工智能大会等渠道实现推广[68]
音乐极客的平权实验:他想在写歌上再造一个快手
虎嗅· 2025-08-25 03:26
AI音乐行业发展历程 - 1938年贝尔实验室成功建造第一台电子语音合成器Voder 实现AI与音频首次结缘[4] - 1957年通过算法生成人类历史上第一支计算机创作音乐作品《Illiac Suite》 此后数十年间AI音乐发展缓慢 马尔可夫链 循环神经网络和卷积神经网络等技术难以突破全链条生成门槛[5] - 2016年谷歌推出Magenta项目 利用深度学习框架展示AI音乐生成能力 成为行业重要里程碑[6] - 2024年Suno横空出世 首次实现歌词 人声 伴奏等音乐内容一次性AI生成 被称为音乐界"ChatGPT"[7] 音潮公司核心战略 - 公司致力于实现"音乐平权" 让每个人都能用音乐记录生活 目标重塑音乐行业和IP生态[35] - 产品采用B端开放API接口与C端按首收费相结合商业模式 C端用户可免费创作4首歌 超过部分需付费 儿童音乐教育和AI教育场景完全免费[51] - 通过自建国内最大音乐数据标注库构建数据壁垒 与上海音乐学院建立联合实验室 由数十名学生参与数据标注工作[52] - 移动端产品每三周迭代一次 网页端每两周迭代一次 持续增加新功能激发用户创作热情[38][47] 技术演进与突破 - 2016年深度学习技术突破解决人声与伴奏分离行业难题 采用医疗影像血管分离模型应用于语谱图分析 效果显著提升[6][11] - 2021年Transformer架构大模型出现 2024年实现端到端音乐生成 模型训练数据达到千万首时出现"智力涌现"现象 质量突飞猛进[7][36] - 使用国产芯片进行训练和推理 采用训推一体化方案降低成本 推理请求量大时将训练机器转为推理使用[48] 市场竞争格局 - 国内AI音乐研究人员屈指可数 算法圈人员分布呈现自然语言处理最多 计算机视觉次之 音频相关最少的格局 音乐生成领域专家不足10人[13][14] - Suno专注于专业音乐人生产工具和流媒体平台 Riffusion采用GPT聊天方式创作音乐 Eleven Labs在语音合成领域领先并推出音乐API[41][59][70] - 腾讯AudioGenie专注于视频和图像配音效 多模态能力突出但非完整音乐作品生成[49] 用户获取与留存策略 - 目标用户首先锁定学生群体 因其思维活跃 接受新事物能力强 使用频率和时间充足[45] - 通过"音果"功能实现歌曲要素混合创作 建立"音缘"社交关系 游戏化创作过程增强用户粘性[43] - 提供IP养成和收益分成机制 用户可通过播放量获得收益 版权完全归用户所有[51][53] 资源投入与成本控制 - 训练推理采用国产芯片方案 性价比显著 通过动态资源调配降低运营成本[48] - 团队每月投入200-300美元测试新兴AI产品 包括可灵 即梦 PixVerse等视频生成工具 保持技术敏感度[68][69] - 依托世界人工智能大会宣传获得数十万注册用户 通过高频迭代维持用户活跃度[65]
网易云音乐(09899):25H1业绩点评:订阅增长稳健,利润超预期系销售费用收缩
光大证券· 2025-08-16 07:07
投资评级 - 维持"买入"评级 [4][5] 核心观点 - 报告公司1H25收入略低于预期(38.3亿元人民币,同比-6%),但利润超预期(经调整归母净利润19.5亿元,同比+121%),主要受益于销售费用收缩及递延所得税抵免8.5亿元 [1] - 在线音乐服务收入增长稳健(29.7亿元,同比+15.9%),社交娱乐收入下滑(8.6亿元,同比-43.1%)因直播入口关闭 [2] - 订阅收入同比增长15.2%至24.70亿元,非订阅收入同比增长20%至4.98亿元 [2] - 毛利率提升1.4pct至36.4%,销售费用同比下降55.8%至1.63亿元 [1][3] 业务表现 在线音乐服务 - 版权与自制并进:新增RBW、Starship等K-POP厂牌资源,引入李健/张艺兴/陈楚生等华语曲库,与王嘉尔合作提升流量变现力 [2] - 独立音乐人生态:注册独立音乐人超819000名,上传曲目约480万首 [2] - 产品创新:推出神光播放器、AI帮唱等功能,DAU/MAU稳定在30%以上 [3] 财务表现 - 1H25营业利润8.45亿元(同比+40.8%),剔除递延税项影响后经调整归母净利润约11亿元 [1] - 研发费用同比下降4.2%至3.79亿元,管理费用同比+3.6%至9300万元 [3] - 现金流改善:1H25经营活动现金流28.4亿元,投资活动现金流-7.43亿元 [10] 盈利预测 - 上修2025年经调整归母净利润预测至29.4亿元(较前次+55%),2026-2027年预测分别上调至25.9/28.6亿元(+19%/+17%) [4] - 2025E营业收入预计78.37亿元(同比-1.4%),2026E/2027E增速分别为8.2%/11.6% [5][10] - 经调整EPS 2025E为13.51元,对应P/E 18倍 [5] 市场数据 - 当前股价270.2港元,总市值588.49亿港元 [6] - 近1年股价涨幅198.6%,3个月涨幅32.8% [8] - 总股本2.18亿股,近3月换手率49.9% [6]
自由量级「音潮」音乐大模型独立全栈完成WAIC 2025大会主题曲,无词曲作者
IPO早知道· 2025-07-26 12:58
全链路自研技术 - "音潮"音乐大模型采用AR+NAR架构,具备多模态表征能力和创新重建模型,可高保真重建音乐信号并独立建模音乐特征,解决传统方案的音乐细节丢失问题 [2] - 研发Diffusion Transformer(DiT)模型,通过独特注意力机制同步左右声道差异,生成具有真实声场空间的沉浸式音频 [2] 全新功能"音果" - "音果"功能实现多首歌曲的曲风、情绪、音色等融合再创作,支持超参数调节以控制融合比例 [4] - 支持跨模态输入(文字/图片/视频),系统自动联合音频特征生成场景化专属音乐 [4] - 单首歌曲生成成本低于市场同类产品的五分之一,显著提升效率与成本优势 [6] 产品定位与行业影响 - 目标为音乐人提供可控、高保真、低门槛的生成式工具,推动中国AI音乐技术进入国际一线阵营 [5] - 打破音乐创作技术门槛与资源垄断,形成创作者-用户-平台多方共赢的生态系统 [5] - 版权归属用户,通过生成记录和账户身份生成唯一创作凭证,保障音乐人收益 [6] AI原生设计智能体PI - PI(Presentation Intelligence)通过意图理解、多智能体协作引擎和原生多模态编辑器构建全栈智能体Co-pilot系统 [8] - 支持从内容大纲到设计布局的全流程AI原生创作,实现唯一性专属设计 [9] - 强调人机和谐共赢与学习迭代价值观,支持动态平衡调节的协作环境 [10] 技术愿景 - PI定义"AI原生设计智能体"新品类,以AGI重塑未来交互,释放人类深层创造力 [11] - "音潮"与PI共同推动AI技术在内容创作领域的范式革新,覆盖音乐与设计多场景 [11]
用户暴涨近300万,国产AI音乐神器Mureka重磅升级V7,我们拿它复刻了「印度神曲」
机器之心· 2025-07-23 08:57
AI音乐生成技术发展 - AI音乐生成技术已实现高度拟真,部分作品在网易云音乐获得15万点赞,但仍有音质糊、人声失真等可识别特征[4] - 行业呈现加速进化态势,AI音乐作品正从"牙齿漏风"向"真假难辨"快速迭代[4][5] - 昆仑万维Mureka V7成为当前国产最强音乐大模型,在平均表现评分(57.7%)、人声真实感(70%)等关键指标超越海外竞品Suno V4.5[6][8] Mureka V7技术突破 - 相比前代V6实现全面升级:旋律动机质量从59.5%提升至72%,编曲质量从41%提升至51.5%,人声真实感从48.5%跃升至70%[7][8] - 创新性推出"自定义歌手"功能,可基于音频/视频链接模仿特定音色(如成功复现王菲空灵声线与气声唱法)[12][16] - 新增自动MV生成能力,支持土味风格视频创作,包含黄色描边歌词等特色元素[20] 核心技术MusiCoT - 采用音乐思维链技术(MusiCoT)实现三大创新:先规划结构后生成(符合人类创作逻辑)、生成结构可解释可控、主客观验证效果全面领先[27][28][32] - 通过CLAP模型实现音乐风格的可控输入,支持任意长度参考音频作为提示[31] - 技术升级推动生成作品结构完整度提升71%,旋律连贯性优化59%,达到行业顶流水准[33][34] 商业化应用场景 - 面向普通用户:支持文字Prompt生成免版权BGM(如"回忆童年的温暖钢琴旋律"),大幅降低创作门槛[23] - 面向专业音乐人:生成作品可提供创作灵感,加速从灵感到成品的转化过程[35] - 新增Mureka TTS V1音频模型,语音质量超越ElevenLabs TTS V2,支持通过文本定义音色特征(如12岁女童音、新闻播音员等)[37][44] 行业竞争格局 - 垂直领域大模型(音乐/视频)成为技术博弈新焦点,各厂商加速抢占AIGC商业化落地场景[48] - 昆仑万维形成"基础研究-基座模型-产品矩阵"全产业链,Mureka系列新增用户近300万[49][51] - 行业呈现从基础模型竞赛向垂直应用转型的趋势,音乐创作正向"全民表达"方向发展[47][52]
手把手教你用最新的AI音乐模型,创造一首属于你自己的歌。
数字生命卡兹克· 2025-07-23 08:43
昆仑万维AI音乐模型Mureka v7 - 公司推出新音乐模型Mureka v7,质量对标Suno 4.5,是国内领先的AI音乐产品 [1] - 模型提供v6、v7和o1三个版本,o1为专业级推理模型,v6/v7面向普通用户 [54][55][56] - 生成成本:o1每次10积分(两首歌),v7每次2积分(两首歌),积分制定价约几毛钱/首 [63][64][66] AI音乐创作方法论 - 歌曲结构为核心骨架,需包含前奏、主歌、预副歌、副歌、间奏、桥段、尾奏等标准化元素 [19][32][33] - 提供歌词生成模板,涵盖风格、情感基调、主题内容、结构要求等六大维度,支持OpenAI联网优化创作 [36][38] - 提示词模板可自动生成300字以内的风格描述,包含流派、情绪词、BPM等关键参数 [50][52] 产品功能与用户体验 - 支持视频链接直接解析参考,简化音频提取流程 [44] - 多语言生成能力覆盖国语、粤语、日语等 [70] - 用户实测400积分可生成大量作品,剩余322积分时已创作多首主题曲 [68][69] 版权与商业化优势 - 提供下载权属证明证书,解决AI音乐版权归属问题 [74][75] - 版权政策优于Suno,用户永久保留作品所有权 [73] - 产品定位降低音乐创作门槛,实现普通人专属歌曲创作 [79][81] 行业技术演进 - AI音乐从早期SVC合成发展到全流程大模型生成 [77][78] - 模型迭代显著提升音乐质量,消除明显AI痕迹 [12][78] - 国产模型突破实现与国际竞品(Suno)对标能力 [1][79]