Workflow
Mureka V7.5模型
icon
搜索文档
人工智能龙头“开花结果”:昆仑万维发布多款前沿模型,厚积薄发迎商业收获期
每日经济新闻· 2025-08-15 12:45
技术与商业同步跃升 - 公司正处于AI技术与商业同步发展的关键窗口期 在全球AI产业竞争加速背景下 [1] - 通过SkyWork AI技术发布周集中推出六款覆盖多模态AI核心场景的前沿模型 展示高强度研发投入转化为市场竞争力的成果 [1] - 2024年全年研发费用达15.4亿元 同比增长59.5% 重点投入AI算力芯片、大模型及应用等环节 [1][13] Mureka V7.5模型突破 - 模型构建了深度融合文化语境与语言特性的音乐音频理解模块 系统性训练覆盖中文音乐多样性 包括传统民歌、戏曲到当代民谣 [3] - 在音色与演奏技法上实现质的飞跃 通过优化ASR技术提升人声清晰度、结构感和情感真实度 显著降低机械感 [4] - 已形成成熟商业模式 包括C端流媒体平台Melodio和B端创作平台Mureka API 2025年3月年化流水超1200万美元 [3] MoE-TTS框架创新 - 首创基于MOE的角色描述语音合成框架 融合预训练大语言模型文本能力与语音专家模块 实现"知识零损失"的泛化理解能力 [4] - 在双测试集评测中 风格表现力贴合度和整体贴合度等声学控制维度领先 尤其擅长处理比喻、类比等复杂修辞 [6] - 应用潜力覆盖虚拟助手、数字人、有声创作等领域 推动行业从封闭标签式控制迈向自然语言自由控制 [6] 全栈AI技术突破 - SkyReels-A3模型实现音频驱动人像视频生成 基于DiT视频扩散模型+插帧模型+强化学习动作优化技术 [7] - Matrix-Game 2.0世界模型实现25FPS实时长序列交互生成 生成时长扩展至分钟级 为A股唯一对标谷歌Genie的模型 [7][9] - Matrix-3D模型从单图像生成可漫游三维空间 对标WorldLabs效果 短期革新游戏开发、影视制作流程 长期布局元宇宙基础设施 [9] 多模态与智能体技术 - Skywork UniPic 2.0构建理解、生图、编辑一体化能力 已全面开源模型权重与训练代码 降低开发者门槛 [9] - Skywork Deep Research Agent v2整合多模态检索、理解和生成 突破长距离信息收集与异步并行架构 输出视觉友好的深度报告 [10] - 技术迭代源于实际产品需求 具备高应用价值 为产业端提供高效、开放、可落地的AI工具集 [12] 研发战略与商业化闭环 - 公司采用"厚积薄发"策略 2025年一季度研发费用同比增长23.4%至4.3亿元 持续加码AI算力芯片与大模型研发 [13] - 技术突破快速转化为商业化应用 形成研发-落地-收益反哺的正向循环 2024年全球月活用户近4亿 海外收入占比91% [14] - AI社交业务单月最高收入突破100万美元 成为海外增长最快的中国AI应用 构建面向万亿级生态的双轮驱动模式 [14]
昆仑万维Mureka V7.5模型上线 AI音乐创作水平再迎新高度
证券日报之声· 2025-08-15 08:41
昆仑万维SkyWorkAI技术发布周 - 公司于8月11日至8月15日连续五天发布多模态AI前沿模型 包括SkyReels-A3 Matrix-Game2 0 Matrix-3D SkyworkUniPic2 0 SkyworkDeepResearchAgent及MurekaV7 5 [1] - MurekaV7 5模型在中文歌曲演绎上实现音色 演奏技法 咬字与情感表现的大幅提升 [1] 中文音乐AI技术突破 - 模型基于对中文曲风元素的深度理解 覆盖传统民歌 戏曲 华语流行金曲及当代民谣 能精准传达艺术神韵与情感色彩 [1] - 优化ASR技术提升人声真实性 通过分析演唱气息 情感起伏等微观细节 智能划分乐句并确定换气停顿位置 [2] 语音合成技术创新 - 推出MoE-TTS框架 结合预训练大语言模型文本能力与语音专家模块 实现文本与语音模态独立优化 [2] - 采用模态路由技术确保不同模态专家模块互不干扰 提升合成语音质量 [2]
昆仑万维:Mureka V7.5模型正式上线 AI音乐创作水平再迎新高度
证券时报网· 2025-08-15 05:29
昆仑万维Mureka V7.5模型升级 - 公司正式上线Mureka V7 5模型 该版本在中文歌曲演绎方面实现显著提升 包括音色 演奏技法 咬字与情感表现等维度 [2] - 模型具备对中文音乐多样性的深刻认知 涵盖传统民歌 戏曲 经典华语流行金曲及当代民谣音乐 能够准确传达中文音乐特有的艺术神韵和情感色彩 [2] - 通过优化ASR技术 进一步提升生成音乐中人声表现的真实性与情感深度 使模型成为理解模块的有力延伸 [2] - 模型能够深刻理解并再现中文音乐中蕴含的细腻情感与艺术表达 为生成兼具艺术性与真实感的音乐作品奠定技术基础 [2] MoE-TTS语音合成框架发布 - 公司语音团队推出MoE-TTS框架 这是首个基于MOE的角色描述语音合成框架 创新性地结合预训练大语言模型文本能力与语音专家模块 [3] - 框架为文本与语音分别配置专用专家模块 在Transformer核心结构中引入模态路由 确保各模态独立优化 互不干扰 [3] - 技术实现冻结文本参数的同时高效对齐跨模态信息 达到"知识零损失"的泛化理解能力 [3] - 该框架为学术界提供可复现的开放描述TTS解决方案 证明模态解耦加知识冻结迁移技术路径在语音合成领域的潜力 [3] - 技术突破有望推动行业从"封闭标签式控制"转向"自然语言自由控制"新范式 加速数字人 虚拟助手和沉浸式内容创作的体验升级 [3] - 框架计划集成至Mureka-Speech平台 作为角色配音的基座模型 为全球开发者和创作者提供开放 高效 可定制的描述性语音合成能力 [3]