产品发布 - 智象未来推出全新多模态AI创作工具vivago2.0 支持图片生成、视频生成、AI播客、特效模板等六大功能 [1][19] - 产品集成图像生成基础模型HiDream-I1和交互式图像编辑模型HiDream-E1 形成综合性图像智能体HiDream-A1 [15][73][87] - 提供300+款特效模板 支持一键套用实现人物、动物、建筑物等元素的风格转换 [6][8][64] 技术能力 - 图像生成模型HiDream-I1采用稀疏混合专家技术融入扩散Transformer架构 参数规模达170亿 [74][82] - 模型在HPS基准测试中获得33.82分 超越Stable Diffusion v2.0的26.38分和Midjourney V6的30.29分 [78] - 在GenEval基准测试中达到85.89分 在DPG-Bench测试中获得0.83分 均达到SOTA水平 [79][80] - 支持文本生图、图像编辑、视频生成、唇形同步等多元功能 可实现4张图像批量处理 [35][57][61] 市场表现 - 开源模型HiDream-I1-Dev在发布24小时内登顶Artificial Analysis图片生成竞技场 获得1145分 超越GPT-40的1140分 [13][77] - 公司完成数亿人民币A轮融资 由合肥产投领投 安徽省人工智能母基金等机构跟投 [91] - 2023年全球AIGC收入约200亿美元 其中50%-60%来自视频和图像领域 Midjourney收入达2亿美元 [92] 商业化进展 - 公司与慈文传媒、上影集团、中国移动咪咕、寒武纪达成战略合作 推出国民级AIGC视频彩铃应用 [94] - 商业模式从MaaS转向SaaS 2025年聚焦"IP二创+C端下沉"战略 目标构建规模化商业生态 [99][101] - 产品已在Web端与App全球同步上线 服务器曾因访问量过大出现拥堵 [17][70] 团队背景 - 公司由加拿大工程院外籍院士梅涛于2023年3月创立 核心团队来自微软、百度、腾讯等企业 博士硕士占比超90% [88][91] - 团队2017年在ACM Multimedia发表文本生成视频论文 为全球首批研究该技术的团队之一 [88][89] - 研发团队包含大量中科大背景人员 技术路线聚焦视觉多模态基础模型 [11][90]
多模态AI黑马刷榜后再造神器:一个产品搞定图片视频播客生成,自带百种特效,大牛梅涛团队出品
量子位·2025-06-24 13:36