多模态AI黑马刷榜后再造神器：一个产品搞定图片视频播客生成，自带百种特效，大牛梅涛团队出品

产品发布 - 智象未来推出全新多模态AI创作工具vivago2.0 支持图片生成、视频生成、AI播客、特效模板等六大功能 [1][19] - 产品集成图像生成基础模型HiDream-I1和交互式图像编辑模型HiDream-E1 形成综合性图像智能体HiDream-A1 [15][73][87] - 提供300+款特效模板支持一键套用实现人物、动物、建筑物等元素的风格转换 [6][8][64] 技术能力 - 图像生成模型HiDream-I1采用稀疏混合专家技术融入扩散Transformer架构参数规模达170亿 [74][82] - 模型在HPS基准测试中获得33.82分超越Stable Diffusion v2.0的26.38分和Midjourney V6的30.29分 [78] - 在GenEval基准测试中达到85.89分在DPG-Bench测试中获得0.83分均达到SOTA水平 [79][80] - 支持文本生图、图像编辑、视频生成、唇形同步等多元功能可实现4张图像批量处理 [35][57][61] 市场表现 - 开源模型HiDream-I1-Dev在发布24小时内登顶Artificial Analysis图片生成竞技场获得1145分超越GPT-40的1140分 [13][77] - 公司完成数亿人民币A轮融资由合肥产投领投安徽省人工智能母基金等机构跟投 [91] - 2023年全球AIGC收入约200亿美元其中50%-60%来自视频和图像领域 Midjourney收入达2亿美元 [92] 商业化进展 - 公司与慈文传媒、上影集团、中国移动咪咕、寒武纪达成战略合作推出国民级AIGC视频彩铃应用 [94] - 商业模式从MaaS转向SaaS 2025年聚焦"IP二创+C端下沉"战略目标构建规模化商业生态 [99][101] - 产品已在Web端与App全球同步上线服务器曾因访问量过大出现拥堵 [17][70] 团队背景 - 公司由加拿大工程院外籍院士梅涛于2023年3月创立核心团队来自微软、百度、腾讯等企业博士硕士占比超90% [88][91] - 团队2017年在ACM Multimedia发表文本生成视频论文为全球首批研究该技术的团队之一 [88][89] - 研发团队包含大量中科大背景人员技术路线聚焦视觉多模态基础模型 [11][90]