智象未来团队荣膺ACM MM 2025最佳演示奖:重新定义对话式视觉创作
格隆汇·2025-11-06 05:23

公司成就与行业认可 - 智象未来团队在第33届ACM国际多媒体会议(ACM MM 2025)上成功摘得最佳演示奖,成为中国首个获此殊荣的多模态生成式人工智能初创企业团队[1] - ACM国际多媒体会议由国际计算机学会主办,是全球多媒体领域最具权威性与影响力的学术盛会之一,其最佳演示奖具有极高含金量和行业认可度[2] - 公司还举办了Identity-Preserving Video Generation挑战赛,吸引了北京大学、上海交通大学、腾讯等国内外顶尖科研及企业团队参加[6] 核心技术优势 - 获奖的“灵感智能体”统一多模态智能体以革命性技术将复杂的视觉内容创作转化为直观的对话体验[2] - 该技术突破碎片化多模态技术工具的局限,在单一界面内无缝整合了文本生成图像、指令式图像编辑及文本/图像生成视频功能,有效解决了跨模态语义对齐的行业难题[2] - 核心技术基于170亿参数量的HiDream-I1模型,依托稀疏扩散Transformer结构与动态混合专家设计,在国际权威基准测试中表现优异[2] - 针对指令式图像编辑任务,团队通过上下文视觉条件优化HiDream-I1模型,实现精准的图像修改效果[2] 产品应用与市场影响 - 该智能体开创了可及性、交互式视觉叙事和多模态生成AI中协作内容创作的新方式,将生成和编辑融合于一个对话驱动的体验中[5] - 技术显著降低了高质量视觉内容创作的门槛,并缩短了迭代周期,实现从想法到优质产出的“一次会话”创意循环[5] - 该技术原型已成功迭代应用于公司旗舰产品vivago.ai的对话生成功能中,为用户提供更自然、个性化的多模态对话交互体验[5]