MemFlow
搜索文档
攻克长视频生成记忆难题:港大与快手可灵MemFlow设计动态自适应长期记忆,告别快速遗忘与剧情错乱
36氪· 2025-12-25 07:54
你是否曾被AI视频生成的不连贯性所困扰? 在交互式创作中,仅仅切换一句提示词,故事就可能瞬间"崩塌":一个角色暂时离开画面后再次出现,却"面目全非",仿佛换了演员;或者,当你尝试引 入一个新角色,AI却在后续的剧情中反复"召唤"这个新人,甚至将多个角色的特征混淆在一起。这种"金鱼记忆"式的顽疾,正是长视频生成在叙事上的一 大致命伤。 现在,来自香港大学和快手可灵(Kling)团队的研究者们,联合推出了突破性方案——MemFlow。 3. "各自为政"的流程:还有一些流程试图将任务拆分,先让一个模型制作关键帧脚本,再让另一个模型根据脚本生成视频。这种方式在根据各段脚本分别 生成时是各自独立的,拼接成的完整视频缺乏全局一致性。 这些僵化的、非自适应的记忆策略,无法应对交互式创作中流动的、不可预测的叙事需求,这正是导致交互式长视频生成一致性差的原因。 产生真正的长时记忆与叙事连贯性 这是一种创新的流式自适应记忆机制,它赋予了AI强大的长时记忆与叙事连贯性,有望彻底解决上述难题。 流动的叙事 vs. 僵化的记忆 为了生成长视频,主流模型普遍采用"分块生成"的策略,即像放映幻灯片一样,一段一段地生成视频片段。 然而,如 ...
攻克长视频生成记忆难题:港大与快手可灵MemFlow设计动态自适应长期记忆,告别快速遗忘与剧情错乱
量子位· 2025-12-25 00:27
MemFlow团队 投稿 量子位 | 公众号 QbitAI 你是否曾被AI视频生成的不连贯性所困扰? 在交互式创作中,仅仅切换一句提示词,故事就可能瞬间"崩塌":一个角色暂时离开画面后再次出现,却"面目全非",仿佛换了演员;或者, 当你尝试引入一个新角色,AI却在后续的剧情中反复"召唤"这个新人,甚至将多个角色的特征混淆在一起。这种"金鱼记忆"式的顽疾,正是长 视频生成在叙事上的一大致命伤。 现在,来自香港大学和快手可灵 (Kling) 团队的研究者们,联合推出了突破性方案—— MemFlow 。 这是一种创新的流式自适应记忆机制,它赋予了AI强大的长时记忆与叙事连贯性,有望彻底解决上述难题。 2. "一刀切"的压缩策略 :另一些方法试图将所有历史画面压缩成一个固定大小的"记忆包"。问题在于,不同的叙事需求要回忆的重点不 同,"一刀切"的压缩往往会丢失关键细 节, 导致主体特征遗忘和视觉质量漂移。 3. "各自为政"的流程 :还有一些流程试图将任务拆分,先让一个模型制作关键帧脚本,再让另一个模型根据脚本生成视频 。 这种方式在根 据各段脚本分别生成时是各自独立的,拼接成的完整视频缺乏全局一致性。 这些僵化的、 ...