捷成股份发布四阶影视理解大模型 AI视觉中枢重构产业生态

公司核心技术发布 - 捷成股份在2025中国数字文娱大会上首次系统性披露了自研的四阶影视视频理解大模型 [1] - 该模型旨在破解行业“高理解成本、低表达效率”的核心痛点，满足影视工业级生产需求 [1] - 基于该技术的“视觉智能中枢”已实现产业化落地并达成多项重磅合作 [1] 大模型技术架构与能力 - 模型构建了行业首个标准化技术评价框架，分为L0至L3四个层级 [2] - L0记忆层具备视觉记忆检索、自然语言匹配、名场面定位能力，能根据模糊描述精准检索内容 [2] - L1复述层可将非线性叙事重组为逻辑清晰的主线剧情，实现复杂叙事的结构化推理 [2] - L2分析层能从多元视角解读作品深层内涵，形成独立观点与批判性思考 [2] - L3解构层可精准拆解导演标志性风格，实现创作手法的创造性模拟，为再创作提供可能 [2] - 模型实现了从记忆检索到风格结构的认知跃迁，推动影视理解从“看明白”向“真理解、懂门道”演进 [3] 技术研发与数据资源基础 - 技术依托公司超过20万小时的高质量音视频素材库，囊括《长津湖》《唐人街探案》等重磅作品 [3] - 通过AI技术生成了5亿+张影视图片、10万+部配音素材及7200万+条片段素材 [3] - 公司正打造全球最大的影视级AI向量库，实现镜头级检索与跨模态内容理解 [3] 技术应用与商业化进展 - 该视频理解大模型已成功应用于公司旗下的“捷成灵犀智能体平台”与AI智能视频生产引擎“ChatPV” [3] - 应用有效弥补了通用视频模型在影视垂直领域的短板，显著提升了内容制作效率 [3] - 公司已与番茄、红果等头部IP内容平台达成战略合作，基于大模型开展全新AI内容创作 [4] - 合作建立了内容生产基地，旨在打造AI短剧千部产能 [4] 公司战略与行业影响 - 公司通过“技术+内容+渠道”的协同效应，构建从IP孵化、智能制作到全球发行的完整生态 [4] - 公司打通了“内容理解-智能创作-全域分发”的完整产业闭环 [4] - 模型的推出及商业化落地，彰显了公司在AI影视应用领域的先发优势与技术硬实力 [4] - 公司以“技术赋能+生态协同”的发展模式，为中国数字文化产品提升全球竞争力提供核心支撑 [4] - 随着技术迭代与商业化拓展，公司有望引领影视工业进入AI驱动的高质量发展新阶段 [4]