AI视频生成,如何撕开创作边界?
36氪·2025-12-18 09:26

AI视频生成技术成为行业焦点 - 2025年下半年AI视频生成成为全球AI行业最受关注的方向之一,热度以“病毒式”速率扩散[5] - 技术进步是核心驱动力,过去两年视频生成技术在画面质量、时序建模与可用性上持续进步,全球AI视频能力迭代节奏显著加快[5] - 当生成效果跨过“能看”门槛,开始接近“可用”、“好用”时,AI视频真正进入大众视野并成为极具想象空间的赛道[6] 视频行业面临结构性生产难题 - 视频是全球增长最快、资本最密集、创新最活跃的领域之一,已成为信息、娱乐与商业的核心表达形态[7] - 行业竞争加剧将内容生产推向极限,短剧、电商与广告进入“更快、更细、更大量”阶段,内容更新周期被压缩到小时级甚至分钟级[7] - 传统制作链路依赖的人力规模与制作周期,与新的内容生产节奏形成明显错位,压力在不同领域显现[7] AI视频正在重塑内容产业生态 - 创作门槛被显著拉低,个人创作者与小团队开始具备接近工业化的视频生产能力[9] - 围绕视频生成的新中间层正在出现,包括创作工具、工作流平台及面向广告、电商、短剧的垂直解决方案[9] - 视频生产从一次性创作转向可规模化运行的系统工程,内容成为可反复生成、快速验证、持续优化的过程性资产[10] - 国内外涌现大量AI视频产业链创业公司,技术突破与国内规模化需求汇合,AI视频生成被视为下一代内容基础设施的重要组成部分[10] 不同公司的技术路径与战略侧重 - OpenAI的Sora策略偏向通用能力展示,通过高质量视频生成推动AI视频进入大众文化与社交传播场景[12] - Google的Veo强调模型在长时序理解与复杂场景中的表达能力,体现为技术能力的前沿探索[12] - 国内公司更多从平台生态出发,将视频生成能力与内容分发、创作者体系结合,或赋能视频生产全流程以提升效率[12] - 市场存在C端(娱乐表达)与B端(商业生产)需求的分野,B端场景要求镜头、人物与风格长期保持一致,内容可控、可复用,并能稳定高频输出[13] - 阿里选择将AI视频生成做成行业级基础设施,其通义万相2.6模型试图回应行业从能生成走向可生产、从尝鲜迈向规模化落地的趋势[13] 通义万相2.6的核心技术能力突破 - 将多镜头叙事能力提升为模型核心能力,强调在生成过程中对时间轴与镜头语言的整体建模,支持自然语言分镜指令[15] - 将参考对象从图片升级为视频,支持输入约5秒参考视频,复刻主体外观、动作模式、表情变化与音色特征,实现声画一致生成[18] - 将可控生成时长稳定在约15秒,并支持1080P输出与声画同步,满足广告、电商、短剧等商业场景对“刚好可用”内容长度的需求[21] - 文生图能力同步升级,引入对叙事结构的理解,支持图文混排输入,从简单提示中自动拆解故事并生成分镜画面[21] - 在中文语境与中式美学上持续投入,使模型在人物气质、风格表达与文化细节上更贴近本土创作需求[23] AI视频带来的生产效率革命 - AI视频生成介入创作前端,将编剧、导演、剪辑、美工等跨岗位协作工作压缩进同一界面,显著降低岗位交接成本[27] - 内容生产从线性流程转向以模型为核心的并行与即时生成,效率提升最先影响短剧、漫剧、电商内容、出海创作工具等对成本和周期高度敏感的场景[29] - 在广告和电商领域,AI将创意验证环节前置,显著压缩从想法到可视化内容的距离,用于内部讨论、客户提案或A/B测试[31] - 稳定、可规模化的视频生成能力催生新的工具平台、创作社区与内容服务,形成不断自我扩展的AI创作生态[31] 行业实践案例展示生产力提升 - AI漫剧与短剧工具平台巨日禄通过调用通义万相模型,将图片与视频生成能力嵌入创作工具链,大幅降低使用门槛[32] - 通义万相2.6在主体一致性、指令遵循等方面的稳定性,使巨日禄可以全天候、规模化使用,其智能体效率提升5-8倍[32] - 出海社交与内容公司乐我无限利用万相的多模态生成能力,支持海外创作者快速生成高质量AI视频,提升社区内容密度与创作质量,并助力冷启动[32] - 稳定型AI视频基础设施正在显著降低小团队乃至个体创作者的创作门槛,使有限人力条件下仍能维持稳定叙事质量并持续输出体系化内容[33] 从“好玩”到“好用”的关键在于稳定与集成 - 企业和创作者关心的核心是生成结果是否可控、稳定,能否减少反复抽卡和人工返工成本,稳定性是进入生产流程的前提[36] - 通义万相依托阿里云大模型服务与应用开发平台百炼,可被嵌入企业既有内容生产与业务流程,并非孤立工具[37] - 阿里云作为全球领先的全栈人工智能服务商,在算力供给、数据治理、模型服务及大规模并发调度等方面的工程能力,保障了视频生成模型在真实生产环境中的稳定持续运行[37] - 阿里对人工智能的系统性投入可追溯至十多年前,长期技术积累使其能够构建从模型训练、部署到服务化调用的完整链路[39] AI视频生成降低门槛并重新定义创作 - 当镜头语言、叙事节奏、美术风格等专业能力被编码进模型,创作者所需掌握的技能正从具体技法转向判断、创意与取舍本身[39] - 这种变化类似于从专业级影像软件走向大众化创作工具的历史拐点,AI视频生成正在把一整套专业制作能力压缩为可被普通人调用的基础设施[40] - 在降低门槛的同时,创作本身将具备更大的规模与更长的生命力[41] - 视频生成的终点并非替代创作者,而是让创作者将精力更多投入到真正有价值的部分——创意、叙事与判断本身[42]