Workflow
AI视频生成
icon
搜索文档
AI视频生成,如何撕开创作边界?
36氪· 2025-12-18 09:30
01. 当新技术遇上老难题 如果给2025年下半年的AI行业选一个受关注的方向,视频生成几乎是绕不开的答案。在OpenAI发布Sora 2并上线App版本后,AI视频的热度几乎以"病毒 式"的速率在全球范围内迅速扩散开来。 但梳理产业发展的脉络,才会发现,这并非是偶然的产品爆红。背后,是过去两年里视频生成技术在画面质量、时序建模与可用性上的持续进步。Sora、 Veo、通义万相,无论是大公司还是创业公司,不断累加的技术贡献,让全球AI视频相关能力的迭代节奏显著加快。 当技术突破与国内的规模化需求在同一时间点汇合,内容行业逐渐形成一个清晰判断:AI视频生成已经成为下一代内容基础设施的重要组成部分,更稳定 的技术和更快的工具远远不够,创作者们需要的可能是一套更底层、可扩展的生产力方案。 更深层的影响,正在产业内部逐步显现。 当模型的进步不再局限于画面质量本身,而是逐步覆盖叙事能力、人物与风格一致性、音画同步、跨镜头逻辑延续等更接近工业化生产的关键要素。当生成 效果跨过"能看"的门槛,开始接近"可用""好用",AI视频才真正进入大众视野,也随之成为当前极具想象空间的赛道之一。 与此同时,视频行业本身也在面临着一种结 ...
从分钟级等待到20倍超速:LightX2V重写AI视频生成速度上限
机器之心· 2025-12-08 04:27
核心观点 - 开源项目LightX2V通过算法与工程的全栈优化,旨在将高质量视频生成推向消费级硬件上的1:1实时体验,其技术栈在社区中迅速流行,单月下载量超过170万次[2] 技术架构与性能 - 项目目标是在主流硬件上实现视频生成的1:1实时体验,远超现有框架[2][4] - 通过系统级优化,将生成5-10秒视频的时间从几分钟压缩到与视频时长接近的水平,实现接近1:1的实时体验[7] - 在同类开源方案中,相比SGLang Diffusion、FastVideo等框架,在延迟和吞吐上具有明显优势,尤其在8GB-24GB消费级显卡区间能跑满硬件能力[7] 核心算法创新 - **Phased DMD步数蒸馏**:将原本40-50步的视频扩散过程压缩到4步,同时保持时间一致性和运动细节,基于此技术的少步模型在Hugging Face趋势榜长期靠前,累积下载量达百万级[10][11] - **LightVAE轻量级VAE**:针对视频生成场景设计,在保持高清画质和时间一致性的前提下,有效降低编解码开销,为4步推理释放更多预算[12] - 两项核心算法协同,先在算法层面打通路径,再通过工程优化榨干硬件性能[13] 全栈性能工程优化 - 通过一系列关键技术模块,将“能跑”变成“跑得快、跑得省”,并支持从单机单卡扩展到多卡集群[14][15][16] - **显存门槛**:通过步数蒸馏、低比特量化和分级Offloading,将完整工作流的显存需求压至8GB以下,入门级消费卡即可运行[21] - **吞吐与延迟**:综合使用低比特算子、稀疏注意力与特征缓存,在常见5秒视频场景下达到接近1:1的实时生成速度[21] - **低比特算子**:采用MXFP8/MXFP6/NVFP4等技术,在不明显损伤画质的前提下压缩计算与带宽,释放硬件算力[21] - **稀疏注意力算子**:利用视频时空特征的稀疏性,减少冗余计算,提升大分辨率下的吞吐[21] - **特征缓存**:对中间特征进行缓存与复用,降低重复计算,进一步缩短延迟[21] - **三层延迟隐藏Offloading**:通过精细化的显存-内存调度,在8GB显存上完成28B级别MoE模型推理[21] - **FP8通信多卡并行**:结合FP8通信和流水线/序列并行,在多卡环境下提升吞吐,面向5090等消费级新卡实现更高帧率的强实时目标[21] 模型与硬件生态支持 - **模型生态**:已支持Wan2.1/Wan2.2、CogVideo1.5、HunyuanVideo1.5等主流视频生成模型,以及Matrix Game、MagicDrive等世界模型,并提供4步或少步数配置与加速方案[21] - **应用生态**:深度集成ComfyUI,其LightVAE等核心组件已进入社区主干工作流,用户可在图形界面中直接调用加速推理[21] - **硬件生态**:除支持NVIDIA 3060/4090/5090及A100/A800/H100/H800/H200等显卡外,还原生支持寒武纪MLU590、沐曦C500等国产AI芯片,为本地化、大规模部署提供基础[21] 使用与落地场景 - **个人开发者**:只需带独显的笔记本或台式机,即可本地启动带前端界面的视频生成工具,在ComfyUI中完成素材调试、风格迭代和项目输出[21] - **企业用户**:通过服务化部署方案,可一键搭建面向外部的API服务和Web应用,并按需扩展到多机多卡集群,支持批量视频生产和内部工具集成[21] - **普通用户**:可直接访问网页版入口x2v.light-ai.top,在浏览器中体验少步视频生成和实时预览[21] - 应用覆盖从图像转视频、文本转视频,到世界模型和自动驾驶仿真等领域,旨在通过开源方式将高质量、低成本、强实时的视频生成能力普及[19]
5家消费公司拿到新钱;豆包手机陷入无法使用微信争议;蜜雪冰城开始卖早餐了|创投大视野
36氪未来消费· 2025-12-06 11:27
融资事件 - 高端黄金珠宝品牌“寶蘭”完成过亿元人民币A轮融资 资金将用于品牌价值提升、全渠道布局、供应链升级及人才赋能[3] - 智慧配送企业“江苏云闪送”完成3000万元人民币A轮融资 资金将用于智能调度系统升级、全国服务网络拓展及运力生态构建[5][6] - AI视频生成平台Pollo AI完成1400万美元首轮融资 公司注册用户超2000万 月活用户超600万 年化收入超2000万美元 已于今年5月实现盈亏平衡[8] - 具身智能机器人公司优理奇机器人(UniX AI)完成两轮合计3亿元人民币融资 公司在半年内完成五轮交割[9][10] - 具身机器人公司“戴盟机器人”完成亿元人民币战略轮融资 由中国移动链长基金投资 为三个月内完成的第二轮融资[11] 公司动态与产品 - 字节跳动与努比亚合作的豆包手机助手因操作微信导致账号异常 官方已下线相关功能 该事件涉及安卓高危权限及AI Agent的隐私挑战[12][13] - 腾讯总裁刘炽平表示微信将推出自研AI智能体 让用户在微信生态内利用AI完成任务[14] - 林清轩更新港交所上市招股书 2025年上半年营收10.52亿元人民币 同比增长98.3% 净利润1.82亿元人民币 同比增长109.86% 2024年营销费用达3.65亿元 占总营收30.17%[19][21] - 蜜雪冰城在部分城市试点早餐业务 产品包括豆浆、小米粥、三明治等 此前已在部分门店推出“咖啡+烘焙”早餐套餐[23] 行业趋势与市场数据 - 茶百道冬季新品“豆乳黑麒麟”上市首日销量突破20万杯[25] - 奈雪的茶十周年之际官宣高圆圆为品牌代言人 并推出行业首款低GI蔬果茶“瘦瘦小绿瓶”[27][28] - 2025年贺岁档电影总票房突破25亿元人民币 《疯狂动物城2》领跑票房榜[29] - 2025年中国电子竞技产业收入达293.31亿元人民币 同比增长6.40% 其中直播收入占比80.81% 电竞用户规模超4.95亿人 同比增长1.06%[30] - 2025年第三季度全球智能手机生产数量达3.28亿支 同比增长7% 机构预测2025年全年产量同比增长1.6%[31] 政策与监管事件 - 台湾当局以“资讯安全”为由宣布封禁小红书一年 网页版已无法访问 但APP仍可正常使用[15][16] - 此前台湾有关部门曾称小红书、微博、抖音、微信和百度云盘存在“高度资安风险” 国台办回应指出这些应用深受台湾民众喜爱[18]
视频模型战火再燃!Runway超过谷歌登顶,可灵也来了
第一财经资讯· 2025-12-02 07:16
行业竞争格局 - 2025年12月初,视频生成模型领域竞争加剧,海外初创公司Runway与国内公司可灵AI几乎同时发布新一代视频模型,火药味很浓 [1] - 根据Artificial Analysis基准测试榜单,Runway的Gen-4.5以1247分位列文生视频模型第一,超越谷歌的Veo3(1226分)和快手可灵2.5(1225分)[3] - 行业领先者还包括Luma Labs的Ray 3(1211分)、OpenAI的Sora 2 Pro(1205分)以及MiniMax的海螺02(1198分),竞争格局呈现多强并立态势 [4] - 从2024年开始,AI视频生成领域竞争白热化,谷歌Veo系列在2025年逐渐确立行业领先地位,挤压初创公司空间,而国内如快手可灵、MiniMax也形成了竞争力 [12] Runway公司及Gen-4.5模型 - Runway于2025年12月1日正式发布新一代视频模型Gen-4.5,在基准测试中超越谷歌Veo3登顶 [1] - 公司表示Gen-4.5在预训练数据效率和后训练技术方面取得突破,擅长理解和执行复杂的序列指令,能指定镜头调度、场景构图、事件时间及氛围变化 [5] - 该模型在精确遵循提示词、逼真的物理运动效果、风格控制和视觉一致性方面有新的进展 [5] - Runway强调Gen-4.5实现了前所未有的物理精度和视觉精度,物体能以真实的重量和动力移动,液体流动符合动力学,表面细节渲染逼真 [7] - 公司承认模型仍存在局限性,如在因果推理和对象恒存性方面不足,可能出现效果先于原因或物体意外消失的情况 [11] - Runway计划逐步开放Gen-4.5的使用权限,并以与当前订阅套餐相近的价格全面开放,即“加量不加价” [4] - Runway成立于2018年,根据PitchBook数据,公司估值已达到35.5亿美元,其于2023年2月发布第一代视频模型Gen-1,行业布局较早 [11] - Runway CEO表示,公司仅靠一百人的团队就击败了万亿美元规模的公司,认为极度专注和勤奋能触及技术前沿 [11] 可灵AI及行业其他参与者 - 在Runway发布Gen-4.5后约1小时,国内视频生成公司可灵AI在海外平台宣布上线全新视频模型可灵O1,并将其定义为“首个统一多模态视频大模型” [1] - 截至新闻发布时,基准测试榜单上尚未包含可灵O1的评分,但其被视为Gen-4.5潜在的有力竞争对手 [12] - 快手旗下的可灵2.5 Turbo 1080p模型在2025年9月发布,在基准测试中以1225分位列第三,与第二名谷歌Veo3仅一分之差 [3][4] - MiniMax的海螺02 Standard模型于2025年6月发布,在榜单上以1198分排名第八 [4] - 行业也在期待谷歌下一代视频模型Veo4的发布,围绕视频生成模型领先地位的较量预计将持续 [12]
“AI视频商业化元年”,爱诗科技ARR已突破4000万美元
观察者网· 2025-10-21 09:44
融资情况 - 公司近期完成1亿元人民币B+轮融资,投资方包括复星锐正、同创伟业、顺禧基金等 [1] - 此前于9月10日完成B轮融资,总金额超过6000万美元,由阿里巴巴领投,创下国内视频生成领域单次最大融资额 [1] - 融资资金将用于技术研发、市场拓展及团队建设,推动AI视频生成技术普惠化 [1][4] 公司产品与技术 - 公司自研视频生成大模型已完成五次迭代、八个版本更新,提供准实时、高质量、音画同步的视频生成服务 [1] - 旗下产品PixVerse V5于8月27日上线,优化动态效果、超清视觉处理、一致性保持等核心环节,并上线Agent创作助手功能 [2] - 产品PixVerse网页端上线后,通过变身特效带来1000万新用户增长,2025年5月V4.5版本上线后用户规模达6000万 [1] - 公司是国内首个发布DiT架构视频生成模型的创业公司,在极速生成与一致性等关键维度实现全球领先 [1] 用户与收入表现 - 公司用户规模已突破1亿,月度活跃用户超过1600万,年度经常性收入超过4000万美元 [2] - 产品于2024年11月正式商业化,不到一年时间收入增长超过10倍,是全球收入和用户增长最快的AI平台之一 [3] - 截至8月31日,开放平台API生成的视频数量突破1000万个,八月单月API调用量实现翻倍 [4] - 根据数据,PixVerse在9月网站访问量增长超过26.91% [4] 市场拓展与运营策略 - 公司业务布局覆盖C端与B端市场,C端定位低门槛AI视频创作工具,B端聚焦广告、短剧和游戏三大场景 [2] - 增长源于"创作–分享–互动"的社交飞轮与本地化运营,在美国、欧洲、巴西、印度、日本等市场展现出鲜明本地化偏好 [3] - 特效模板功能受热捧,例如在墨西哥和印度,"KissKiss"等模板单日生成使用峰值均超30万 [3] - 公司坚持以产品力驱动"聪明增长",拒绝盲目烧钱扩张,注重模型训练质量与成本平衡 [4] 行业背景与展望 - 2025年被业内视为"AI视频商业化元年",头部企业呈现用户规模与收入同步增长态势 [5] - 阿里巴巴、北京市人工智能产业投资基金等巨头及国资背景资本持续加码该领域 [5] - 业内分析认为,具备多模态能力、垂直场景落地能力及数据闭环能力的企业将在竞争中占据优势 [5]
爱诗科技完成1亿元B+轮融资 ARR超4000万美元
搜狐财经· 2025-10-17 16:28
融资与财务表现 - 公司于10月17日完成1亿元人民币B+轮融资,投资方包括复星锐正、同创伟业、顺禧基金等 [1] - 公司年度经常性收入超过4000万美元,自2024年11月商业化以来不到一年时间收入增长超过10倍 [1] - 产品月活跃用户数超过1600万,用户总规模已突破1亿 [1] 产品与技术进展 - 公司自研视频生成大模型在两年内进行了五次迭代,共八个版本的更新 [1] - 8月27日上线的PixVerse V5模型具备准实时生成能力,优化了动态效果、超清视觉处理、一致性保持等核心环节 [2] - 同步上线的Agent创作助手功能,使用户无需复杂提示词技巧即可一键生成专业级视频 [2] - 平台通过准实时生成与角色驱动视频等核心技术降低创作门槛,是全球最早实现角色驱动视频生成的平台之一 [2][4] 商业化与生态建设 - 公司商业化模式主要基于会员订阅服务,并于今年初开放API生态 [2] - 截至8月31日,过去半年内通过API生成的视频数量突破1000万个,八月单月API调用量实现翻倍 [2] - 产品在影像、广告、游戏制作等领域逐步应用,增强了创作者对故事叙事的掌控力 [2][4] 市场地位与用户增长 - 公司是过去一年全球收入和用户增长最快的AI平台之一,产品成为全球创作者使用AI视频生成的首选平台 [1][2] - 平台凭借“速度快、易上手、创意可控”的产品理念,迅速成为全球普通消费者体验和消费AI视频内容的“第一站” [2][4]
爱诗科技完成1亿元B+轮融资:过去一年收入和用户增长最快的AI平台之一
IPO早知道· 2025-10-17 11:14
公司融资与估值 - 公司完成1亿元人民币B+轮融资,投资方包括复星锐正、同创伟业、顺禧基金等 [2] - 此前于9月10日完成B轮融资,总金额超过6000万美元,由阿里巴巴领投,创下国内视频生成领域单次最大融资额 [2] - 公司年度经常性收入超过4000万美元,商业化不到一年收入增长超过10倍 [4] 技术与产品进展 - 公司是国内首个发布DiT架构视频生成模型的创业公司,在极速生成与一致性等关键维度实现全球领先 [2] - 自研视频生成大模型在两年内进行五次迭代,共八个版本更新,为用户提供准实时、高质量且音画同步的视频生成服务 [2] - PixVerse V5上线,优化动态效果、超清视觉处理、一致性保持等核心环节,并推出Agent创作助手功能,降低用户创作门槛 [4] - 平台通过准实时生成与角色驱动视频等核心技术,在影像、广告、游戏制作等领域逐步应用 [4] 用户与市场表现 - 公司旗下产品PixVerse与拍我AI用户规模突破1亿,月活跃用户超过1600万 [4] - 平台是过去一年全球收入和用户增长最快的AI平台之一 [4] - 开放平台在过去半年通过API生成的视频数量突破1000万个,八月单月API调用量实现翻倍 [6] - 根据AIGCRank数据,PixVerse在9月网站访问量增长超过26.91%,移动和网页端双增长 [6]
Sora 2引爆文生视频赛道,市场年均增速20%,机构建议关注三大方向
36氪· 2025-10-11 11:09
产品技术升级 - OpenAI推出视频生成模型Sora 2的重大升级,新版本在物理准确性、逼真度、可控性方面均有提升,并实现同步生成音频和对话的能力[1] - Sora 2被定义为视频生成领域的GPT-3.5时刻,在物理运动、人物塑造、跨镜头一致性控制及多模态协同能力方面取得突破,支持多镜头切换和人物口型与发音精准对齐[3] - 竞争对手xAI推出Grok Imagine v0.9,支持从静态图像转化为动态视频并集成背景音乐与对话;谷歌Veo 3.1能生成8秒720p含音轨视频,行业竞争加剧[3][4] 市场反应与表现 - Sora 2上线后不到五天下载量突破100万次,增长速度超过ChatGPT[3] - 相关概念股逆势上涨,初灵信息涨12.94%,开普云涨4.52%,视觉中国涨3.11%[1] - 2024年AI视频生成全球市场规模为6.15亿美元,预计2025年达7.17亿美元(同比增长17%),2032年有望达25.63亿美元,2025-2032年复合增长率为20%[6] 产业链与商业应用 - 文生视频行业形成“模型能力-用户场景-商业变现”完整链路,以“数据飞轮+社交网络”构建护城河[6] - AI视频生成技术从辅助创作迈向自主生成,影视、广告、游戏等行业将受益于降本增效,并催生新的商业形态[8] - 机构看好三大投资主线:算力需求爆发与架构多元化、AIoT终端(AR眼镜/人形机器人/AI手机)放量、AI+视频在金融/医疗/教育场景的飞轮效应[8] 国内公司布局 - 汉王科技在多模态识别、文本理解等技术上深耕,形成智能终端产品和行业解决方案[6] - 视觉中国与智谱清影、通义千问合作,将光厂创意平台接入文生视频API,2025年上半年视觉内容与服务营收3.99亿元(同比增长0.05%)[6] - 风语筑在数字人驱动、文生文、文生图等场景引入AIGC技术,并积极探索文生视频、图生视频等生成式3D内容场景[7]
AI视频商业化元年开启 爱诗科技创融资纪录 阿里领投押宝“下一个抖音”?
新浪财经· 2025-09-14 11:29
融资情况 - 爱诗科技完成超过6000万美元B轮融资 由阿里巴巴领投 达晨财智 深创投 北京市人工智能产业投资基金 湖南电广 巨人网络和Antler等跟投 创国内视频生成领域单次最大融资额 [1] - 资金将用于技术研发和市场拓展 推动AI视频生成技术普惠 [1] 公司发展 - 公司创立于2023年4月 致力于打造全球领先的AI视频生成大模型及应用 [2] - 2024年1月推出海外版产品PixVerse 2025年6月推出面向国内市场的"拍我AI" [2] - 全球用户规模突破1亿 4个月前为6000万 增长迅速 [2] - 自研视频生成大模型PixVerse V5位居Artificial Analysis图生视频榜首 [2] - 产品订阅收入已覆盖成本 [2] 业务布局 - C端市场是长期看好方向 产品定位为普通用户提供低门槛AI视频创作工具 [2][3] - 2025年1月开展B端业务 场景集中在广告 短剧和游戏 [3] - 广告场景可快速批量生成商品展示 口播 特定SKU广告素材 [3] - 游戏场景可提升场景资产 角色设计及激励广告的生成效率 [3] 行业竞争 - 国内主要企业包括快手(可灵AI) 抖音(即梦AI) 阿里巴巴(通义万相 绘蛙AI视频) 美图 生数科技 智谱(智谱清影AI) [5] - 国外企业包括OpenAI Meta Pika Labs等 [5] - 2025年被称为"AI视频商业化元年" 行业处于技术爆发 商业落地 资本热捧三重红利期 [5] - 具备多模态能力 垂直场景落地能力 数据闭环能力的企业将脱颖而出 [5] 战略优势 - 坚持视频生成确定性赛道 从自主研发到技术产品化未偏离核心主线 [3] - 拒绝盲目烧钱扩张 依靠产品力实现聪明增长 过去半年用户从6000万增长至1亿 [3] - 不盲目追求模型参数规模 以保证质量为前提降低训练成本 规划精细化迭代方向 [3] 创始人背景 - 创始人王长虎曾任职微软亚洲研究院 字节跳动AI Lab总监 龙湖数字化与智能化转型负责人 [4][5] - 2023年3月离开龙湖创业 4月获得首轮数千万人民币融资 6月核心团队成型 [5] - 创业思路是从视觉和多模态出发 做AIGC时代行业及应用的算法平台 [5] 投资方布局 - 阿里巴巴采取自研和投资并行路径 旗下夸克团队推出AI产品"造点" [6] - 领投爱诗科技有利于完善AI生态布局 填补视频生成领域空白 [6] - 看好AI视频生成领域巨大潜力 可解决短视频 直播行业内容创作效率和质量问题 [6]
【RimeData周报09.06-09.12】人工智能领域热潮持续!国内外利好齐发,年内融资已超500亿元
Wind万得· 2025-09-13 22:28
投融概况 - 截至2025年09月12日18:00,本周融资事件共143起,较上周增加1起,融资金额总计约67.47亿元,较上周减少91.45亿元[4] - 融资金额在亿元及以上的融资事件有25起,较上周增加8起,公开退出案例40个,较上周增加17个,参与机构191家,较上周增加21家[4] - 已披露金额的融资事件71起,较上周增加12起,金额区间分布中500万以下事件4起减少3起,500万-1000万事件32起增加8起,1000万-5000万事件8起减少2起,5000万-1亿事件15起增加5起,1-5亿事件9起增加4起,5-10亿事件3起增加2起,无10亿及以上事件[5] 重点事件 - 具身智能领域自变量机器人完成近10亿元A+轮融资,由阿里云、国科投资领投,资金用于通用具身智能基础模型训练及硬件产品研发[7] - 3D打印服务领域宏臻航天完成3.5亿元A轮融资,资金用于金属增材制造技术研发与航天设备制造业务拓展[7] - AI视频生成领域爱诗科技完成超6000万美元B轮融资,由阿里巴巴领投,资金用于技术研发和市场拓展[8] - 运载火箭领域天擎航天完成近亿元C+轮融资,由普华资本投资,资金用于产能扩张及火箭发动机结构件自动化生产线建设[8] 行业分布 - 融资事件涉及14个行业,前五行业为信息技术、电子、装备制造、医药健康、材料,合计108起占总数75.52%[11] - 按融资金额统计前五行业为电子、装备制造、医药健康、信息技术、材料,合计55.07亿元占总额81.62%[13] - 人工智能赛道2025年以来融资超500亿元,商业航天赛道融资超50亿元,受政策和技术突破推动热度较高[14][15] 地域分布 - 融资事件数量前五地区为广东省29起、江苏省25起、北京市23起、浙江省21起、上海市15起,合计113起占总数79.02%[18][20] - 融资金额前五地区为上海市20.50亿元、北京市18.13亿元、山东省10.81亿元、江苏省5.01亿元、陕西省3.60亿元,合计58.05亿元占总额86.03%[18][20] 融资轮次 - 天使轮和A轮最活跃合计98起,早期融资(A轮及以前)事件数占比69.93%,较上周减少6个百分点[23] - 融资金额分布A轮占比近4成,受自变量机器人近10亿元A+轮融资影响,B轮占比30.73%,天使轮占比11.56%[23] 投资机构 - 本周191家机构参与投资合计出手223次,毅达资本5次、元禾控股4次、创新工场3次、北京国管3次最为活跃[25] 退出情况 - 公开退出案例40个较上周增加17个,涉及13个行业,电子、电力设备与新能源、装备制造合计18个占总数45.00%[30] - 退出方式中股权转让12个增加2个,并购15个增加9个,新三板挂牌10个增加5个,IPO项目3个增加1个[31] - IPO案例包括三协电机北交所上市募资1.59亿元,大行科工港交所上市募资3.42亿港元,艾芬达深交所创业板上市募资6亿元[32][33][34]