AI视频生成 - 财报，业绩电话会，研报，新闻 - Reportify

AI视频生成

搜索文档

可灵AI再进化 2.1模型将推出“电影级”首尾帧功能

证券时报网· 2025-08-15 04:05

产品功能升级 - 快手旗下可灵2.1模型于8月15日开启全新首尾帧功能内测 [1] - 新功能支持用户自定义首尾帧图像生成连贯高质量视频内容 [1] - 升级带来更流畅的电影级运镜控制与丝滑自然转场效果 [1] 技术能力提升 - 模型实现精准复杂语义理解并提升文本响应能力 [1] - 功能显著增强视频一致性和稳定性 [1] - 有效克服AI视频生成中转场生硬和文本响应不足等痛点 [1] 应用场景拓展 - 新功能特别适用于产品宣传片等专业创作场景 [1] - 可支持AI电影和AI短剧等高阶视频内容制作 [1]

可灵2.1模型

可灵2.1模型

港股科技ETF（513020）涨超2.5%，技术迭代与成本优化驱动AI视频产业扩容

每日经济新闻· 2025-08-13 05:53

AI视频生成技术进展 - AI视频生成技术在成本优化和内容创新方面取得显著进展快手可灵通过技术迭代实现推理成本下降阿里Wan2.2的MoE架构可节省50%计算消耗 [1] - 行业普遍采用此类技术将降低用户使用成本并提升渗透率 AI参与度从50%提升至80% 真人实拍环节也可被AI工具替代 [1] - AI漫剧生成和转绘等新形态推动内容市场扩容测算显示AI视频潜在空间达416亿美元其中B端商业化空间约397亿美元（渗透率20%） P端创作者市场约38亿美元 [1] 行业趋势 - 视频时长延伸年内或达1分钟成本下降带动"更好更便宜" 新内容品类扩充供给 [1] - 技术突破与成本优化将加速产业趋势尤其看好多模态AI应用出海布局的公司其商业化进程或更快 [1] 港股科技ETF - 港股科技ETF（513020）跟踪的是港股通科技指数（931573）该指数主要覆盖通过港股通渠道可投资的科技相关企业 [1] - 成分股以非必需性消费行业为主同时涵盖汽车药品及生物科技资讯科技器材等多个恒生二级行业旨在反映市场中科技板块的整体表现 [1] 基金产品 - 没有股票账户的投资者可关注国泰中证港股通科技ETF发起联接C（015740）国泰中证港股通科技ETF发起联接A（015739） [2]

资讯科技器材

港股科技ETF（513020）

国泰中证港股通科技ETF发起联接C（015740）

国泰中证港股通科技ETF发起联接A（015739）

资讯科技器材

港股科技ETF（513020）

国泰中证港股通科技ETF发起联接C（015740）

国泰中证港股通科技ETF发起联接A（015739）

6秒造一个「视频博主」，Pika让一切图片开口说话

机器之心· 2025-08-13 03:27

Pika音频驱动表演模型 - Pika推出名为"音频驱动表演模型"的新模型允许用户上传音频文件结合静态图像生成高度同步的视频实现精确口型同步自然表情变化和流畅身体动作 [3][4] - 该技术可将任意静态图片与音频结合生成动态视频如自拍搭配语音可实现口型神同步眉毛挑动等细节精准匹配生成时间仅需6秒支持720p高清且视频长度不限 [6] - 目前功能仅限iOS端且需要邀请码尚未全面开放 [7] 技术应用场景 - 适用于社交媒体内容创作如生成说唱视频脱口秀片段等可快速制作创意短片和Meme [16][17] - 潜在应用包括游戏开发(NPC对话动画) 教育领域(生动讲解视频) 未来可能发展个人AI数字分身 [17] - 支持多语言音频输入对不同语种表现良好 [14] 用户实测效果 - 网友测评显示唇同步准确性极高有效避免AI视频常见"假唱"问题说唱停顿处人物表情自然但手部动作仍有瑕疵 [11] - 官方展示案例包括跨语言视频脱口秀模仿和实景吐槽等演员表现力突出 [12][15][16] 行业影响 - 技术显著降低视频制作门槛传统需顶级特效师耗时半月的工作现可6秒完成 [6] - 可能引发新一轮创意视频爆发但同时也带来虚假信息鉴别等新挑战 [17]

Artificial Intelligence

音频驱动表演模型（Audio-Driven Performance Model）

Artificial Intelligence

音频驱动表演模型（Audio-Driven Performance Model）

谁是最被低估的AI股？摩根大通：快手！

华尔街见闻· 2025-08-13 01:55

核心观点 - 摩根大通认为快手科技是最被低估的AI股票目标价从71港元上调至88港元上行空间22% 并重申其为中国数字娱乐板块首选股 [1] 可灵业务前景 - 摩根大通将可灵2025年和2026年收入预期分别从7.5亿元和12亿元大幅上调61%至12亿元和19亿元 [2] - 可灵4月和5月月度流水均突破1亿元人民币多数收入来自PC端而非移动端 [2] - AI视频生成潜在市场规模超过1000亿美元可灵价格仅为海外同业20-30% 在海外市场有广阔增长空间 [2] 外卖业务模式 - 快手采用以聚合为中心的轻资产外卖模式主要利用与美团等成熟企业合作而非自建物流 [3] - 该模式可最小化前期投资并通过收取流量入口服务佣金带来额外变现机会 [3] 核心广告与电商业务 - 快手广告和电商业务未充分变现预计2026-2027年广告和电商佣金收入年复合增长率13% [4] - 用户流量保持稳定未受微信视频号影响收入结构向高利润率业务倾斜 [4] - 预计2026-2027年利润年复合增速达20% [4] 财务预测 - 2025年净收入预测345.8亿元同比增长12% 环比增长6% [6] - 在线营销服务收入195.95亿元同比增长12% [6] - 2025年营业利润(IFRS)47.11亿元同比增长21% 环比增长11% [6] - 2025年非IFRS净利润51.41亿元同比增长10% 环比增长12% [6] - 毛利率55.2% 营业利润率13.6% 净利润率12.9% [6] 估值分析 - 尽管年初至今股价反弹73% 但估值仍具吸引力对应14倍2025年预期市盈率和11倍2026年预期市盈率 [7] - 基于14倍2026年预期市盈率设定目标价88港元反映对广告业务加速增长和可灵强劲势头的乐观看法 [9]

速递｜华人前谷歌团队的一键AI造梗视频，OpenArt已获500万美元融资，ARR目标2000万美元

Z Potentials· 2025-08-10 03:57

AI生成视频行业趋势 - AI生成的离奇角色视频（如穿运动鞋的鲨鱼、卡布奇诺脑袋的芭蕾舞者）正受年轻用户热捧 [3] - 初创公司OpenArt推动这一趋势，拥有约300万月活跃用户 [4] OpenArt公司概况 - 由两位前谷歌员工于2022年创立，已从Basis Set Ventures和DCM Ventures筹集500万美元资金 [4] - 实现正向现金流量，年收入目标超2000万美元 [4] - 推出"一键故事"功能公开测试版，支持输入文本生成一分钟视频（TikTok/YouTube等场景适用） [4] "一键故事"功能细节 - 提供三种模板：角色Vlog、音乐视频、解说视频 [5] - 用户可上传角色图片或歌曲，AI根据歌词生成主题动画（如花园鲜花盛开场景） [5] - 整合超50种AI模型（如DALLE-3、GPT、Stable Diffusion等），支持故事板模式精细编辑 [5] 技术差异化与未来计划 - 强调角色一致性优势，确保视频叙事连贯性（普通AI模型依赖独立片段需用户拼接） [9][10] - 计划迭代功能：支持双角色对话视频、开发移动应用程序 [11] 商业模式 - 采用积分付费系统：基础版14美元/月（4000积分）、进阶版30美元/月（12000积分）、无限版56美元/月（24000积分）、团队方案35美元/成员/月 [12] 行业争议与应对 - 存在知识产权侵权风险（如生成皮卡丘、海绵宝宝等角色） [7] - 模型默认拒绝受版权保护角色生成，但存在漏网之鱼，公司愿与版权方洽谈授权 [7]

兔子蹦迪疯传，5亿观看！全球恐慌：一段AI视频把全人类拉入虚拟现场

搜狐财经· 2025-08-04 04:24

新智元报道编辑：KingHZ 【新智元导读】一段兔子深夜「蹦迪」的视频令上亿人上当！许多人未能识破，甚至在TikTok上引发大量转发。随着AI技术的进步，真假难辨的视频越来越普及，让人不禁思考，未来我们如何区分虚拟与现实？最近，一段萌兔深夜「蹦迪」假视频骗了全球上亿人真感情！曾认为自己不会被AI欺骗的一代人，竟然被下面这段兔子蹦床视频给骗了：乍看上去，视频里的兔子非常可爱，TikTok的这段视频还配有文字：刚刚查看了家里的安全摄像头…我觉得我们家后院的蹦床上有客人来了！@Ring 兔子们玩得很开心，网友Greg很上头，发推表示自己之前从来没有这类视频如此上头：然而，这些兔子并不是真的：这段视频是由人工智能生成的。在视频的第五秒和第六秒之间，画面中的一只兔子突然消失了。显然这是假视频。左上角那只兔子消失的瞬间这段AI视频之所以难以识破，部分原因在于监控录像本身就画面模糊。人们第一眼看到这种视频，很难察觉是AI制作的，因为普通人已经习惯了模糊且昏暗的监控画面，而这恰好掩盖了人们通常用来判断视频是否为AI生成的一些特征。此外，该画面背景是静态的；目前较新的AI视频生成技术在呈现视频前景主体方 ...

英伟达Omniverse平台

英伟达Omniverse平台

赛道Hyper | 阿里开源通义万相Wan2.2：突破与局限

华尔街见闻· 2025-08-02 01:37

技术突破 - 阿里巴巴开源电影级视频生成模型通义万相Wan2.2，包含文生视频、图生视频和统一视频生成三款模型，其中文生视频和图生视频模型首次采用MoE架构 [1] - MoE架构由高噪声专家模型和低噪专家模型组成，分别负责视频整体布局和细节完善，总参数量27B，激活参数量14B，同参数规模下可节省约50%计算资源 [1][4] - 激活参数占比高达51.85%，远超行业水平（如GLM-4.5激活占比仅9%），体现公司在模型架构设计与优化方面的技术积累 [6][7] 技术架构创新 - MoE架构通过动态选择专家模型参与推理，提高计算效率和性能，特别适合大型神经网络训练和推理 [2] - 架构设计针对视频生成瓶颈，将模型拆分为处理整体布局的高噪声专家模型和专注细节的低噪专家模型，形成分工明确机制 [2] - 需要精准把握视频生成数据流向和处理逻辑，以及复杂的算法设计和大量实验调试才能实现高效参数激活策略 [7] 行业影响 - 公司选择开源策略，在GitHub、HuggingFace等平台提供模型代码，降低研究门槛并可能加速技术场景落地 [8] - 此举可能加剧视频生成技术迭代速度，因其他企业可基于开源技术进行优化升级 [8] - 代表中国企业在全球AI视频生成领域的重要发声，与国际竞争者形成差异化路径（资源效率提升vs时长优势） [10][11] 应用场景 - 当前5秒高清视频生成能力更适合创意工具场景，如影视前期策划可视化、广告短视频初稿制作 [9] - 存在明显局限性：复杂叙事需人工拼接，与电影级生产需求有差距，且美学控制依赖用户专业提示词 [9] - 未来需解决长时序下的逻辑连贯性、画面一致性等问题才能实现更广泛应用 [9][12] 行业趋势 - 视频生成技术处于快速进化阶段，从文本到视频的跨越需要算力、数据、算法综合突破 [12] - 技术价值在于提供新选择而非颠覆行业，未来渗透更多领域需突破技术瓶颈并验证商业模式 [12] - 企业面临平衡技术研发投入与商业回报的挑战，这比单纯技术突破更复杂 [12]

通义万相Wan2.2

通义万相Wan2.2

水果刀切万物：AI做起了ASMR视频

虎嗅· 2025-08-01 07:36

AI ASMR视频内容趋势 - AI生成的反常识切水果视频在Tiktok爆火账号5天涨粉十几万并引发跟风模仿 [1][7] - 猎奇类内容涵盖冰键盘敲击声、沉浸式钻石披萨吃播、粘土风微缩景观及动画改编吃播突破物理限制创造感官新体验 [9][11][13][15] - 部分AI ASMR涉及软色情内容如"情人悄悄话"系列被质疑涉嫌违规 [17] 多模态生成技术突破 - 谷歌Veo3实现音视频同步生成支持4K输出且音频适配率出色显著降低创作门槛 [19][20][22] - 此前需通过ElevenLabs等工具分离生成音视频尤其人物口型同步难度较高 [21] - 音视频同步成为生成式AI关键节点国内快手可灵2.1、字节SeedFoley均实现同步生成功能 [31][32][34][37] 厂商产品布局与商业化 - 主流视频生成模型支持时长5-85秒谷歌Veo3采用订阅与按量计费双模式快手可灵订阅价66-666元/月 [39] - 字节即梦通过Seedance1.0模型开放API MiniMax海螺02支持1080p原生输出且性价比突出 [39][55] - 创作者混合使用多平台工具即可灵生成音效更真实即梦文字生图细节更精准 [40][42] 商业化变现路径 - 头部创作者通过售卖提示词(9.9美元)及付费课程变现专业账号月入过万 [48] - 平台流量分成与广告植入收益显著单条视频报价达6.5万 [48][50] - 解压类品牌(香薰、游戏影视)将产品植入AI切割场景进行营销 [51] 行业规模与增长 - 快手可灵9个月累计收入超1亿人民币 2025年Q1年化收入(ARR)突破1亿美元 [56] - 头部视频生成产品年化收入预计2025年达1亿美元 2026年增至5-10亿美元 [60] - 快手可灵全球创作者超4500万累计生成视频2亿个图片4亿张 [61] 竞争格局与战略优势 - 字节Seedance1.0登顶文生视频/图生视频排行榜快手可灵与MiniMax紧随其后 [55] - 平台依托短视频生态构建闭环：快手整合创作者与视频数据字节联动剪映与抖音分发 [61][62] - 技术迭代需匹配用户偏好变化持续降低创作门槛与差异化体验成竞争核心 [63]

快手(HK:01024)

音视频同步输出

音视频同步输出

中金 | AI十年展望（二十五）：视频生成拐点将至，成长性赛道迎中国机遇

中金点睛· 2025-08-01 00:09

技术路径演进 - 2024年OpenAI发布Sora后视频生成技术路径收敛至DiT（Diffusion Transformer）架构，取代了此前图像拼接、自回归扩散等混合路径[2][4] - DiT架构通过时空注意力联合建模实现89%的生成一致性，支持60秒长视频生成和多分辨率输入，物理模拟能力显著提升[7][11] - 仍存在自回归路径分歧，OpenAI GPT-4o和Sand AI采用自回归模型，认为其对长时间序列建模更合适[14] - 技术发展将沿两个方向延伸：端到端多模态大模型（如Google Gemini）和多模态理解生成统一架构（如DeepSeek Janus-pro）[16][17] 市场空间与格局 - 2024年全球AI视频生成市场规模约6亿美元，中期P端+B端市场空间有望达100亿美元[3][22] - P端市场中性测算空间32亿美元，基于1.6亿国内创作者和2亿海外创作者的付费渗透率假设[23][24] - B端市场中性测算空间94亿美元，主要来自广告、电商视频和影视行业的AI渗透[25][26] - 2025年竞争格局集中，快手可灵以20%市占率领先，Runway、海螺、爱诗等中国厂商占据主要份额[27][28] 中国厂商表现 - 中国公司在模型能力和产品力上超越海外，快手可灵2025年ARR超1.5亿美元全球领先[3][22] - 技术榜单显示字节Seedance、MiniMax海螺、快手可灵在文生视频和图生视频排名靠前[39][40][41] - 产品定位分化：可灵、海螺专注P端/B端专业用户；爱诗PixVerse、字节即梦主攻C端低门槛市场[45][48] - 商业模式以订阅制为主，高质量模式单秒定价进入0.4-2元区间，已触及创作者价格不敏感阈值[50][51] 技术应用与影响 - 视频生成已初步渗透影视、电商、广告场景，顶级动画电影制作成本从200万美元/分钟降至300美元/分钟[22][31] - 生成时长10秒内已满足多数需求，核心矛盾转向角色一致性和提示词理解能力[38] - 多模态技术重构内容生产流程，催生Prompt导演、审美把关人等新岗位，传统视频剪辑等职位面临转型[31] - 开源生态加速发展，快手Orthus、通义万相等开源模型推动行业技术民主化[19][37]

马斯克偷偷憋了个大招，Grok秒出《阿凡达》画质，好莱坞瑟瑟发抖？

36氪· 2025-07-30 03:49

马斯克又放大招！这次不是火箭，不是Grok智商升级，而是一个几乎能拍电影的AI视频生成器「Imagine」。它不但能加音效、配画面，还支持多风格生成。网友实测效果太炸裂！马斯克的Grok也能生成视频了！ Grok即将推出了「Imagine」视频功能，直接挑战谷歌的Veo 3。马斯克表示正在修复相关的bug，并且附上了机器人修复机器鸟的视频。源自古代天空的奇想：Archytas的飞行鸽 —— 可能是世界上最早的「机器人」？视频效果之炫目，让Michael Hyacinth怀疑这段视频来自某部电影中的情节。这是人类历史上首个具备自我推进能力的飞行装置。虽然它在今天看来并不算真正意义上的飞行，但这项发明在理解鸟类飞行机制与空气动力学方面，迈出了具有划时代意义的一步。视频中，机器人修复的金光闪烁的「机器之鸽」，让网友联想起古希腊数学家、哲学家、数学力学先驱Archytas的机械飞鸟传说。得到试用机会的网友，用Grok制作了赛博朋克风格的视频。代码在血色的暗室里跳动，机械手在键盘上掀起金属风暴。这个瞳孔泛着危险红光的Robot，正用二进制语言撕咬人类文明的防火墙。六块曲面屏同时倾泻数据瀑布，0与1 ...

Artificial Intelligence

Artificial Intelligence