Workflow
AI视频生成
icon
搜索文档
AI视频进入蒸汽机时代
机器之心· 2025-09-25 23:54
技术升级与核心突破 - 推出行业首个通用AI长视频生成功能,突破5秒和10秒的时长限制,理论上支持任意长度视频生成[3] - 采用流式生成技术替代传统首尾帧续写方案,用户仅需一张图片和提示词即可实现无限时视频生成,并支持实时调整提示词[4] - 引入交互式需求表达功能,允许在生成过程中暂停并修改提示词,无需等待完整推理过程结束[3][4] 性能表现与案例展示 - 生成视频实现毫秒级人物口型、表情、动作同步,中文语音细节还原度超98%[3][19] - 成功生成连贯长视频案例:小鸭子划水上岸动作流畅,水面涟漪和羽毛细节逼真;西部牛仔一镜到底场景转换丝滑;纸船漂流轨迹真实无失真[6][8][10] - 新增首尾帧功能,通过2张图片和提示词生成5秒视频,支持定格动画、季节过渡等复杂场景[11][15][16] 行业痛点与解决方案 - 解决长视频生成两大核心挑战:时长方面通过自回归扩散模型和动态缓冲区管理保障连续性与一致性;成本方面通过阶梯独立噪声构造降低平方级计算复杂度[25][26][27] - 采用历史参考帧增强策略,通过概率扰动和注意力门控机制缓解累积误差与信息漂移问题[28][30] - 引入训练指导帧和抗偏移技术,确保生成内容不偏离初始设定并保持主体一致性[32] 商业化应用前景 - 大幅降低创作门槛与成本,可应用于广告大片制作(如耳机产品展示)、影视预演、虚拟角色对话等场景[16][19][33] - 支持多角色自然对话与大师级运镜,依托海量中文语料训练实现电影级画质输出[19][33] - 推动AI视频生成从工具级片段制作向互动视频、直播等实时交互场景演进,重塑内容创作商业模式[22][37]
百度蒸汽机迎来最新升级,支持生成无限长度的AI视频
选股宝· 2025-09-25 14:41
百度蒸汽机技术升级 - 全球首个中文音视频一体化视频生成模型百度蒸汽机升级 发布通用AI长视频生成功能 支持用户生成无限长度AI视频[1] - 采用流式生成技术突破此前AI仅能生成5秒、10秒短视频的局限 实现通用长视频"无限"生成能力[1] - 一个月前已发布蒸汽机2.0版本 涵盖Turbo、Lite、Pro及有声版多个版本 丰富产品形态和用户选择[1] 产品定价策略 - 新版蒸汽机定价策略大幅下调 刊例价对比同类产品下降至70%[1] - 定价举措降低视频生成门槛 增强产品在市场上的性价比和竞争力[1] 行业应用前景 - 通用AI长视频生成功能有望拓宽AI视频生成工具应用场景 包括电影级特效、数字内容创作等[1] - 中文音视频一体化视频生成模型将推动国产AI在视频内容创作领域高速发展[1] - 视频生成领域应用持续迭代 行业头部公司持续布局 有望提升应用渗透率[1] 相关公司业务进展 - 中文在线通过自研工具链将传统动漫短剧制作11个环节压缩至5个核心步骤 实现生产周期缩短70%、成本降低50%[2] - 零点有数深耕数据分析与决策智能 涵盖AI、云计算、物联网等领域 能力可助力AI视频生成、大模型定制训练、数据治理等多个细分环节[2]
锦秋基金被投公司「生数科技」发布Vidu Q2 | Jinqiu Spotlight
锦秋集· 2025-09-25 10:48
锦秋基金于2023年年中投资了生数科技,是生数科技的早期机构投资人。 锦秋基金,作为12 年期的 AI Fund,始终以长期主义为核心投资理念,积极寻找那些具有突破性技术和创新商业模式的通用人工智能初创企业。 9月25日,锦秋基金被投公司生数科技正式发布新一代图生视频大模型Vidu Q2。新模型以" Vidu Q2 看AI演戏 "为主题,"细微表情生成"为核心提升场景,在极致表 情变化、推拉运镜、生成速度及语义理解方面取得突破性进展,实现从"生成视频"到"生成演技",从"动态流畅"到"情感表达"的革命性跨越,标志着AI视频生成技 术正式从追求"形似"进入追求"神似"的新阶段,将为内容创作、影视产业、广告营销等领域带来全新升级。 以下为此次新闻的相关内容。 生数科技全球发布Vidu Q2,推动"视频生成"走向"演技生成"时代 9月25日,生数科技正式发布新一代图生视频大模型Vidu Q2。新模型以" Vidu Q2 看AI演戏 "为主题,"细微表情生成"为核心提升场景,在极致表情变化、推拉运 镜、生成速度及语义理解方面取得突破性进展,实现从"生成视频"到"生成演技",从"动态流畅"到"情感表达"的革命性跨越,标 ...
生数科技发布新一代图生视频大模型Vidu Q2
新浪财经· 2025-09-25 10:45
据悉,本次更新的Vidu Q2主要包括图生视频、首尾帧视频、时长可选(2-8s)、电影大片及闪电出片 两种模式,在复杂表情变化的文戏,常见的多人打斗场景的武戏,及影视剧情中令人震撼的炫酷特效中 表现出彩,能够通过媲美人类的AI真实表演,将AI演技强力渗透影视、短视频剧情创作、广告创意等 生产力场景,推动AI视频生成主角从原本僵硬、机械、无感情的"AI木头"提升为灵动、有情感、会演 戏"AI人"。 责任编辑:何俊熹 9月25日消息,生数科技今天正式发布新一代图生视频大模型Vidu Q2。新模型以"Vidu Q2 看AI演戏"为 主题,"细微表情生成"为核心提升场景,在极致表情变化、推拉运镜、生成速度及语义理解方面取得的 突破性进展,实现从"生成视频"到"生成演技",从"动态流畅"到"情感表达"的革命性跨越,标志着AI视 频生成技术正式从追求"形似"进入追求"神似"的新阶段,将为内容创作、影视产业、广告营销等领域带 来全新升级。 ...
“可灵2.5 Turbo”高性能、低成本!高盛:快手处于AI视频全球顶尖水平
硬AI· 2025-09-25 06:00
高盛称,快手发布的"可灵AI 2.5 Turbo"模型在保持顶级性能的同时实现近30%成本削减,确立全球AI视频生成领域顶尖 地位。该模型在与主要竞争对手对比测试中表现出色,用户偏好率最高达69%。预计2025财年可灵AI年度收入将达1.54 亿美元,高于官方指引的1.25亿美元。 作者 | 硬 AI 编辑 | 硬 AI 技术突破与成本控制的完美结合,快手AI视频大模型再次刷新行业标杆。 9月25日,据硬AI消息,高盛在最新研报中称,快手发布的"可灵AI 2.5 Turbo"模型在保持顶级性能的同时 实现了近30%的成本削减, 将快手定位为全球AI视频生成领域的顶尖玩家。 研报称,快手于9月23日发布最新的"可灵AI 2.5 Turbo"模型,据公司介绍,该模型在 文本响应、动态效 果、风格一致性和美学质量等方面取得了实质性改进 ,并进一步 增强了视频生成过程中的可控性、稳定 性和一致性 。尤其值得注意的是, 在高质量模式下(1080p),新模型生成5秒视频的价格仅为25点,比2.1 版本便宜近30%。 高盛分析师认为,这一模型在与主要竞争对手的对比测试中表现出色,同时价格更具竞争力,有望推动用 户增长和商业 ...
“可灵2.5 Turbo”高性能、低成本!高盛:快手处于AI视频全球顶尖水平
华尔街见闻· 2025-09-25 00:41
技术突破与性能提升 - 快手发布可灵AI 2.5 Turbo模型 在文本响应、动态效果、风格一致性和美学质量等方面取得实质性改进 并增强视频生成的可控性、稳定性和一致性 [1] - 新模型在高质量模式(1080p)下生成5秒视频价格仅为25点 比2.1版本成本降低近30% [1][4] - 在与Seendance 1.0对比测试中 51%用户偏好可灵2.5模型 与Seendance 1.0 mini对比时偏好率升至57% 与Veo3 fast对比时偏好率达69% [3][4] 竞争优势与行业地位 - 模型在保持顶级性能的同时实现成本削减 将公司定位为全球AI视频生成领域顶尖玩家 [1] - 价格和性能双重优势使公司能够以更具竞争力价格提供顶级服务 对留住现有用户和吸引新用户至关重要 [3][4] - 技术能力达到全球领先水平 在专业创意制作场景中涵盖影视、短剧、游戏、动画和广告营销等领域 同时为个人创作者提供高质量解决方案 [5] 商业化前景与增长预测 - AI视频生成行业仍处于早期阶段 整体市场规模快速增长 正在颠覆传统广告和短剧制作模式 [5] - 可灵AI年度经常性收入预计2025财年达1.54亿美元 高于公司官方指引的1.25亿美元 [1][5] - 预计年度收入将从2025年1.54亿美元增长至2027年3.65亿美元 2026年增长率62% 2027年增长率46% [5] - 新模型发布有望推动用户增长和商业化进程 并可能提升用户参与度 [1][5]
生数科技完成数亿元A轮融资:刚发布正面对标Nano Banana的Vidu Q1参考生图
IPO早知道· 2025-09-19 02:37
专注于多模态大模型及应用的自主研发。 据 IPO早知道消息, 生数科技 日前 完成数亿元人民币 A轮融资。本轮融资将用于模型研发和技术 创新,探索多模态大模型的智能上限和应用广度,同时将持续加强产品拓展、用户服务、产业合作和 全球商业布局。 本轮 融资由博华资本管理的梁溪数字产业基金领投,百度战投、北京市人工智能产业投资基金、启 明创投、达泰资本、卓源亚洲、 BV百度风投等老股东持续跟投,建发新兴投资等产业合作方加码入 场。 成立于 2023年3月 的 生数科技核心团队由来自清华大学、北京大学、帝国理工学院、卡耐基梅隆 大学等全球顶尖高校的科研人才组成,具备深厚的产业实践经验与出色的全球化技术落地能力。公司 专注于多模态大模型及应用的自主研发,其核心产品 Vidu具备AI图像生成、视频生成与音频生成等 多项能力,广泛应用于互联网、广告、电商、动漫、文旅、广电、教育、游戏及影视等行业领域。 2024年7月,Vidu在全球上线,全球首创的「参考生」图片/视频概念,并凭借在商业内容创作领域 中一致性保持方面的关键突破,在AI视频生成和AI生图领域快速覆盖全球200多个国家和地区的超 3000万用户和6000家开发者 ...
4.3亿!国内视频生成领域,最大单笔融资来了——
搜狐财经· 2025-09-18 15:36
融资情况 - 完成6000万美元(约合4.3亿元人民币)B轮融资 刷新国内视频生成领域单笔融资额纪录 [1] - 本轮融资由阿里巴巴领投 达晨财智、深创投、北京市人工智能产业投资基金、湖南电广传媒、巨人网络、Antler等机构跟投 [1] 公司背景 - 成立于2023年4月 总部位于北京市海淀区苏州街 专注于AI视频生成大模型及应用研发的高新技术企业 [3] - 公司愿景为"帮助每一个人成为生活的导演" 致力于推动AI视频技术的大众化普及与行业应用创新 [3] 技术实力 - 成立不到一年时在极速生成、一致性等关键技术上达到全球领先水平 成为国内首家发布DiT架构的视频生成创业企业 [3] - 已完成五代大模型迭代 共发布八个版本 技术演进持续提速 [3] - 自主研发的PixVerse V5大模型在Artificial Analysis评测中荣获图生视频全球排名第一(ELO评分1311分)、文生视频全球第二(ELO评分1214分) [4][5][6] 市场表现 - 全球用户规模突破1亿 AI视频生成应用PixVerse(国内版称为"拍我AI")覆盖全球177个国家和地区的应用商店 [3] - 成为用户量最大的视频生成平台之一 [3] - 旗下生成式视频平台PixVerse作为"AI视频向善"代表案例入选联合国2025人工智能向善全球峰会"创新扩大影响"案例集 [6]
行业最大融资,字节离职大哥搞AI视频:阿里投资4.3亿 用户破亿
36氪· 2025-09-16 12:25
- 01 - 爱诗科技的创始人叫王长虎,是位80后(1982年生),出生于辽宁本溪。2009年,他从中国科技大学毕业(博士),加入了微软亚洲研究院,一干就是8 年。 直到2017年,他跳槽至字节跳动,担任AI Lab总监,主导抖音和TikTok从0到1的视频AI能力建设。 从这段经历看,王长虎的背景聚焦在AI视频。在中科大,他的研究方向是计算机视觉、视频理解、多媒体检索和机器学习等;在字节跳动,他主攻的也 是AI视频。 但随后,他从字节跳槽至龙湖集团,这段经历就有点小插曲:担任AIoT引擎团队总经理,负责数字化与智能化转型。 AI生成视频赛道,最近打破了个记录:爱诗科技完成超过 6000 万美元融资(B轮),领投方是阿里巴巴。该融资(约4.26亿元),打破了AIGC视频最大 单轮融资记录(国内)。 那么问题来了。这笔融资背后,究竟隐藏着怎样的超级机会,以至于让阿里如此重仓出击? 直到2023年4月,他创立爱诗科技,才算又回到AIGC视频赛道。 在产品策略上,爱诗科技是先国外再国内。2024 年 1 月,爱诗科技推出海外版产品 PixVerse。这是个利用AI制作视频的工具:用户输入照片或文字, PixVers ...
阿里云领投了个机器人,A+轮融了近10亿丨投融周报
投中网· 2025-09-15 06:26
将投中网设为"星标⭐",第一时间收获最新推送 速览投资风口,掌握资本律动。 作者丨 长风 来源丨 东四十条资本 大家好,我是长风。今天给大家带来上周资本市场的专业投研信息。 焦点回顾: 硬科技赛道 ,巨额融资频现。 上周,自变量机器人于近日完成近10亿元A+轮融资。本轮由阿里 云、国科投资领投,国开金融、红杉中国、渶策资本跟投。老股东美团战投超额跟投,联想之星、君 联资本持续追投。此外,臻驱科技宣布完成数亿元E轮融资二期交割,E轮总融资额超6亿元。本轮融 资中,E轮领投方国投创新、国投招商再度加码,中国互联网投资基金、广州产投、浦东创投参与投 资,老股东华泰宝利投资旗下华淳保信基金追加投资。 大健康赛道,基因创新药成资本热点。 上周,临床阶段创新药研发企业益杰立科(上海)生物科技 有限公司宣布完成6000万美元B轮融资。本轮融资由龙磐投资领投,原有投资方启明创投和奥博资 本持续投资,并引入港粤资本和行业知名投资机构共同参与。此外,基因编辑药企尧唐生物宣布完成 逾3亿元人民币B轮融资。本轮融资由阿斯利康中金医疗产业基金领投,松禾资本、天创资本、芯能 创投参与投资,老股东险峰淇云、远翼投资、德诚资本加码跟投,远石 ...