Vidu

搜索文档
AI视频生成“暗战”起风
华尔街见闻· 2025-09-29 00:01
用户付费在大语言模型中尚未跑通,但正悄然在AI视频生成赛道中生根发芽。 今年6月,AI视频生成初创公司Runway的年化营收超过9000万美元(约合人民币6.4亿元);同年第二 季度,快手(1024.HK)旗下的AI视频生成应用"可灵"创收超过2.5亿元。 国内初创公司纷纷涌上牌桌。 北京生数科技有限公司(下称"生数科技")的"Vidu"、北京爱诗科技有限公司(下称"爱诗科技") 的"拍我"用户数均已突破千万;作为"杭州AI六小龙"首个IPO,Manycore Tech Inc.(下称"群核科技") 年内亦计划发布针对C端消费者的AI视频生成产品。 市场对于AI视频的商业化前景不仅是局限于个人创作者生成一段短视频,还有影视创作、具身智能等 更多领域。 但由于空间一致性、内容拼接的崩坏等问题的存在,亦让AI视频生成模型陷入"卖家秀"和"买家秀"的争 议中。 尽管属于AI视频生成行业的DeepSeek时刻尚未到来,但在各家大厂的加码下,市场有理由相信未来的 发展路径会愈发清晰。 拼时长 2024年2月,OpenAI推出了Sora 1.0,较此前Runway只能生成3-4秒的视频来说实现了突破性的进展,成 为全球首 ...
生数科技完成数亿元A轮融资,CEO称多模态生成技术商业化仍处早期阶段
搜狐财经· 2025-09-19 06:53
瑞财经 吴文婷9月19日,生数科技宣布于近日完成新一轮数亿元规模的A轮融资。 据了解,该轮融资由博华资本领投,百度战投、北京市人工智能产业投资基金、启明创投、达泰资本、BV百度风投等老股东持续跟投,建发新兴投资等产 业合作方加码跟投。 生数科技首席执行官骆怡航博士表示,多模态生成技术在数字内容产业中的商业化进程正在加速,但目前仍处于早期阶段。预计在未来三年内,多模态生成 将重塑全球数字内容的生产方式,全面渗透到各行各业的内容生产与消费环节,展现出巨大的市场空间与全球性增长潜力。新一轮融资将用于模型研发和技 术创新,探索多模态大模型的智能上限和应用广度,同时将持续加强产品拓展、用户服务、产业合作和全球商业布局。 公开资料显示,生数科技成立于2023年3月,核心团队由来自清华大学、北京大学、帝国理工学院、卡耐基梅隆大学等全球顶尖高校的技术人才和来自产业 界的产品研发、产业服务人才组成,具备深厚的产业实践经验与出色的全球化技术落地能力。 2024年7月,Vidu在全球上线,全球首创"参考生"图片/视频概念,并凭借在商业内容创作领域中一致性保持方面的关键突破,在AI视频生成和AI生图领域快 速覆盖全球200多个国家和 ...
生数科技完成数亿元A轮融资:刚发布正面对标Nano Banana的Vidu Q1参考生图
IPO早知道· 2025-09-19 02:37
专注于多模态大模型及应用的自主研发。 据 IPO早知道消息, 生数科技 日前 完成数亿元人民币 A轮融资。本轮融资将用于模型研发和技术 创新,探索多模态大模型的智能上限和应用广度,同时将持续加强产品拓展、用户服务、产业合作和 全球商业布局。 本轮 融资由博华资本管理的梁溪数字产业基金领投,百度战投、北京市人工智能产业投资基金、启 明创投、达泰资本、卓源亚洲、 BV百度风投等老股东持续跟投,建发新兴投资等产业合作方加码入 场。 成立于 2023年3月 的 生数科技核心团队由来自清华大学、北京大学、帝国理工学院、卡耐基梅隆 大学等全球顶尖高校的科研人才组成,具备深厚的产业实践经验与出色的全球化技术落地能力。公司 专注于多模态大模型及应用的自主研发,其核心产品 Vidu具备AI图像生成、视频生成与音频生成等 多项能力,广泛应用于互联网、广告、电商、动漫、文旅、广电、教育、游戏及影视等行业领域。 2024年7月,Vidu在全球上线,全球首创的「参考生」图片/视频概念,并凭借在商业内容创作领域 中一致性保持方面的关键突破,在AI视频生成和AI生图领域快速覆盖全球200多个国家和地区的超 3000万用户和6000家开发者 ...
锦秋基金被投公司「生数科技」完成新一轮数亿元A轮融资 | Jinqiu Spotlight
锦秋集· 2025-09-19 02:17
锦秋基金,作为12 年期的 AI Fund,始终以长期主义为核心投资理念,积极寻找那些具有突破性技术和创新商业模式的通用人工智能初创企业。 锦秋基金于2023年年中投资了生数科技,是生数科技的早期机构投资人 。 近日, 生数科技 完成新一轮 数亿元人民币规模的A轮融资 。该轮融资由博华资本领投,百度战投、北京市人工智能产业投资基金、启明创投、达泰资本、卓 源亚洲、BV百度风投等老 股东持续 跟投,建发新兴投资等产业合作方加码跟投。 以下为此次融资的相关新闻。 9月9日,生数科技全球上线Vidu Q1参考生图, 在多主体一致方面持续全球领先 生数科技往期里程碑 未来,生数科技将继续坚持以技术为核心驱动力,通过创新的产品与服务,助力全球每一个人与组织提升生产力和创造力! (完) 近日, 生数科技 完成新一轮 数亿元人民币规模的A轮融资 。该轮融资由博华资本领投,百度战投、北京市人工智能产业投资基金、启明创投、达泰资本、卓 源亚洲、BV百度风投等老 股东持续 跟投,建发新兴投资等产业合作方加码跟投。 生数科技成立于2023年3月,核心团队由来自清华大学、北京大学、帝国理工学院、卡耐基梅隆大学等全球顶尖高校的技术人才 ...
短剧后又一风口,AI漫剧有多疯狂?
混沌学园· 2025-08-31 12:05
漫剧市场崛起背景 - 真人短剧市场增长放缓 成本上升 审查趋严 套路化严重 [1] - 动漫短剧看播人群突破20亿 付费规模达2600万 [1] - AI技术结合短剧特征的漫剧加速崛起 [1] 漫剧形态分类 - 分为动态漫画和沙雕漫剧两类 [3] - 沙雕漫剧以表情包人物头为标志 剧情荒诞搞笑 通过融梗反转制造笑点 [3] - 动态漫介于漫画与动画之间 进行动作处理并添加运镜音效等辅助效果 [5] 动态漫发展历程 - 因国漫热和国内动画产能不足而兴起 [6] - 平台通过头部网文和漫画IP改编作品填补市场空缺 如《斗罗大陆》 [6] - 2019年腰部IP也开始动漫态化 [6] - 本质是对网文漫画IP的升维 非传统动画降维 [7] 漫剧与短剧生态关系 - 漫剧在短视频生态中找对短剧模仿对象 [8] - 与真人短剧同根同源 能承载末日科幻悬疑等特殊题材 [8] - 受众更广 除网文粉丝外还吸引二次元用户与年轻群体 [8] AI技术带来的变革 - 大模型多模态能力成熟 在转绘分镜特效剪辑配音环节降本增效 [13] - AI工具可实现听指令图生视频 几秒生成角色动作片段 [13] - AI短剧将传统50人以上团队控制在10人以内 周期从月缩短至周 [14] - 制作流程全面优化 前期策划美术设计演员选角等环节效率提升 [15] 具体成本与效率案例 - 《明日周一》采用10人团队45天完成50集 上线5天播放量破500万 [16] - 《仙界第一徒》制作周期15天 综合成本降至600元/分钟 [16] - 传统漫剧制作成本每分钟需数万元 [10] 行业竞争本质 - AI降低制作门槛但长期竞争仍回归剧本与创作力 [24] - 当前题材集中在男频玄幻奇幻科幻 存在版权风险与创新不足问题 [24] - 需形成技术加内容创新的合力 高质量内容才是突破口 [24] - 技术红利会过去 故事永远是核心 [24]
漫剧崛起,正复制短剧的爆赚路径?
虎嗅· 2025-08-14 09:54
行业增长前景与规模 - 漫剧结合AI技术覆盖影视剧、动漫、VR用户 成为未来三年最强劲增长风口 [1] - 当前漫剧单日消耗达400万元 预计明年单日消耗提升至2000万元 年消耗规模达几十亿元 [1] - 行业窗口期仅剩2年左右 后期入场难度将类似当前真人短剧市场 [1] 市场竞争格局 - 从业主体分为两类:漫画基因公司(擅长内容)与短剧基因公司(擅长发行与技术) 竞争核心在于补全内容或技术短板并实现规模化变现 [2] - 杭州、西安、郑州等地聚集大量短剧产业链从业者转型漫剧 [3] - 头部案例包括互动影视《破峰》单日消耗402万元 [4] 酱油公司自制漫剧全网充值破百万元且团队超300人 目标月产60-100部 [5] 九州文化推出百万稿费剧本共创计划 [6] 转型动因与行业痛点 - 真人短剧面临成本攀升(单剧成本100万元起步 主演日薪达4-5万元)、审查严格、同质化严重等问题 [8] - 付费投流市场萎缩导致男频编剧与投流手失业 亟需新变现渠道 [10] - 漫剧成为行业新风口 具备低成本(剧本成本仅1-2万元)、审查宽松、内容多样性高等优势 [19] 用户特征与内容定位 - 核心用户为漫画群体而非短剧群体 需通过内容升维满足用户需求 [24][26] - 男性用户偏好高信息密度题材(如玄幻、仙侠、脑洞) 女频内容预计后续跟进 [31] - 用户年龄层覆盖35-50岁群体 存在成人向内容供给缺口 [21][23] 商业模式与变现能力 - 复用短剧变现渠道 覆盖抖音、快手、B站、视频号等国内外平台 [37][42] - 爆款作品虹吸效应显著:头部漫剧单日分账万播收入达7000元 第二名至第三名约200元 [18] - 单集成本介于5000元至2万元 优质内容需投入10万元/集 [42] - ROI表现优于短剧(短剧ROI普遍低于1.1) [41] 技术应用与产能提升 - AI工具(如Vidu、即梦、巨日禄)实现批量生产 10人团队10天可完成一部剧 [41][43] - 二维内容为主流 3D技术尚存提升空间 [33][48] - 技术驱动产能飞跃:头部团队月产超100部 平台级公司月产可达上千部 [41] 内容来源与IP开发 - 剧本来源包括原创、融梗、IP改编 网文平台(番茄小说、起点中文网等)构成内容库 [27][30] - 爆款IP改编数据亮眼:如《金蚕往事》首集收藏22万 《规则怪谈:我的家人不正常》首集收藏7.7万 [38] - 未来有望延伸至周边衍生品开发 对标迪士尼IP变现模式 [47] 战略布局与行业趋势 - 平台流量扶持(如抖音私域支持)助推破圈 [20][21] - 企业通过收购账号、扩招团队(如杜甫团队目标月产50部)抢占窗口期 [37][54] - 长期目标切入影视剧赛道 通过3D技术实现真人质感 拓展用户群体 [23][47]
营收超1亿美元!可灵,凭什么?
第一财经· 2025-08-06 15:22
视频生成行业现状 - 视频生成行业在2024年迎来爆发式增长,可灵等公司已实现商业化成功,年化营收突破1亿美元[11][22] - 行业标杆公司Runway去年12月ARR达8400万美元,可灵与之不相上下[22] - 国内竞争对手如生数科技Vidu产品ARR为2000万美元,字节跳动即梦AI和Minimax海螺AI均未达1000万美元[22] - 全球用户对视频生成工具忠诚度低,新模型上线会迅速改变市场份额分布,如Google Veo 3上线后份额从0增至30%[25] 可灵公司发展 - 可灵用户规模从2024年1月的600万快速增长至2025年4月的4500万,3个月内增长近2倍[20][57] - 可灵在Poe平台市场份额达30%,超过Runway的23.6%[23] - 在Freepik平台,可灵生成的视频数量超过其他所有模型总和[23] - 公司年化营收在2025年3月突破1亿美元,超过MiniMax预期的7000万美元[11][22] 技术发展 - 视频生成技术仍处于早期阶段,类似LLM的GPT-2时期,存在常识和逻辑错误[11] - 可灵通过多模态交互方式(MVL)提升生成效果,允许用户以文字、图片、视频等多种方式输入指令[19] - 关键技术创新包括首尾帧、运动笔刷、人脸一致性、多图参考等功能,大幅提升视频生成可控性[16][18][19] - 1.6版本是多图参考功能推出的重要分水岭,使可灵用户从600万增至2200万[20][48] 产品迭代 - 可灵在1年内发布5个版本更新,从1.0迭代至2.1[13][20] - 1.5版本引入运动笔刷、人脸一致性、口型同步等功能[16] - 1.6版本推出多图参考功能,成为用户增长转折点[18][20] - 2.0版本整合所有交互功能,推出MVL多模态交互方式[19] - 最新推出"灵动画布"功能,实现工作流整合和团队协作[28][31] 行业应用 - AI视频生成已应用于影视制作,如Netflix《the eternaut》和Amazon《House of David》使用AIGC镜头[34] - 广告营销行业深度应用AI技术,可实现模特一致性推广不同产品[51] - 职业细分出现AI分镜师、AI视频生成师等新岗位[61] - 视频素材生成市场规模达千亿级别,已形成完整产业链[34] 未来趋势 - Agent技术将成为下一阶段发展方向,实现创作流程自动化[66] - 视频生成将不仅服务于存量市场,还将创造具备实时性和互动性的新内容形态[67] - 行业竞争加剧,Google已发布自带声音的Veo 3模型,字节跳动整合资源加速追赶[25][26] - 技术领先性、产品创新和创作者社区将成为核心竞争壁垒[55]
“AI变革生产力,让创意更有价值”——2025 AI+娱乐科技大会圆满召开 | ChinaJoy2025
36氪· 2025-08-01 14:17
大会概况 - 2025 AI+娱乐科技大会在上海浦东嘉里大酒店召开,主题为"AI变革生产力 让创意更有价值",探讨AI技术驱动下的文娱产业新生态 [1] - 大会由ChinaJoy主办,珀乐科技、生数科技、VAST联合主办,36氪战略合作,通过主题演讲和圆桌讨论等形式展示行业前沿 [1] - 36氪作为合作伙伴,凭借行业资源和专业内容团队,全面呈现大会亮点与前沿洞察,引领行业讨论 [3] 技术进展与应用 - 生数科技商业化副总裁王川介绍Vidu AI视频大模型已实现游戏场景搭建、图片社交、文旅打卡等多种功能,未来将向更实时、高清方向发展 [6] - VAST创始人宋亚宸展示Tripo Studio及Tripo3.0等3D生成工具,可应用于美术开发、场景设计、游戏玩法拓展等领域 [8] - 聆心智能CEO郑叔亮探讨超拟人技术,认为AI未来将具备情感计算能力,可在虚拟世界构建自洽的Agent社会 [9] - 博理科技发明HALS3D打印技术,速度比传统提升100倍,材料抗疲劳性能提高10倍以上,已推出鞋、包等创新产品 [21] - 盛趣游戏整合AIGC生产管线ARTi,技术应用覆盖2D、3D、动画制作等8个类别,持续优化开发流程 [27] 内容创作与IP开发 - 珀乐科技CEO杨晟提出AI工作流可将内容生产效率提升数倍,解放创作者进行更高维度艺术探索 [12] - 珀乐科技策划总监李文豪提出"编辑部模拟器"概念,AI可辅助激发灵感并处理繁琐工作,但不能取代编剧 [14] - 中文在线许心怡指出AI推动创作平权,使动漫团队人数和成本大幅精简,但人类创作者的情感共鸣不可替代 [33] - 陕文投白泽影视总经理赵焜表示AI短剧和广告片制作呈爆发式增长,多模态垂直模型将赋能千行百业 [33] 行业趋势与商业模式 - 圆桌讨论认为AI将快速弥合动态漫剧与传统动画质量差距,未来一年可能颠覆现有内容形态 [17] - 生数科技品牌市场负责人刘婷婷指出Vidu视频生成商用化时间提前,将推动"一鱼多吃"的IP开发模式 [17] - 之江容量无限科技陈杭杰认为传统影视生产模式已落后,需培养兼具技术与审美能力的"转译型人才" [17] - 网易互娱AI美术负责人张新楠强调AI最大价值在于"快速试错",审美能力是核心竞争力 [23] - Kotoko AI创始人乔海鑫提出通过Agent赋予虚拟角色"主体性",让用户获得角色共创的沉浸感 [23] 创新平台与案例 - MASS数字星球平台基于3D虚拟人和AIGC,已在东南亚取得2000万用户,让1万创作者通过AIGC获得收益 [25] - Art Photon团队借助AI工具,在7天内完成主机游戏《代号:Tripo—飞光》的视觉整体开发工作 [29] - 珀乐互动导演凯伦分享AI赋能动画制作可大幅降低单季生产周期和成本,但创意核心仍是人类艺术家 [31]
这是最新AI产品百强 | 量子位智库AI 100
量子位· 2025-07-30 23:56
行业现状与趋势 - 国内AI产品从高速爆发期进入精细打磨阶段,用户红利触顶,产品体验同质化加剧 [2][3] - 行业竞争焦点从"有没有"转向"好不好""用多久""还用不用",留存和持续价值成为关键 [3][4] - AI产品进入"效率时代",比拼持续可用性和精细运营能力,系统化能力成为破局关键 [12][13] 旗舰100榜单分析 - 头部5款AI产品占据过半市场份额,豆包、夸克、DeepSeek成为首批国民级AI产品 [9] - AI智能助手是最热门方向,占Web和APP端约40%活跃用户,其次为AI教育和AI搜索 [9] - 大厂凭借产品化、运营和数据反馈优势建立用户长期信任,呈现"强者恒强"格局 [9][12] 创新100榜单特点 - 聚焦快速增长、未完全商业化但具技术突破和场景独创潜力的产品 [14][15] - 垂类AI可行性上升,医疗健康、心理疗愈等细分领域出现差异化突破 [19] - AI 3D/视频生成(如Meshy、Vidu)和编程AI Agent(如通义灵码)成为新兴方向 [18] 生态结构 - 旗舰产品代表成熟使用方式,从工具向助手升级 [22] - 创新产品代表新需求验证,需跨越冷启动风险但蕴含爆款潜力 [17][21] - 双榜单共同构成AI产业"双螺旋结构",反映当下与未来的协同发展 [22] 数据与评估方法 - 评估体系结合定量(用户规模、增长、活跃、粘性等20+指标)与定性(技术、市场、团队等)维度 [7][10] - Web/APP双端数据显示头部产品垄断趋势,部分赛道用户集中度超50% [9] - 传统赛道如AI创作、AI陪伴面临同质化挑战,中小产品易被大厂压制 [11]
国产AI视频三国杀:可灵、即梦、Vidu,谁会是最大赢家?
36氪· 2025-07-30 00:16
产品实测表现 - 可灵AI优势在于表现力强 能够生成极具视觉冲击力的画面 适合制作戏剧化内容 劣势在于容易"用力过猛" 对度的把握不足 免费版生成等待时间超过3小时[2][14][17] - Vidu优势在于真实细腻 模拟真实物理世界和微表情潜力强 视频最具电影感 劣势在于节奏慢爆发力不足 5秒时长内难以完全展现核心内容[2][17][28] - 即梦AI优势在于均衡可控 能准确完成指令 功能全面性最佳 支持数字人/动作模仿/运镜选择 劣势在于艺术表达缺乏惊喜 略显平庸[11][18][33] 技术路线差异 - 可灵采用与Sora一致的DiT架构 并自研3D VAE和3D时空联合注意力机制 实现时空信息高度融合处理 支持生成10秒1080P视频 在多模态编辑功能上突出[23][24][25] - Vidu采用U-ViT融合架构 结合U-Net底层特征捕捉与Transformer全局语义理解 实现端到端一次性生成 支持1080P输出 在参考生视频功能上独具特色[26][27][28] - 即梦以自研Seedance 1.0系列模型为主 引入精准描述模型和统一预训练框架 最快40秒生成5秒1080P视频 采用分级模型策略 即梦3.0用Seedance 1.0 mini模型 pro版用更强模型[29][31][33] 商业生态布局 - 可灵背靠快手短视频流量池 全球创作者超4500万 累计生成视频超2亿个 图片超4亿张 通过《新世界加载中》案例展示内容侧野心[2][4][35] - 即梦依托字节跳动旗下抖音和剪映 形成创作-分发闭环 目标成为下一代视频创作工作流核心 工具属性定位明确[18][36][38] - Vidu具备清华系技术背书 定位底层基础大模型 在To B市场有想象空间 但面临产品化和市场化挑战[35][37] 行业竞争格局 - 第三方评测Artificial Analysis显示 即梦Seedance 1.0在文生视频榜单以1314分位居首位 图生视频榜单以1365分领先[30][32][33] - 可灵Kling 2.0在文生视频榜单获1114分 图生视频榜单获1194分 处于竞争梯队[30][32] - 行业形成可灵表现派 Vidu写实派 即梦工具派的技术分化格局 最终赢家预计在可灵和即梦间产生[34][37][38]