Workflow
百度蒸汽机音视频一体模型
icon
搜索文档
好莱坞特效师花300多块钱,用AI做了一部科幻短片
第一财经· 2025-08-21 16:02
AI视频生成技术发展 - 百度蒸汽机音视频一体模型生成10秒有声片段成本仅约330.6元人民币[7] - 传统实拍或CG制作同类短片需花费数百万元成本[6] - 单个复杂好莱坞镜头成本可达数十万至上百万元[6] 行业竞争格局 - 快手可灵AI 2025年第二季度营业收入超2.5亿元人民币[8] - 赛道参与者包括字节、阿里、腾讯及MiniMax等创业公司[8] - 谷歌Veo3模型实现环境音与人物对话同步生成[8] 技术突破与局限 - 百度实现多人有声视频一体化生成 技术难点在于多角色动作与声音匹配[8] - 当前视频生成时长局限在5-10秒 因扩散模型架构下延长时长会导致成本指数级增长[9] - 视频时长从10秒延长至100秒可能使成本增加100倍[9] 商业化应用场景 - 短剧投流市场爆发推动视频生成模型自研需求[7] - 百度视频生成模型上线50天 主要用户包括内部搜索业务及企业客户[8] - 行业仍处起始阶段 未来市场空间被广泛看好[9]
好莱坞特效师花300多块钱,用AI做了一部科幻短片
第一财经· 2025-08-21 12:57
AI视频生成技术发展 - AI视频生成技术取得显著进展 视觉效果可媲美实拍 如科幻短片《归途》中异形生物追击和巨型蜘蛛爬楼场景栩栩如生[1] - 技术实现重大突破 视频生成告别"默片"时代 实现多角色语音和环境音效一体化生成 百度蒸汽机模型实现多人有声视频一体化生成[4][5] - 当前技术存在明显局限 AI生成人类"AI味儿"浓 演技生硬 声画口型不同步 视频时长仅达5-10秒[4][5] AI视频生成成本效益 - 成本优势极其显著 传统实拍或CG制作需几百万元成本 复杂镜头单个成本达几十万至上百万元 而AI生成同等内容成本仅约330.6元人民币[3][4] - 成本结构呈现指数级增长特征 视频时长从10秒延长到20秒甚至100秒 成本可能增加100倍[6] - 百度采取价格竞争策略 打出"对标行业七折"价格标签冲击市场[6] 视频生成市场竞争格局 - 市场竞争激烈 参与者包括科技巨头和创业公司 快手可灵AI营业收入超过2.5亿元 字节、阿里、腾讯等巨头以及MiniMax、生数科技、爱诗科技等创业公司均布局该赛道[5] - 技术迭代快速 谷歌Veo3模型能生成环境音和人物对话 百度蒸汽机模型实现多人有声视频一体化生成[4][5] - 行业处于起始阶段 各厂商通过竞争互相启发技术上限[6] 商业化应用驱动因素 - 市场需求变化推动技术发展 2024年底短剧投流市场爆发 传统剪辑和AI生图无法满足创意需求 广告主直接提出科幻场景生成需求[4] - 百度转变战略布局 从最初不碰Sora类生成到因商业体系具体需求启动自研 项目代号"MuseSteamer"[4] - 当前主要用户包括内部业务部门、专业领域创作者和企业客户 上线50天最大用户来自百度内部包括搜索业务和移动生态创作者[5]