AI视频模型

搜索文档
告别抽卡!全能&高度可控|藏师傅教你用即梦数字人 1.5
歸藏的AI工具箱· 2025-09-29 10:10
前几天即 梦在 Web 端上线 他们的数字人 Omnihuman 1.5 版本。 今天来做个测试,同时有个教程教大家怎么用图像模型配合生成名人数字人视频。 相较于之前的 Omnihuman 1.0, 这次 不只是上传音频和图片他帮你生成带有唇形同步的动态视 频,1.5 的控制能力大幅提升,你可以定义视频中的人物表演和运动方式。 昨天用这个做了一个比较搞的片子,最近不是模仿名人营销很火吗,我做了一个让乔布斯卖破拖鞋 的演讲,这种具有热门视觉标定和反差感的视频非常容易火。 我们先用 几个基础测试 来看一下 Omnihuman 1.5 的能力。 然后我会教一下大家如何用即梦图片 4.0 和数字人 1.5 配合生成这种连贯的数字人视频。 这次更新最明显的一个改动就是数字人不再死板,我们可以通过动作控制让镜头和人物动起来,包 括不只是主角也包括其他人物。 比如上面这个案例,我们就可以让女子先抬头,到一个合适可以看到嘴唇的角度,然后再开始说 话,同时镜头也在旋转到她的正脸,背后的其他人也在正常行走,这是纯粹的唇形同步模型不能做 到的。 几乎搞定了原来 AI 视频不好做的人物表现部分内容。 可以看到在设置部分多了一个动作描 ...
可灵2.5Turbo实测|顶尖AI视频模型,真能打平CG吗?
歸藏的AI工具箱· 2025-09-23 10:37
可灵正式发布了他们的 2.5 Turbo ( app.klingai.com )版本视频模型,作为超创提前试了一下, 这次的进步真的很大。 先来看个藏师傅测试视频混剪的样片: 提示词理解强了非常多,尤其是涉及到开始之后包含复杂因果和时间关系的提示词。 同时生成视频的风格稳定性更强,图生视频的时候风格保持相当稳定。 最重要的是这次可灵 2.5 Turbo 的价格非常划算,高品质模式下 5 秒视频 从 2.1 模型的 35 积分 降到了 25 积分 。 这次我们先看几个基础的测试,刚好前几天看到新一届的世界渲染大赛结束了,后面就顺手试了一 下 AI 离顶级 CG 渲染作品还差多远。 基础测试 主体角色会继续完成他向前的高速冲刺动作,整个身体带着强烈的动态模糊向前穿行。在他冲 刺的同时,镜头会向后并向右侧拉远,始终将角色的上半身保持在画面中心。在第2秒左右,角 色伸出的左手会猛烈击中一个刚刚进入画框右侧的敌人,撞击瞬间产生清晰的能量迸发或碎片 飞溅效果。画面左侧那只离镜头最近的龙形怪物会紧随其后,向着角色移动的轨迹进行凶猛的 扑咬,但差之毫厘地咬空,增加了紧张感。随着镜头持续拉远,到结束时,镜头会从特写过渡 到一个 ...
实测可灵AI的新视频模型,它生成的动作戏酷到封神。
数字生命卡兹克· 2025-09-22 01:33
产品能力提升 - 可灵2.5在动作和表演方面实现显著进化 包括运动的超进化和表演的超进化 [1] - 运动能力实现超进化 能够丝滑衔接多个动作 如下落、奔跑、骑摩托等 并注重真实感细节 如玻璃渣散落和落地缓冲 [2] - 表演能力实现超进化 能够准确表达多层次情绪 如从愤怒到克制的转变 以及淡淡的阴恻恻的笑 [29][35] - 文生视频能力大幅提升 仅靠提示词即可生成至少一半的案例 无需首尾帧 [10][55] - 理解能力有巨幅提升 解决以往因果关系和细节不到位的问题 [56] 技术对比 - 可灵2.5相比2.1在运动能力上有巨大进步 2.1会出现绳子消失、摩托车凭空出现、动作错误等问题 [3] - 可灵2.5在人物动作和运镜方面更稳 而2.1只能保持人物基本不崩坏 环境交互细节全部糊掉 [5][6] - 可灵2.5的机器人跑酷动作和交互相当真实 而2.1会不受重力控制逐渐飞天 [10][12] - 可灵2.5能够自然完成情绪转变 而2.1表演没层次 表情做得太过或太粗糙 [32][33][37][42] 应用场景 - 可灵2.5能够生成各种运动镜头 如滑雪空翻、摸雪、呲雪墙、滑板速降、篮球赛等 [16][18][20] - 可灵2.5能够满足各种奇幻脑洞 如和小鹿一起闯进魔法森林、在废土世界开装甲车、在陌生星球开飞行器等 [22][24][26][27] - 可灵2.5能够处理多种专业场景 如好莱坞老电影风格的斗嘴、爆炸映亮脸部、重伤喘息、古灵精怪的表情变化等 [45][47][49][50] - 可灵2.5能够生成第一视角跟随镜头 并做出急迫感 如猛然加速追逐 [14]
终于有AI视频模型,解决了体操难题。
数字生命卡兹克· 2025-06-18 19:08
视频模型技术突破 - MiniMax发布Hailuo 02视频模型,首次实现杂技动作生成能力,肢体表演和动作幅度远超Veo3等竞品[1][4] - 该模型攻克了AI视频领域的"体操难题",能生成包含两次空中旋转的高杠体操动作,且形体保持完整[6][7][21] - 在杂技类动作表现上显著领先,如小丑抛球倒立、双杠倒立等复杂动作完成度远超Runway Gen4等模型[23][24][26] 技术性能对比 - 对比一年前Luma AI生成的体操视频(四肢扭曲变形),Hailuo 02展现出质的飞跃[6] - 与主流视频模型对比测试显示:Veo3生成的运动员触垫后形体碎裂,Runway Gen4出现"面条人"变形,即梦模型产生双头怪等异常[9][11][13][15] - 在跳马测试中,Hailuo 02实现助跑、起跳、谢幕全流程动作,镜头运动自然流畅[19][21] 产品特性与商业化 - 支持原生1080P视频生成,新人赠送500免费积分,768p/6秒视频仅需25积分,1080p视频80积分[45] - 具备多动作连续生成能力,可配合镜头运动指令,如"摄影机快速摇摄并倾斜捕捉轨迹"[7][45] - 在物理效果模拟上实现突破,能准确表现玻璃破碎、物体坠落等动态场景[37][38] 行业影响 - 该模型标志着AI视频技术进入新阶段,解决了运动捕捉和物理规律模拟等核心难题[23][46] - 在表演领域延续优势,情绪表达和复杂动作结合产生"登峰造极"效果,如机甲降落、消防员破窗等场景[34][35][38] - 价格策略具有竞争力,以"便宜又大碗"形成市场差异化优势[45]
从案例分析到提示词写作,手把手教你制作最火爆的AI视频
歸藏的AI工具箱· 2025-06-18 06:57
AI视频制作趋势 - AI生成视频在社交媒体平台获得高互动量 包括国内外市场 即使内容看似简单但具有强吸引力 [1][2][3] - AI视频已渗透广告营销领域 案例显示某牙医诊所广告改用"大脚男孩"主题后播放量从数千跃升至56万次 [4] Veo3技术突破 - Veo3显著降低AI视频制作成本 仅需两次生成与简单合并即可完成作品 大幅简化流程 [6] - 模型支持从创意构思到提示词生成的全程自动化 人类仅需筛选点子与复制提示词 [6] - 技术突破跳过传统视频制作的图片生成 语音合成 唇形同步等复杂环节 减少90%工作量 [35] 爆款视频核心要素 - 反差感引擎:通过现代形式呈现古老/虚构内容 或让严肃角色展现生活化特质 制造喜剧效果 [11][14] - 伪纪实手法:模拟真实拍摄增强沉浸感 如采访/Vlog形式强化荒诞性 [12][14] - 共同认知基石:利用历史事件 流行文化IP或文化迷因降低观众理解成本 [13][14] - 情感共鸣点:将宏大叙事转化为普通人吐槽 如暴风兵抱怨"混蛋老板"引发打工人共情 [23] 创意生产方法论 - 使用NotebookLM交叉分析多个爆款视频 提取分镜结构 台词内容及爆火原因 [8][9][10] - 通过Gemini生成新创意 需包含8秒分镜的详细环境 角色 台词描述 优先选择现实题材 [17][18][21] - 提供两类标准化提示词模板:第一人称Vlog强调主观镜头 虚构采访侧重权威角色与金融黑话反差 [29][30][32][33] 视频生成流程优化 - 推荐使用Gemini Pro会员或FLOW工具 后者需切换至Veo3 Fast模型控制成本 [37][40] - 后期仅需基础剪辑拼接 可添加台标 滚动文字等元素增强伪纪实感 [44] - 支持1080P超分输出提升画质 未来视频类Agent有望进一步简化字幕等包装工作 [45][46] 行业影响 - Veo3推动AI视频制作门槛降低 每日新增爆款视频覆盖多品类 验证技术应用潜力 [44][46] - 每减少一个制作环节可拓展10倍创作者基数 技术普及将释放潜在内容生产力 [44][46]