产品发布与市场定位 - OpenAI正式发布新一代AI视频模型Sora 2,被视为对谷歌Veo 3的正面竞争[3] - 此次发布被描述为视频领域的“GPT-3.5时刻”,标志着AI视频生成技术进入新阶段[17] - 公司推出首个Sora App,iOS版可在商店直接下载,安卓用户可通过sora.com访问,起步为邀请制并在美加上线[14][57] 技术性能突破 - 模型在物理准确性、逼真度上刷新SOTA,并在一致性、可控性上实现巨大飞跃[4] - 首次实现“音画同步”,音频与口型对齐,环境音、动作声效随场景变化[5][42] - 物理细节显著进化,能合理模拟物体运动惯性、受力和材质,例如篮球投掷可能打板弹开或投丢,而非强行进筐[19][27] - 人物角色一致性非常高,在多镜头切换时能保持服饰、光线、道具的连续性,解决了以往易穿帮的问题[12][35] 功能与新玩法 - 新增“Cameo”功能,用户可通过录制一段带声音的视频,将自己的形象和声音准确置入任意生成场景中[48][50] - 支持多风格生成,包括写实、电影质感、日漫等风格,并能实现复杂的运镜效果[37][39][40][60] - 用户可用自然语言指定镜头顺序、节奏、景别变化,像导演一样把握故事节奏[36] - 模型能赋予角色“超能力”,例如让人物飞起来,为创意玩法提供更多可能[49][53] 团队与未来发展 - Sora团队负责人为Bill Peebles,其背景包括MIT计算机本科和加州伯克利计算机博士,曾在英伟达、Adobe、Meta的AI岗实习[81][83][86] - 公司明确Sora 2不是终点,未来将继续用更多高质量视频数据喂养模型,提升世界模拟的准确性和细节感[88][89] - 该技术进化预计将影响影视广告、动画分镜、教育科普、产品演示乃至AI机器人训练等多个行业[90]
OpenAI Sora 2 登场!同步推出APP,Altman称这是创意领域的「ChatGPT 时刻」
Founder Park·2025-10-01 04:07