OpenAI Sora 2 登场！同步推出APP，Altman称这是创意领域的「ChatGPT 时刻」

产品发布与市场定位 - OpenAI正式发布新一代AI视频模型Sora 2，被视为对谷歌Veo 3的正面竞争[3] - 此次发布被描述为视频领域的“GPT-3.5时刻”，标志着AI视频生成技术进入新阶段[17] - 公司推出首个Sora App，iOS版可在商店直接下载，安卓用户可通过sora.com访问，起步为邀请制并在美加上线[14][57] 技术性能突破 - 模型在物理准确性、逼真度上刷新SOTA，并在一致性、可控性上实现巨大飞跃[4] - 首次实现“音画同步”，音频与口型对齐，环境音、动作声效随场景变化[5][42] - 物理细节显著进化，能合理模拟物体运动惯性、受力和材质，例如篮球投掷可能打板弹开或投丢，而非强行进筐[19][27] - 人物角色一致性非常高，在多镜头切换时能保持服饰、光线、道具的连续性，解决了以往易穿帮的问题[12][35] 功能与新玩法 - 新增“Cameo”功能，用户可通过录制一段带声音的视频，将自己的形象和声音准确置入任意生成场景中[48][50] - 支持多风格生成，包括写实、电影质感、日漫等风格，并能实现复杂的运镜效果[37][39][40][60] - 用户可用自然语言指定镜头顺序、节奏、景别变化，像导演一样把握故事节奏[36] - 模型能赋予角色“超能力”，例如让人物飞起来，为创意玩法提供更多可能[49][53] 团队与未来发展 - Sora团队负责人为Bill Peebles，其背景包括MIT计算机本科和加州伯克利计算机博士，曾在英伟达、Adobe、Meta的AI岗实习[81][83][86] - 公司明确Sora 2不是终点，未来将继续用更多高质量视频数据喂养模型，提升世界模拟的准确性和细节感[88][89] - 该技术进化预计将影响影视广告、动画分镜、教育科普、产品演示乃至AI机器人训练等多个行业[90]