Seko
搜索文档
AI视频进入「连续叙事」时代:「一致性」成商业化发展瓶颈
新浪科技· 2025-12-16 01:07
行业核心观点 - AI视频生成行业竞争焦点已从单镜头“生成能力”转向多集“可持续创作能力”,主体一致性、资产可复用性与工作流连贯性成为关键商业门槛[1] - 工具平台的角色正从模型能力展示窗口转变为内容生产基础设施的构建者[1] 行业发展趋势与挑战 - 行业面临的核心挑战是“主体不一致”问题,即角色在多集中难以保持外貌、服装、表情等特征不变,这制约了AI短剧等连续性内容的商业化[1][4] - 市场意识到真正的挑战不在于单帧画面的逼真度,而在于十集、二十集剧情推进中的角色与场景一致性[1] - 技术演示中的流畅片段难以直接转化为可消费的连续内容,观众无法接受主角“换脸”或关键道具消失[4] - 版权归属、内容安全、IP保护等问题仍是行业共性难题[8] 公司产品与战略 - 商汤科技于2025年7月推出“创编一体”AI视频智能体Seko,并于后续发布Seko2.0,焦点从“单集生成”转向“多聚集创作”[4] - Seko平台定位为短剧、漫剧、广告片、教育课件等内容创作者提供端到端的生成与编辑能力[4] - 平台支持“自研模型+第三方模型”融合调度,通过统一的Agent链路保障跨模型的一致性[5] - 公司通过模型结构蒸馏、算子优化及国产芯片适配,已实现推理成本下降约50%[8] - 公司未将Seko定位为封闭的内容平台,而是坚持“先把工具做好”,目标是帮助创作者更好创作、管理、发行和赚钱[8] 市场应用与商业化 - 长内容的核心价值在于实现可衡量的投资回报,其基础是人物主体一致性、故事情绪延展和场景世界观连贯[2] - 若一致性等要素断裂,观众会因违和感脱离剧情,不愿为此类内容买单[2] - Seko平台已吸引超20万创作者,包括上百个短剧工作室,部分作品已成功上线主流平台[5] - 平台用户增长迅速,内测于7月,8月正式推广,9月创作者快速增长到10万,当前已超20万,且更多是高频的偏专业及半专业级别创作者[7] - AI生成短剧在配音和画面细节精修环节仍依赖外部工具,但整体制作流程高度依赖Seko的多集分镜生成与资产复用能力,形成“主干用AI、细节人工补”的混合模式[6] - 这种模式已能显著降低制作门槛与周期[6] 产品设计与用户体验 - 平台竞争正从“模型参数”转向“用户体验”与“工作流整合”,旨在让非技术背景的创作者快速将想法变成视频[7] - 平台采用“低频用户一键生成、高频用户深度可控”的双轨设计,在自动化的同时为高阶用户提供精细编辑接口,每一步都可对话修改、多次修正[7] - 设计旨在覆盖从大学生、教师到专业工作室的多元需求[7]
AI视频进入“连续叙事”时代:“一致性”成商业化发展瓶颈
21世纪经济报道· 2025-12-15 09:23
AI视频生成行业范式转移 - AI视频生成行业正经历从追求单帧画面真实感、动作连贯性到系统性探索“多集一致性”与“可持续创作”的范式转移 [1] - 行业竞争焦点已从“生成能力”转向“可持续创作能力”,工具平台的角色正转变为内容生产基础设施的构建者 [1] 行业核心挑战与共识 - 行业面临的核心深层问题是“内容能否持续”,关键在于多集剧情中角色与场景的一致性 [1] - 在短剧、漫剧、品牌系列广告等内容形态中,主体一致性、资产可复用性与工作流连贯性是AI视频走向商业闭环的关键门槛 [1] - 技术演示中的流畅片段难以直接转化为可消费的连续内容,“主体不一致”问题在多集内容中被急剧放大,成为制约商业化的瓶颈 [4] 商汤科技Seko的产品定位与进展 - 商汤科技于2025年7月推出“创编一体”AI视频智能体Seko,定位于为短剧、漫剧、广告片、教育课件等内容创作者提供端到端能力 [4] - Seko 2.0版本将焦点从“单集生成”转向“多集剧创作” [4] - 平台支持“自研模型+第三方模型”融合调度,通过统一的Agent链路实现跨模型的一致性保障 [5] - 平台已吸引超20万创作者,包括上百个短剧工作室,部分作品已成功上线主流平台 [5] - 平台内测于七月,八月正式对外推广,九月创作者快速增长到10万,目前创作者数量在20万多 [6] - 平台吸引的用户更多是高频的偏专业及半专业级别创作者,价值较高 [6] 技术路径与商业价值 - 长内容的核心价值在于实现可衡量的投资回报,其基础是人物主体一致性、故事情绪延展、场景世界观连贯 [2] - 单点模型优势正在让位于系统工程能力,行业目标指向构建可延续的IP资产池 [5] - 整体制作流程高度依赖Seko的多集分镜生成与资产复用能力,采用“主干用AI、细节人工补”的混合模式 [5] - 通过模型结构蒸馏、算子优化及国产芯片适配,Seko已实现推理成本下降约50% [7] 平台竞争趋势与用户体验 - 平台竞争正从“模型参数”转向“用户体验”与“工作流整合”,头部玩家关注如何让非技术背景创作者快速将想法变成视频 [6] - 平台设计采用“低频用户一键生成、高频用户深度可控”的双轨模式,每一步骤都可对话修改、多次修正 [6] - 技术的终极价值被定位为释放人类创造力,而非替代人类 [7]
Sora登顶苹果App Store;阿里云升级全栈AI体系;英伟达拟投1000亿助OpenAI建数据中心|一周AI要闻回顾
36氪· 2025-10-04 13:22
AI视频生成技术突破与应用 - OpenAI推出AI视频生成应用Sora,凭借独特技术超越Google Gemini和ChatGPT,登顶苹果App Store免费应用榜首[2] - Sora2模型能生成高度逼真的场景和声音,用户可通过邀请码在iOS设备上制作并分享由版权内容生成的AI视频[2] - 快手发布可灵2.5 Turbo视频生成模型,文生视频、图生视频功能更新,文本响应和动态效果显著提升,1080p模式下生成5秒视频成本降低30%[7] - 商汤科技AI视频Agent Seko上线一个月吸引超10万创作者,作为创编一体AI短片创作工具,通过对话即可直接生成视频[8] - 阿里夸克推出"造点"AI产品,联合接入通义万相Wan2.5视频生成模型与Midjourney V7生图模型,成国内首个支持音视频同步生成的AI平台,Midjourney V7会员价腰斩至48元/月[6] 大模型技术竞争与性能提升 - 阿里云发布7款通义大模型,旗舰模型Qwen3-Max参数超万亿,预训练数据达36T tokens,在编程、Agent工具调用测试中超越GPT5、Claude Opus 4,跻身全球前3[3] - 专项模型Qwen3-Coder开源后调用量激增1474%,全模态模型Qwen3-Omni在32项开源评测中获最佳,支持音视频全场景交互[3][4] - 谷歌推出AI心情板构建工具Mixboard,结合Gemini 2.5 Flash模型,用户可通过文本提示创建设计项目心情板,在美国进行公开测试[6] - GPT-5首次通过"哥德尔测试",在组合优化领域破解5个未解决猜想中的3个,展现从"学数学"到"做数学"的跨越[16] - GPT-5助力量子计算专家团队攻克量子领域核心难题,将原本需1-2周人力的工作压缩至30分钟内完成[17][18] AI基础设施与重大投资计划 - 阿里云宣布未来三年投入3800亿建设云和AI基础设施,当前其在国内AI云市场占比领先,推动阿里巴巴港股当日涨超7%[2][5] - 英伟达拟投资1000亿美元助力OpenAI建设至少10GW数据中心,该合作意向推动英伟达股价涨3.93%,市值增长1700亿美元[9] - 京东发布AI全景图,宣布未来三年持续投入构建万亿规模人工智能生态,并开放产业场景与供应链数据支持企业模型训练[10] - 阿里巴巴宣布将AI领域投资提升至超过500亿元人民币,以加强在全球科技市场的竞争力[12] - 阿里巴巴与英伟达开展Physical AI合作,阿里云人工智能平台PAI将集成英伟达Physical AI软件栈,缩短具身智能等应用开发周期[10] 机器人技术与具身智能发展 - 特斯拉CEO马斯克透露公司正全力推进Optimus人形机器人大规模生产,目标明年生产5万至10万台,并预计未来特斯拉80%价值将来自于此[11] - 优必选再签3000万元人形机器人大单,其Walker系列人形机器人累计获近4.3亿元合同,产品已进入全球多家工厂实训[12] - 京东方成立机器人公司,注册资本2亿元人民币,经营范围涵盖工业机器人制造和智能机器人研发[11] - OpenAI投资的挪威机器人公司1X Technologies寻求新一轮10亿美元融资,目标估值100亿美元,较2025年1月估值增长12倍以上[13] - 谷歌推出Gemini Robotics-ER 1.5模型,专为提升机器人感知和现实世界互动能力设计,作为机器人高级推理大脑向所有开发者开放[16] AI应用生态与商业模式创新 - 滴滴AI出行助手"小滴"开启公测,用户可通过自然语言下达复杂出行指令,AI助手将完成车辆匹配与调度并提供最多3个方案选择[8] - 京东发布"他她它"数字人万能助手,内置数字人智能体可回答问题、聊天、点餐,并支持用户自创智能体及装入智能设备[7] - AI陪伴硬件公司珞博智能完成红杉中国领投的数千万元天使+轮融资,其产品"Fuzozo芙崽"月销量突破2万台[14] - AI初创公司Paid完成2160万美元种子轮融资,主打"结果计费"商业模式,为AI agent提供收益分成基础设施[14] - 数据公司Fivetran寻求收购估值数十亿美元的DBT Labs,旨在整合数据建模工具和服务,提供更全面数据解决方案[15] AI行业趋势与影响 - OpenAI CEO Sam Altman预测到2030年超级智能很可能出现,AI转折点是从被动等待用户提问转变为主动思考[17] - 周鸿祎表示公司有理由裁掉拒绝使用AI的员工,强调AI时代趋势要求员工必须适应和应用AI技术[15] - 蓝色光标投资PureblueAI清蓝超千万元,其2025年上半年AI驱动收入达15.7亿元,已超2024年全年[13] - 语音聊天App Neon-Money Talks上线一周冲入美区App Store免费榜前五,揭示AI时代数据商品化趋势及隐私保护担忧[9] - AI代理平台Paid已拿下包括Artisan在内的客户,并与ERP供应商IFS达成合作,探索AI代理新型商业模式[15]
商汤推出短片创作平台Seko 成本骤降引10万创作者入驻
证券时报网· 2025-09-30 11:41
公司产品发布与技术创新 - 商汤推出业界首个“创编一体”的AI视频创作平台Seko,用户通过文字指令和对话即可生成影片[1] - Seko平台可将制作单分钟动画的成本较传统模式大幅降低99.5%[1] - 平台集成自研SekoTalk技术,支持长图生成影像并匹配口型,且不受时长限制[1] - 平台提供配音及配乐服务,包含60种自然音色,确保角色画面、台词与配音高度匹配[1] - Seko通过复制分镜及对应指令的上下文记忆和改图能力,保障剧情与场景连贯性[2] - 平台集成日日新、即梦4.0、可灵2.1等一致性生图模型,可一次性创作高度一致的超长连续分镜[2] - Seko的专业级成片编辑器支持创作中预览效果,便于高效修改并导出成片[2] 市场采用与行业影响 - Seko平台已吸引逾10万内地创作者使用,涵盖影片制作团队、KOL、短剧导演等群体[1][2] - AIGC创作者利用Seko制作的短片《飞天计划》已获得“古今双飞天AIGC创新设计大赛”最佳创意奖[2] - AI短剧成为新趋势,Seko平台涵盖AI短剧、AI漫剧等热门场景[1] - 公司已从教育、医疗、媒体、金融、交通等领域的ToB与ToG客户中获得生成式AI新项目订单[3] 财务表现与机构观点 - 商汤股价于9月30日大涨5.47%,盘中最高触及2.9港元,创下2023年4月以来两年多新高[4] - 高盛预期公司未来项目将加速增长,主要受惠于内地云端资本开支提升及“AI+”行动方案等政策推动[3] - 高盛认为商汤具备提供覆盖算力、AI基础设施、基础模型及生成式AI应用的全套解决方案能力[3] - 预计公司未来几年将继续专注于大型项目,以确保更高效率并提高收入[3]
腾讯研究院AI速递 20250813
腾讯研究院· 2025-08-12 16:01
英伟达和AMD芯片出口许可 - 英伟达和AMD同意向美国政府上缴特供中国芯片收入的15%以换取出口许可证 [1] - 英伟达将上缴H20芯片在中国销售收入的15%,AMD上缴MI308芯片相同比例收入 [1] - 美国商务部已开始发放面向中国市场的出口许可证 [1] OpenAI在IOI竞赛表现 - OpenAI在2025年国际信息学奥林匹克AI赛道取得金牌级成绩,在330位人类选手中排名第6 [2] - 仅使用通用推理模型,未针对比赛专门训练,遵守5小时答题时间和50次提交限制 [2] - 成绩从去年第49百分位跃升至第98百分位,展示强大通用推理能力 [2] 智谱开源GLM-4.5V模型 - 开源106B参数视觉推理模型GLM-4.5V,在41个多模态榜单达SOTA性能 [3] - 图像识别与推理测试击败99%人类玩家,创下图寻游戏全球第66名 [3] - 采用三阶段训练策略,支持64K多模态长上下文,API价格低至输入2元/M tokens [3] 昆仑万维开源3D生成模型 - 开源Matrix-3D大模型,可从单张图像生成高质量全景视频和可漫游3D空间 [4] - 具备场景全局一致、生成范围大、高度可控等五大核心优势 [4] - 构建包含116K全景视频、22M全景帧的Matrix-Pano数据集 [4] 腾讯混元多模态模型 - 发布混元Large-Vision模型,采用MoE架构,激活参数52B [5] - 在国际LMArena Vision榜取得1256分,位列国内第一 [6] - 基于数十亿参数视觉编码器和389B参数MoE语言模型构成 [6] GitHub并入微软CoreAI - GitHub将整体并入微软新成立的CoreAI工程集团,不再独立运营 [7] - 由微软开发者部门负责人和AI平台副总裁分管 [7] - 目标是将GitHub打造为"AI智能体工厂" [7] 商汤AI视频工具Seko - 推出全流程视频生成工具Seko,可自动完成剧本理解、镜头拆解等工作 [8] - 基于Agent系统集成文生图、图生视频等多种功能 [8] - 提供可视化成片编辑体验,支持分镜复制和单镜头替换 [8] 苹果Siri升级计划 - 分三阶段重塑Siri,2025年底推出初步"Apple智能" [9] - 基于App Intents框架打通应用间接口,支持屏幕感知和连续对话 [9] - 正与Uber、YouTube等战略伙伴进行内部测试 [9] Periodic Labs材料科学AI - 由OpenAI和DeepMind前成员创立,获2亿美元融资 [10] - 成立3个月即获10亿美元投前估值,OpenAI可能参投 [10] - 目标是构建"用于材料科学的ChatGPT" [11] GPT-5与Claude编程测评 - GPT-5在算法题上token消耗比Claude少90%(8K vs 79K) [12] - Claude在网页开发还原度更高但token消耗更多(140万 vs 90万) [12] - GPT-5完成任务成本约$3.50,Claude约$7.58 [12]