LightX2V
搜索文档
当国产 AI 不再是「备胎」
虎嗅APP· 2025-12-17 10:31
国产AI发展趋势与市场热潮 - 国产AI概念成为市场热点,相关公司股价表现强劲,例如“国产GPU第一股”摩尔线程上市五天内暴涨700%,沐曦股份上市最高涨幅达744.64% [2] - 国产算力已从断供背景下的“备胎”选项,发展成为涵盖硬件、模型到应用的完整体系,成为AI领域不可忽视的趋势 [2] - 国产AI技术生态已实现从“可用”到“好用”、“易用”的蜕变,进入效用提升、应用建构与生态协同的新阶段 [2] AI国产化的基石:模型适配 - 行业初期面临的核心问题是算力与模型适配,目标是实现“可用”,但当时产品在能效和易用性方面相对欠缺 [4] - 模型适配是AI国产化的最重要基石,商汤科技自2020年起投入AIDC“大装置”解决该问题,至今已有寒武纪、沐曦、华为昇腾、摩尔线程、壁仞等多家国产芯片完成与商汤大装置SenseCore及“日日新”大模型体系的全面适配 [5] - 适配工作进度加快,例如商汤发布Seko 2.0当天,寒武纪即完成对该模型的“Day 0”适配,在模型效率、算力增强等方面取得显著成果 [6] - 行业通过异构混合调度方案(如接入DeepLink开放计算体系)优化算力调度与跨域训练,提升多种国产芯片间的协同与资源利用率 [7] 国产AI的下一步:应用突破 - 应用是当前国产AI发展的最大瓶颈,算力和模型的进步尚未充分转化为产品性能提升和商业竞争力 [10] - 根据报告,2025年国内头部科技企业AI算力投入预计达4500亿元,其中30%用于国产芯片验证与适配,70%用于算力基础设施建设,但主流AI应用的国产化率仍较低 [11] - 商汤发布的Seko 2.0基于LightX2V框架,该框架设计考虑了国产化适配,通过技术创新使推理能力相比之前提升3倍以上,是国产算力在应用层的优秀出口案例 [11] - 公司通过优化模型核心能力、算力利用率及资源管理机制(如长序列处理、低比特计算、分层调度)来适应国产芯片,并探索端侧应用国产化,如推出搭载“小浣熊”AI助手的全国产智能办公一体机 [12] 国产AI的未来:生态协同 - 国产AI正超越“替代”定位,发展出从芯片、模型到应用的完整技术生态,该生态化进程处于初期但趋势明确 [14] - 商汤联合华为昇腾、寒武纪、沐曦等十余家伙伴发布“商汤大装置算力Mall”,成为早期支持全栈国产的AIDC大装置试验场,旨在提供从硬件到平台服务的全生态灵活产品矩阵 [14][15] - 生态化将降低构建全国产AI技术栈的成本和门槛,实现“即插即用”,使国产算力与模型在注重性价比的场景中具备与国际前沿竞争的实力 [15] - 未来,“国产可控”有望从一项特殊任务转变为默认选择 [16]
商汤科技发布多剧集生成智能体Seko2.0 与寒武纪完成适配
凤凰网· 2025-12-17 02:33
官方数据显示,自2025年7月上线以来,Seko用户量已突破20万,其中短剧与漫剧创作者合计占比达 50%。Seko 2.0推出了SekoIDX技术,旨在解决多剧集生成中角色一致性的问题;其SekoTalk功能则称可 支持两人以上的精准口型同步。 据商汤介绍,使用Seko 2.0可将传统漫剧制作周期缩短80%至90%。为降低生成成本,该公司应用了名 为Phased DMD的蒸馏技术。此外,其开源的实时视频生成推理框架LightX2V已完成对寒武纪、沐曦等 国产芯片的适配。 12月15日,商汤科技正式发布其AI视频生成智能体Seko的2.0版本。该产品定位为"创编一体"的多剧集 生成工具,主要面向短剧与漫剧创作者。 在应用层面,由Seko生成的真人短剧《婉心计》曾登顶抖音AI短剧榜。商汤还与长江电影集团达成战 略合作,计划共同探索AIGC在影视制作中的应用,并预计在明年推出系列短剧及联合孵化院线电影。 ...
商汤发布业内首个多剧集生成智能体Seko2.0
证券日报网· 2025-12-15 11:43
本报讯 (记者李乔宇) 12月15日,商汤集团股份有限公司(以下简称"商汤")正式发布Seko2.0。作为AI视频生成行业首个创 编一体、多剧集生成智能体,Seko2.0专为当下炙手可热的短剧、漫剧行业的个人创作者与工作室量身 打造,让"一人剧组"变成可能。 此前,Seko1.0已成功帮助大批创作者摆脱了在多工具间疲于切换、为复杂提示词耗费心力的困扰。 2025年7月Seko1.0上线后,仅用两个月的时间即实现用户量突破10万,不到半年已聚集超20万创作者, 其中30%为短剧创作者、20%为漫剧创作者,成为高浓度的创作者社区。 全新Seko2.0能够在加速创意落地的同时,进一步降低创作门槛。具体来看,新Seko2.0实现全新UI升 级,突出视觉效果呈现,打造沉浸式创意体验;支持多剧集生成功能,实现超长上下文管理,支持100 集以内剧本的连续创作;实现Agent智能调度,不同剧集中,人物场景道具灵活关联,人物妆造可随场 景改变。 从成本来看,AI短剧、漫剧的多剧集创作涉及海量分镜,仅一个5秒视频就需生成接近10万token,若一 键生成10~20个分镜,总token需求量更将高达100万~200万。对此,商汤提 ...
响应上海AI应用赋能,商汤Seko 2.0助力“一人剧组”
国际金融报· 2025-12-15 08:55
底层技术的突破直接转化为生产力的飞跃。传统工作流中一支团队完成50集作品通常需要3个月以 上,如今借助Seko 2.0,漫剧制作周期可缩短80%至90%。 此外,AI短剧、漫剧多剧集创作存在token需求量大、成本居高不下的痛点,一个5秒视频就需近10 万token,10—20个分镜的总token需求更是高达百万量级。 当下AI漫剧、短剧赛道呈爆发式增长态势。但目前,市面上大部分AI视频生成产品仅支持单集短 片或片段素材生产。12月15日起,商汤科技正式启动产品发布周,多款兼具开创性与实用性的AI产品 将陆续亮相。当日首发的核心产品Seko2.0,作为行业首个创编一体、多剧集生成智能体,助力"一人剧 组"成为现实。 "多剧集、跨分镜的角色一致性一直是行业难点。"商汤科技董事长兼CEO徐立表示,SekoIDX通过 在扩散模型的高噪阶段引入"负参考图",既保证角色在多剧集、跨分镜中的一致性,又避免内容与参考 图过度相似,同时在响应不同表情、姿态、场景等指令时依然能保持高度稳定。 对此,商汤通过两大核心技术突破破解成本难题:一是创新Phased DMD蒸馏技术,采用分阶段蒸 馏结合专家混合模型的架构,让不同模型专精 ...
国产芯片也能跑AI视频实时生成了,商汤Seko 2.0揭秘幕后黑科技
机器之心· 2025-12-15 08:10
机器之心报道 编辑:杨文 自 Sora 2 发布以来,各大科技厂商迎来新一轮视频生成模型「军备竞赛」,纷纷赶在年底前推出更强的迭 代版本。 视频来自 Seko 官网,创作者:噪维 AIGC 谷歌推出 Veo 3.1,通过首尾帧控制和多图参考解决了以往视频生成「抽卡」随机性太强的问题;Runway 拿 出 Gen-4.5,强化了物理模拟和表情动作迁移;快手祭出 Kling 2.6,实现了原生音画同步…… 各家都在炫技,但一个更本质的问题却常被忽略:这些模型距离真正的生产力工具,究竟还有多远? 12 月 15 日,商汤科技产品发布周正式开启,第一天就重磅上线了全新的 Seko 2.0 版本 ,让 AI 短剧创作真 正实现「一人剧组」。 比如只需输入一句简单的提示词,它立马就能策划剧本大纲,生成分镜和视频,整个过程相当麻溜。 视频来自 Seko 官网,创作者 : 小铭 AI 百宝箱 无论是 1 分半钟的 3D 艺术风格的动画短片: 还是唇形同步精准的数字人音乐 MV,Seko 2.0 也都能在最短时间内信手拈来。 视频来自 Seko 官网,创作者 : AI 制片人 Webb 作为行业首个创编一体、多剧集生成智能体 ...
从分钟级等待到20倍超速:LightX2V重写AI视频生成速度上限
机器之心· 2025-12-08 04:27
核心观点 - 开源项目LightX2V通过算法与工程的全栈优化,旨在将高质量视频生成推向消费级硬件上的1:1实时体验,其技术栈在社区中迅速流行,单月下载量超过170万次[2] 技术架构与性能 - 项目目标是在主流硬件上实现视频生成的1:1实时体验,远超现有框架[2][4] - 通过系统级优化,将生成5-10秒视频的时间从几分钟压缩到与视频时长接近的水平,实现接近1:1的实时体验[7] - 在同类开源方案中,相比SGLang Diffusion、FastVideo等框架,在延迟和吞吐上具有明显优势,尤其在8GB-24GB消费级显卡区间能跑满硬件能力[7] 核心算法创新 - **Phased DMD步数蒸馏**:将原本40-50步的视频扩散过程压缩到4步,同时保持时间一致性和运动细节,基于此技术的少步模型在Hugging Face趋势榜长期靠前,累积下载量达百万级[10][11] - **LightVAE轻量级VAE**:针对视频生成场景设计,在保持高清画质和时间一致性的前提下,有效降低编解码开销,为4步推理释放更多预算[12] - 两项核心算法协同,先在算法层面打通路径,再通过工程优化榨干硬件性能[13] 全栈性能工程优化 - 通过一系列关键技术模块,将“能跑”变成“跑得快、跑得省”,并支持从单机单卡扩展到多卡集群[14][15][16] - **显存门槛**:通过步数蒸馏、低比特量化和分级Offloading,将完整工作流的显存需求压至8GB以下,入门级消费卡即可运行[21] - **吞吐与延迟**:综合使用低比特算子、稀疏注意力与特征缓存,在常见5秒视频场景下达到接近1:1的实时生成速度[21] - **低比特算子**:采用MXFP8/MXFP6/NVFP4等技术,在不明显损伤画质的前提下压缩计算与带宽,释放硬件算力[21] - **稀疏注意力算子**:利用视频时空特征的稀疏性,减少冗余计算,提升大分辨率下的吞吐[21] - **特征缓存**:对中间特征进行缓存与复用,降低重复计算,进一步缩短延迟[21] - **三层延迟隐藏Offloading**:通过精细化的显存-内存调度,在8GB显存上完成28B级别MoE模型推理[21] - **FP8通信多卡并行**:结合FP8通信和流水线/序列并行,在多卡环境下提升吞吐,面向5090等消费级新卡实现更高帧率的强实时目标[21] 模型与硬件生态支持 - **模型生态**:已支持Wan2.1/Wan2.2、CogVideo1.5、HunyuanVideo1.5等主流视频生成模型,以及Matrix Game、MagicDrive等世界模型,并提供4步或少步数配置与加速方案[21] - **应用生态**:深度集成ComfyUI,其LightVAE等核心组件已进入社区主干工作流,用户可在图形界面中直接调用加速推理[21] - **硬件生态**:除支持NVIDIA 3060/4090/5090及A100/A800/H100/H800/H200等显卡外,还原生支持寒武纪MLU590、沐曦C500等国产AI芯片,为本地化、大规模部署提供基础[21] 使用与落地场景 - **个人开发者**:只需带独显的笔记本或台式机,即可本地启动带前端界面的视频生成工具,在ComfyUI中完成素材调试、风格迭代和项目输出[21] - **企业用户**:通过服务化部署方案,可一键搭建面向外部的API服务和Web应用,并按需扩展到多机多卡集群,支持批量视频生产和内部工具集成[21] - **普通用户**:可直接访问网页版入口x2v.light-ai.top,在浏览器中体验少步视频生成和实时预览[21] - 应用覆盖从图像转视频、文本转视频,到世界模型和自动驾驶仿真等领域,旨在通过开源方式将高质量、低成本、强实时的视频生成能力普及[19]