Workflow
搭建AI通往真实世界交互的桥梁,商汤“绝影开悟”世界模型再升级
商汤商汤(HK:00020) 钛媒体APP·2025-07-29 06:02

世界模型技术定位 - 世界模型核心价值在于扩展AI物理边界而非替代人类认知 作为连接数字与真实物理世界的技术桥梁[2] - 技术产品展示辅助驾驶量产落地能力 同时向具身智能领域延伸[2] 量产能力与产业合作 - 行业首个实现量产的生成式世界模型 技术价值已体现在产业实践中[3] - 与上汽智己汽车打通Cut-in及碰撞等关键场景数据生成链路 实现高风险场景批量生成[3] - 联合打造数据工厂 通过规模化生成场景数据加速辅助驾驶系统安全落地[3] - 解决传统路测痛点:真实采集成本高 极端案例覆盖率低 例如罕见暴雨追尾场景可在数小时内生成数千组变体数据 而真实采集需数年等待[3] 产品平台与数据集 - 发布辅助驾驶领域首个生成式世界模型产品平台 面向B端企业与C端开发者开放试用[4] - 平台支持多维度参数调整:天气(晴/雨/雪)、光线(黎明/正午/黄昏)、道路类型(高速/城区/乡村)[5] - 支持提示词生成功能 用户输入文本描述即可一键生成对应场景视频[5] - 配套业界最大规模生成式驾驶数据集WorldSim-Drive 包含超100万段量产级数据[5] - 覆盖50余种天气光照条件 200类交通标牌及300类道路连接场景[5] - 通过多视角时空对齐技术生成第一视角与第三视角数据 分辨率达1080P 支持分钟级连续记录 保真度接近真实采集[5] - 基于单张A100 GPU每日生成数据量相当于10台真实测试车或100台路测车采集能力 效率约等于500台量产车总和[5] - 目前20%训练数据来自模型生成 大幅降低对真实路测依赖[5] 4D交互训练场技术突破 - 通过融合3DGS重建技术与世界模型生成能力实现三项进步[6] - 大尺度高精度重建:对1km²范围真实空间进行高精度数字化重建[8] - 动态场景闭环生成:通过文本描述或场景布局设定触发生成流程 快速生成占道急刹等复杂场景[8] - 实时交互能力:策略模型与环境模型实现实时响应 确保仿真测试与真实驾驶一致性[8] - 与智己汽车合作构建测试场景库 覆盖占道急刹等典型场景 未来计划扩展至千万级规模[8] - WAIC现场观众可通过交互界面体验虚拟驾驶 实时操控车辆应对暴雨天气加塞场景[8] 具身智能领域延伸 - 解决机器人等领域数据维度爆炸与Sim2Real鸿沟问题[10] - 将辅助驾驶领域虚实融合数据迁移至具身智能[10] - 构建多模态时空对齐能力:通过多传感器融合技术精准匹配视觉/触觉等数据[10] - 生成高保真4D环境:基于动态环境建模实时预测物体运动轨迹[10] - 建立闭环验证体系:通过强化学习在虚拟环境训练后迁移至真实世界[10] - 依托具身3D资产库:包含10万个真实3D资产 覆盖家庭/办公/工业等20类场景动作数据[10] - 生成完整数据视角:同时支持机器人第一视角(手部特写)与第三视角(上帝视角全身动作)[11] 战略意义与技术逻辑 - 世界模型将AI创造力转化为生产力 为辅助驾驶提供场景数据 为具身智能打造数据引擎[11] - 技术逻辑围绕构建与真实世界一致的4D模型 让AI在虚拟环境中学会与物理世界交互[11] - 应用前景包括家庭机器人预判老人起身动作 工业机械臂自主避障等场景[11]