绝影开悟

搜索文档
辅助驾驶有效数据难采集?首个已量产、可交互世界模型来了
南方都市报· 2025-07-29 13:59
端到端自动驾驶的挑战 - 自动驾驶系统需要采集海量数据 特斯拉拥有700万台量产车进行数据回流[2] - 需覆盖各种高风险场景数据 但人类驾驶行为中仅有极少部分数据对训练有价值[2] - 存在概率性问题且特定场景难以复现 导致模型训练存在数据瓶颈[2] 世界模型的技术突破 - 推出行业首个量产可交互的"绝影开悟"世界模型 配合生成式驾驶数据集WorldSim-Drive[4] - 基于单张A100 GPU每日生成数据相当于10台真实车或100台路测车 相当于500台量产车采集能力[4] - 当前20%数据通过世界模型生产 可生成千万级场景数据并打造实时交互训练场[4] 4D重建与场景编辑能力 - 具备1km²真实世界高精度重建能力 提供多视角空间数据[7] - 支持对视频内容进行任意编辑 包括移除/增加车辆 改变车辆类型 控制刹车转向等操作[7] - 通过API开放给客户实现要素自定义 生成多模态摄像头数据并实现精准可控[7] 具身智能的数据挑战 - 头部机器人企业年出货量仅四位数 真实数据采集有限[5] - 99%具身智能训练数据需来源于合成数据[5] - 视觉数据产生速度落后于算力增长 导致模型数据需求出现倒挂现象[5] 智能层次与规则定义 - 智能层次从感知到行为再到规则定义 需在交互中产生新智能[9] - 重要是为机器人定义价值观与文化 在规则允许范围内产生规则[9] - 通过自上而下约束方式确保智能体在既定框架内演进[9]
搭建AI通往真实世界交互的桥梁,商汤“绝影开悟”世界模型再升级
钛媒体APP· 2025-07-29 06:02
世界模型技术定位 - 世界模型核心价值在于扩展AI物理边界而非替代人类认知 作为连接数字与真实物理世界的技术桥梁[2] - 技术产品展示辅助驾驶量产落地能力 同时向具身智能领域延伸[2] 量产能力与产业合作 - 行业首个实现量产的生成式世界模型 技术价值已体现在产业实践中[3] - 与上汽智己汽车打通Cut-in及碰撞等关键场景数据生成链路 实现高风险场景批量生成[3] - 联合打造数据工厂 通过规模化生成场景数据加速辅助驾驶系统安全落地[3] - 解决传统路测痛点:真实采集成本高 极端案例覆盖率低 例如罕见暴雨追尾场景可在数小时内生成数千组变体数据 而真实采集需数年等待[3] 产品平台与数据集 - 发布辅助驾驶领域首个生成式世界模型产品平台 面向B端企业与C端开发者开放试用[4] - 平台支持多维度参数调整:天气(晴/雨/雪)、光线(黎明/正午/黄昏)、道路类型(高速/城区/乡村)[5] - 支持提示词生成功能 用户输入文本描述即可一键生成对应场景视频[5] - 配套业界最大规模生成式驾驶数据集WorldSim-Drive 包含超100万段量产级数据[5] - 覆盖50余种天气光照条件 200类交通标牌及300类道路连接场景[5] - 通过多视角时空对齐技术生成第一视角与第三视角数据 分辨率达1080P 支持分钟级连续记录 保真度接近真实采集[5] - 基于单张A100 GPU每日生成数据量相当于10台真实测试车或100台路测车采集能力 效率约等于500台量产车总和[5] - 目前20%训练数据来自模型生成 大幅降低对真实路测依赖[5] 4D交互训练场技术突破 - 通过融合3DGS重建技术与世界模型生成能力实现三项进步[6] - 大尺度高精度重建:对1km²范围真实空间进行高精度数字化重建[8] - 动态场景闭环生成:通过文本描述或场景布局设定触发生成流程 快速生成占道急刹等复杂场景[8] - 实时交互能力:策略模型与环境模型实现实时响应 确保仿真测试与真实驾驶一致性[8] - 与智己汽车合作构建测试场景库 覆盖占道急刹等典型场景 未来计划扩展至千万级规模[8] - WAIC现场观众可通过交互界面体验虚拟驾驶 实时操控车辆应对暴雨天气加塞场景[8] 具身智能领域延伸 - 解决机器人等领域数据维度爆炸与Sim2Real鸿沟问题[10] - 将辅助驾驶领域虚实融合数据迁移至具身智能[10] - 构建多模态时空对齐能力:通过多传感器融合技术精准匹配视觉/触觉等数据[10] - 生成高保真4D环境:基于动态环境建模实时预测物体运动轨迹[10] - 建立闭环验证体系:通过强化学习在虚拟环境训练后迁移至真实世界[10] - 依托具身3D资产库:包含10万个真实3D资产 覆盖家庭/办公/工业等20类场景动作数据[10] - 生成完整数据视角:同时支持机器人第一视角(手部特写)与第三视角(上帝视角全身动作)[11] 战略意义与技术逻辑 - 世界模型将AI创造力转化为生产力 为辅助驾驶提供场景数据 为具身智能打造数据引擎[11] - 技术逻辑围绕构建与真实世界一致的4D模型 让AI在虚拟环境中学会与物理世界交互[11] - 应用前景包括家庭机器人预判老人起身动作 工业机械臂自主避障等场景[11]
“为我点咖啡的,竟然是辆电动车”
36氪· 2025-07-29 04:15
大会盛况 - WAIC 2025规模创历史新高 单日票原价168元被炒至2000元以上 现场人流如潮堪比科技庙会 [1] - 800家企业参展 展出3000余产品和100+首发新品 大模型/AI终端/算力设施/智能机器人数量同比翻番 [3] - 77岁"AI教父"Geoffrey Hinton首次访华参会 带伤完成首次长途国际旅行 [3] 技术趋势 - AI技术从实验室走向应用落地 产业壁垒降低 深度渗透日常生活 [5] - 人形机器人实现从"炫技"到"实用"跨越 具备格斗/艺术/陪伴等多元功能 部分进入量产阶段 [20] - 商汤绝影推出行业首个量产可交互世界模型"绝影开悟" 单张A100 GPU日生成数据相当于500辆量产车采集量 [14][17] 汽车智能化 - 斑马智行发布端侧多模态大模型方案 实现车端90%服务闭环 现场演示AI点咖啡全流程自然交互 [7][9] - 吉利汽车展出4款新车 首发超拟人车载AI智能体 联合发布智能座舱Agent OS系统 [10][12] - 特斯拉携Cybertruck/人形机器人参展 Robotaxi业务以视频形式亮相 展台持续火爆 [17][18] 产业生态 - 上海市组建925亿元AI专项基金 包括600亿国家基金/225亿母基金/100亿生态基金 [23] - 西井科技全球首发Q-Tractor P40 Plus无人牵引车 其智能重卡连续参演《流浪地球》系列电影 [20][21] - 腾讯等科技公司展示智能座舱服务 AI与汽车经济融合催生新质生产力 [7]
WAIC 2025上海开幕,“绝影开悟”世界模型升级亮相
中国汽车报网· 2025-07-28 02:45
公司动态 - 商汤绝影在2025世界人工智能大会上展示全新升级的"绝影开悟"世界模型,该模型是行业首个已量产、可交互的生成式世界模型产品平台 [1] - 公司发布业内最大规模的生成式驾驶数据集"WorldSim-Drive",持续赋能辅助驾驶行业 [1] - 商汤绝影与上汽集团旗下智己汽车深度合作,已打通Cut-in、碰撞等场景的数据生成链路,未来将共同打造数据工厂加速辅助驾驶系统落地 [4] - 公司正式发布辅助驾驶领域首个生成式世界模型产品平台,面向B/C端用户开放试用,基于"绝影开悟"世界模型构建 [4] 技术突破 - "绝影开悟"世界模型具备强大的物理规律理解与场景控制生成能力,是业内首个应用于真值训练数据生产的世界模型 [4] - 公司20%的数据通过世界模型生产,生产效率很高 [4] - 商汤绝影展示虚实融合的数据范式,以人、物体、场景为核心生成时空一致的第一视角和第三视角数据,赋能具身智能领域 [3] - 公司技术可生成千万级场景数据,打造实时交互训练场,同时构建具身智能的数据引擎 [3] 行业影响 - 商汤绝影深度参与上海自动驾驶实训场建设,以世界模型的数据生成和仿真测试能力赋能实训场 [3] - 公司在WAIC 2025展台提供世界模型实时交互体验,观众可通过简洁界面生成场景视频体验领先数据集性能 [7] - 商汤绝影CEO表示世界模型将AI创造力转化为生产力,搭建AI从数字世界通往物理世界的桥梁 [3]