公司业务转型与财务表现 - 商汤科技生成式AI业务在2024年收入达到24亿元人民币,占公司总收入比例从2023年的34.8%大幅提升至63.7%,成为最关键的业务板块 [1] - 公司2025年上半年净亏损为11.62亿元人民币,同比下降50%,同时研发投入仍在增长 [4] - 公司正通过成立大晓机器人公司,由联合创始人王晓刚出任董事长,正式入局具身智能领域,寻求更落地的业务方向 [2][4] 具身智能行业趋势与市场 - 具身智能被视为下一代AI革命的主赛场,行业正从“数字智能”走向“物理智能” [2][3] - 2024年中国具身智能市场规模已突破8000亿元人民币,近两年该领域涌入了数百家初创公司 [10] - 该赛道是一个规模达数十万亿级乃至更大的广阔赛道,英伟达创始人黄仁勋预测未来机器人数量有望超越手机,单体价值可与汽车媲美 [5] - 行业研发热点已从去年聚焦“具身大脑”,转向如今对“小脑”运控能力的探索 [18] 大晓机器人的战略定位与技术范式 - 大晓机器人成立的初衷是回归真实痛点,提出“以人为中心(Human-centric)”的全新研究范式,而非跟风“本体内卷” [2] - 其最终目标是输出能针对性解决各场景实际问题的软硬一体产品,而非单纯做模型的公司 [10] - 公司采用生态合作模式,与商汤投资布局的本体硬件及零部件企业联合设计和开发硬件,并提供基础模型和素材方案 [12] - 公司提出的“开悟”世界模型3.0采用“多模态理解融合—合成网络—行为预测”三段式架构,区别于现有基于合成数据的模型 [19][21][22] Human-centric范式的核心优势与实践 - 该范式先研究人类与物理世界的互动方式,通过穿戴式设备、第三视角设备等多元工具,结合视觉、触觉、力学等多维度数据记录人类行为,用以训练世界模型 [7] - 其优势在于数据采集效率高,且所有数据均源自真实场景,整合了多维度信息,并能应用人体工程学成果 [24] - 大晓机器人核心教授团队合作构建的EGO life数据集包含300小时第一视角与第三视角的人类真实行为数据,基于此研发的具身视觉模型能有效支撑复杂运动学习 [8] - 该范式预计将在一两年内,在四足机器人(机器狗)领域最先实现规模化应用 [25][27] 具体技术方案与产品开发 - 大晓机器人的技术方案强调需涵盖力、触觉、摩擦等关键维度,而不仅限于视觉,以解决与物理世界三维接触的核心需求 [7] - 在机器狗产品开发中,公司与Insta360合作开发了能实现360度全视角覆盖的全景相机模组,以解决传统机器狗视野局限的问题 [11] - 公司方案为机器狗搭载了自主导航技术,可通过管理平台实现多机协同调度,接收地图导航指令自主执行任务,并支持语言、多模态大模型等灵活交互方式 [27] - 机器狗与商汤方舟视觉平台深度打通,能借助其视频分析、目标检测等能力识别多种场景化问题,并将数据实时回传 [27] 能力复用与商业化落地路径 - 商汤在自动驾驶等领域沉淀的研发体系、数据闭环、安全标准等核心能力可直接迁移至具身机器人研发,提升迭代效率与产品可靠性 [13] - 智慧城市业务中积累的方舟平台拥有上百种应用功能,可与具身机器人打通,当设备走到户外时无缝迁移,拓展功能边界 [13] - 中期来看,商业服务场景的前置仓物流将成为规模化突破点,其需求具有高度一致性,存在标准化的自动化需求 [28] - 长期视角下,家庭场景是重要方向,但落地周期长,安全性是核心挑战,行业正通过与环境式采集合作积累家庭行为数据 [28] AI技术演进脉络 - AI 1.0时代以人脸识别为代表,智能来源于人工标注,模型体量小,难以实现跨场景泛化 [14][15] - AI 2.0大模型时代使用互联网文字和图文数据,其中记录了人类大量行为智能,使模型具备较强的通用性和跨场景能力 [15][16] - AI 3.0具身智能时代转向与物理世界的直接交互,以构建理解世界物理规律和人类行为逻辑的“世界模型”,突破现有数据局限 [17]
硬氪专访|商汤联创王晓刚带队具身智能新业务,要帮机器人重新理解真实世界