Workflow
端到端VLA模型
icon
搜索文档
前京东智能驾驶一号位创业,「星源智」要打造通用具身大脑丨36氪独家
36氪· 2025-09-11 23:46
公司背景与融资 - 前京东智能驾驶负责人刘东创立星源智 旨在通过具身智能解决物流末端配送难题[5][7] - 公司完成2亿元天使轮融资 投资方包括中科创星、高瓴创投、元禾原点等机构及产业资本[9] - 技术团队由商业化专家与学术研究者组成 形成"技术+工程+商业"复合能力[9] 技术路线选择 - 放弃纯端到端VLA模型路线 因缺乏低成本真机数据获取方案[11][23] - 采用分层式架构:大脑负责感知规划(基于多模态大模型) 小脑负责运动控制[12][22] - 自研核心抓取与导航技能 同时保持对VLA操作模型的调用能力[24] 商业化策略 - 双轨商业模式:50%作为Tier 1供应商向本体厂商提供软硬件一体解决方案(含5万元/套域控制器) 50%作为总承包方直接服务终端客户[30][32][33] - 定位"具身智能领域的华为" 通过深入场景理解需求反哺技术迭代[32] - 预计单台10万元机器人解决方案中 公司可获取近50%价值量[33] 落地场景规划 - 首选商超/药店拣选场景 因夜间人力替代需求明确且ROI易测算(月成本<2000元/机器人)[36][38] - 技术难点在于细粒度物品识别(当前仅能区分20%SKU)与异形物品抓取[40][41] - 2025年实现拣选机器人规模化落地 同步推进导览导购类低难度场景[42][43] 行业发展判断 - 具身智能需遵循"先落地后迭代"路径 参照特斯拉自动驾驶发展历程[23][46] - 行业存在技术理想主义与商业化务实路线分歧 公司坚持落地能力为生存第一要素[13][46] - 物流行业超2000万分拣从业人员构成替代市场基础[36]
融资超15亿元,国内“最强”90后具身智能机器人创始团队,发布最强端到端VLA模型!
Robot猎场备忘录· 2025-08-14 00:03
公司核心动态 - 星海图发布端到端双系统全身智能VLA模型G0,采用"慢思考、快执行"架构,叠加500小时高一致性动作数据和"三阶段学习训练"策略,实现23自由度全身控制[2][4] - G0模型评测数据在全身动作、长续任务、柔性操作、语言理解方面超越竞品π0,采用双系统异步运行机制(高层G0-VLM以2Hz处理逻辑推理,低层G0-VLA以15Hz执行动作)[4][6][7] - 公司同步构建全球首个开放场景高质量真机数据集Galaxea Open-World Dataset,并推出Real2Sim2Real引擎[2][13] 融资与估值 - 2025年完成5轮A系列融资,累计8轮融资超15亿元,估值达10亿美元[2][8] - 主要投资方包括美团龙珠、蚂蚁集团、今日资本、凯辉基金等,最新A4/A5轮融资超1亿美元[8] - 正在以10亿美元估值进行新一轮融资,投资机构涵盖IDG资本、高瓴创投、百度风投等头部VC[8][9] 技术架构与产品 - 采用"整机+智能"战略,全栈自研本体与大脑,产品体系包含预训练VLA模型、后训练工具链和开发者生态[11][13] - 已推出R1系列机器人(Pro/Lite版本)、3.98万元起A1机械臂、矢量控制底盘X1等硬件,全系列产品19.9万元起[13][15][18] - R1 Pro具备26自由度、3.5kg臂载能力,采用NVIDIA Jetson AGX Orin芯片(200TOPS算力)[18] 创始团队背景 - 核心团队由Waymo/Momenta前员工和清华教授组成,包括USC博士高继扬、MIT博士赵行、UC Berkeley博士许华哲等[11][12] - 许华哲为"UC Berkeley归国四子"之一,团队具备自动驾驶+高校双重背景,被视作行业顶级配置[11][22] 商业化进展 - 产品主要服务于斯坦福李飞飞团队等科研客户,已交付百余台轮式双臂机器人用于数据采集和模型训练[19] - 同构型本体出货量行业第一,但尚未实现ToB场景规模化应用,商用可持续性存疑[20][21] 行业趋势 - 双系统架构VLA模型成为主流技术路径,Figure AI等全球头部企业均采用类似架构[7] - 智平方等国内企业同期发布同类技术Alpha Brain,行业技术壁垒尚未形成[7][21] - 自动驾驶人才密集涌入具身智能领域,它石智航等新创企业5个月内获17亿元融资[21][22]