Workflow
3D视觉
icon
搜索文档
奥比中光20250715
2025-07-16 00:55
纪要涉及的公司 奥比中光 纪要提到的核心观点和论据 - **技术优势**:奥比中光是国内唯一实现深度相机全流程自研的公司,从芯片到算法均自主研发,在一致性和降本方面有明显优势,且产品已开始引领全球技术水平,如在测量范围、分辨率、精度和功耗等方面优于英特尔 RealSense,价格有至少 20%的优势 [2][4][12] - **生态合作**:通过与英伟达、李飞飞等建立生态合作关系,扩大在机器人和人形机器人领域的业务规模,巩固技术领先地位,提升市场影响力,促进产品在相关领域的应用 [2][5] - **收入增长预期**:未来几年预计迎来收入爆发式增长,2025 年预计收入达 8 - 10 亿元,较 2024 年增加约 2 亿元,增长来自创想 3D 扫描仪及下游机器人订单增长 [2][6] - **收入来源**:主要收入来自 3D 视觉模组、终端产品模组等,生物识别占比 40% - 50%,Aiot 占比超过 50%,未来增长点集中在 Aiot 和工业应用领域 [2][7] - **市场份额**:国内机器人公司采用奥比中光深度相机方案的渗透率达 70% - 80%,国内市场份额主要由其占据,北美和欧洲市场有被替代趋势,预计长期市场空间可达千亿级别,中短期可达 500 亿左右,有望长期保持 30% - 50%的市占率 [2][9][13] - **盈利预期**:2025 年预计利润 7000 万元,2026 年有望超 3 亿元,2027 年或达 5 亿元以上,利润增速显著,长期看好其市值有望达 500 亿元 [4][17] 其他重要但是可能被忽略的内容 - **人才激励**:前几年发放接近 10 亿元激励费用挽留核心研发人才,虽导致前期利润为负,但确保技术领先,目前股权支付费用逐渐归零,核心技术成熟,利于控制成本和提升盈利能力 [8] - **机器人价值量**:目前单个机器人价值量在 5000 - 10000 元之间,每个摄像头成本约 2500 元,一个机器人通常用 2 - 4 个摄像头,高端型号用 6 - 8 个,随生产规模扩大摄像头价格可能下降,但每台机器人使用摄像头数量或增加,提升整体价值量 [10] - **深度相机优势**:相比特斯拉 2D 方案,深度相机有更高性价比和更低算力要求,大多数公司采用 3D 深度相机更具优势,长期来看深度相机渗透率和市场占有率将提升 [11][16] - **市场表现**:绑定微软、英伟达和李飞飞等,英伟达机器人平台被全球 80%以上机器人研发团队使用,该平台唯一推荐使用奥比中光深度相机,李飞飞实验室也采用其产品进行研究,增强品牌效应和客户拓展优势 [15]
从25年顶会论文方向看后期研究热点是怎么样的?
自动驾驶之心· 2025-07-06 08:44
计算机视觉与自动驾驶研究热点 - 2024年CVPR和ICCV两大顶会的研究热点集中在四大领域:通用计算机视觉、自动驾驶相关、具身智能、3D视觉 [2] - 通用计算机视觉细分方向包括diffusion模型、图像质量评估、半监督学习、零样本学习、开放世界检测等 [3] - 自动驾驶领域聚焦端到端系统、闭环仿真3DGS、多模态大模型、扩散模型、世界模型、轨迹预测等技术 [3] - 具身智能领域重点研究方向为VLA(视觉语言动作模型)、零样本学习、机器人操作、端到端控制、sim2real迁移、灵巧抓取等 [3] - 3D视觉领域热点包括点云补全、单视图重建、3D高斯泼溅(3DGS)、3D匹配、视频压缩、神经辐射场(NeRF)等 [3] 自动驾驶技术应用方向 - 自动驾驶核心技术涵盖大模型应用、VLA系统、端到端解决方案、3D高斯泼溅(3DGS)、BEV感知、多传感器融合等 [4] - 具体技术分支包括毫米波雷达与视觉融合、激光雷达与视觉融合、多传感器标定、车道线检测、在线地图构建、Occupancy网络等 [4] - 决策规划领域涉及高性能计算、语义分割、轨迹预测、世界建模、3D目标检测等关键技术 [4] 具身智能与机器人技术 - 具身智能核心方向包括视觉语言导航、强化学习、Diffusion Policy、具身交互、机器人位姿估计等 [4] - 机器人控制技术覆盖运动规划、双足/四足机器人控制、遥控操作、触觉感知、SLAM等 [4] - 零样本学习在具身智能中具有重要应用价值 [4] 3D视觉与通用CV技术 - 3D视觉关键技术包含点云处理、3D高斯泼溅(3DGS)、SLAM等 [4] - 通用计算机视觉持续关注diffusion模型、图像质量评估、半监督学习等基础方向 [4] - 零样本学习在通用CV和具身智能领域均具有交叉应用 [3][4] 学术成果与科研支持 - 自动驾驶领域已有2篇论文被CVPR 2025收录 [3] - 科研支持范围覆盖自动驾驶顶会(CCF-A/B/C)、SCI各分区期刊、EI/中文核心等 [4] - 技术支持方向包括毕业论文、申博研究、学术竞赛等应用场景 [4]
ArtGS:3DGS实现关节目标精准操控,仿真/实物双验证性能SOTA!
具身智能之心· 2025-07-04 09:48
研究背景与出发点 - 关节目标操作是机器人领域的关键挑战,核心难点在于复杂的运动学约束和现有方法有限的物理推理能力 [3] - 传统方法如端到端强化学习或模仿学习需要大量数据但常因缺乏物理知识导致动作违反约束 [3] - 3D视觉方法如GAMMA、RPMArt存在点云稀疏性、无序性和时间一致性不足的问题 [3] - 提出ArtGS框架通过扩展3D高斯溅射整合视觉-物理建模,优化关节骨骼参数保证物理一致性 [3] 核心框架与技术细节 - ArtGS包含三个关键模块:静态高斯重建、VLM基于骨骼推理、动态3D高斯关节建模 [4] 静态3D高斯重建 - 通过3D高斯溅射从多视图RGB-D图像重建高保真3D场景,场景表示为3D高斯球集合 [5] - 利用URDF文件和改进的Denavit-Hartenberg正运动学构建变换矩阵控制高斯点运动 [5] VLM基于骨骼推理 - 借助微调的视觉-语言模型InternVL-2.5-4B初始化关节参数估计 [6] - 通过3DGS新视图合成能力生成目标正视图辅助VLM输出视觉问答结果 [6] - 对旋转关节和移动关节分别采用PCA和边界框叉积方法估计初始关节参数 [8][9] 动态3D高斯关节建模 - 通过阻抗控制实现机械臂与环境的交互,结合微分渲染优化关节参数 [10] - 高斯点的均值和旋转因子通过线性混合蒙皮变换到关节空间 [10] - 通过最小化包含L1损失、结构相似性损失和正则化项的损失函数优化关节参数 [10] 实验验证与结果分析 关节参数估计 - ArtGS在关节轴误差和关节原点误差上显著低于ANCSH、GAMMA、Ditto等方法 [12] - 例如在洗碗机上ArtGS的AE为3.01°、OE为2.17cm,远低于ANCSH的15.32°和9.26cm [13] 关节目标操作 - 模拟环境中ArtGS操作成功率达62.4%-90.3%,显著高于TD3的3.1%-6.6%和Where2Act的8.4%-11.2% [14][15] - 真实世界实验中ArtGS对抽屉操作成功率达10/10,对柜子达9/10 [17] 关键能力验证 - ArtGS能通过3DGS可微分渲染优化参数,即使VLM初始轴估计误差超过20°仍能提升操作成功率 [19] - 具备跨机械臂适应性,能精确重建Franka、xArm7等不同机械臂 [19] 总结与展望 - ArtGS将3D高斯溅射转化为关节目标的视觉-物理模型,提升优化效率并解决遮挡问题 [20] - 未来方向将扩展至更复杂场景,提升对多关节、高动态目标的建模与操作能力 [21]
从看见到看懂 机器人之“眼”看世界
金融时报· 2025-06-30 12:22
3D视觉技术与机器人产业 - 奥比中光展示的机械手可在3D视觉下实现360度灵活抓取 体现精密机械与人类意识的协作 [1] - 机器人需要AI视觉与3D视觉获取环境感知能力 实现从"看见"到"看懂"的跨越 [1] - 政策明确推动机器视觉与机器人技术融合 覆盖教育、物流等应用领域 [2] 行业发展趋势 - 机器人被视为3D视觉技术最重要的应用载体 行业专家预测机器人将成为增长最快领域 [3] - 中国服务机器人3D视觉传感器市场中 奥比中光市占率超70% [3] - 2025年中国视觉人工智能市场规模预计达1873亿元 3D视觉技术需多学科深度耦合 [4] 公司技术布局 - 奥比中光构建机器人视觉产业中台 布局结构光、iToF、Lidar等主流3D感知技术 [3] - 公司技术矩阵已发展到"双目视觉+多线雷达"阶段 支撑机器人精准操作需求 [3] - 具身智能产业加速落地 3D视觉技术将迎来爆发式增长 [3] 资本支持与企业发展 - 2015-2020年30家机构战略入股奥比中光 近期拟募资21.87亿元投入AI视觉研发 [7] - 金融政策强调壮大耐心资本 支持科技领军企业与专精特新中小企业发展 [7] - 奥比中光案例体现资本对科创企业的关键支撑作用 [6][7]
具身的秋招马上要开始了,去哪里抱团呀?
具身智能之心· 2025-06-28 07:48
行业发展趋势 - 自动驾驶和具身智能成为AI技术发展的主线 支撑了近一半的技术路线和融资金额 [1] - L2~L4自动驾驶功能逐步实现量产 人形机器人和四足机械狗等具身智能产品完成复杂动作演示 [1] - 行业对技术和人才需求旺盛 尤其在自动驾驶、具身智能、3D视觉和机器人领域 [1] 求职社区概况 - AutoRobo知识星球专注于自动驾驶、具身智能和机器人方向的求职交流 成员近1000名 [2] - 成员包括地平线、理想汽车、华为、小米汽车等公司的社招人员以及2024-2025届秋招学生 [2] - 社区提供面试题目、面经、行业研报、谈薪技巧、内推资源和简历优化等服务 [2] 招聘信息 - 日常分享算法、开发、产品等岗位信息 涵盖校招、社招和实习机会 [3] - 寒武纪持续招聘2026届实习生 包括C++开发、PyTorch框架研发和软件测试开发等岗位 [4] 面试资源 - 汇总自动驾驶和具身智能方向的"一百问"系列 涵盖毫米波视觉融合、BEV感知、多传感器标定等核心技术 [6][7] - 具身智能领域包含Occupancy感知、相机标定、端到端自动驾驶等专项问题 [8][12] - 整理社招/校招全流程面经 包括代码题、项目细节和面试复盘 [15][19] 行业研究 - 提供领域研报帮助理解行业发展状态、前景和产业链 如世界机器人报告、中国具身智能创投报告等 [13][14] - 深度分析具身智能技术路线、市场机遇和人形机器人量产硬件等专题 [14] 职业发展支持 - 汇总机器人、自动驾驶和AI类专业书籍 构建知识体系 [18] - 分享谈薪技巧、HR面常见问题和岗位薪资谈判策略 [17][20] - 提供转行经验、面试官建议和岗位技能树等职业指导 [20]
【私募调研记录】远望角投资调研奥比中光
证券之星· 2025-06-25 00:10
公司调研信息 - 奥比中光在机器人领域提供全技术路线3D视觉传感器和整体解决方案 应用场景包括商用服务 养老康复 家庭护理 物流配送 农业智能化等 [1] - 公司与消费级3D打印龙头创想三维合作开发消费级3D打印机和高精度手持3D扫描仪 并与佩极眼镜合作推出3D打印定制眼镜 [1] - 公司为天工机器人提供Gemini330系列深度相机 新品Gemini435Le应用于智能物流 机器人等工业自动化领域 [1] - 3D视觉传感器提升机器人智能化水平 功能包括空间扫描 骨架/手势追踪 定位导航 三维重建等 [1] 机构背景 - 深圳市远望角投资管理企业成立于2014年12月30日 核心团队由两位原公募基金经理和一位原上市公司高管组成 从业年限均超10年 [2] - 公司投研团队经验丰富 成立以来以优秀风控和稳健收益获得专业机构认可 入选多家券商 银行 FOF白名单 [2] - 公司2019年荣获中国证券报中国私募基金金牛奖三年期金牛私募管理公司 中国基金报私募基金英华奖中国私募基金成长奖和最佳产品奖 [2] - 2018年获得新浪财经第二届中国私募基金业金刺猬奖最具潜力奖 证券时报年度金长江奖年度优秀私募基金经理等行业奖项 [2]
擂台之上 “慧眼”助力 人形机器人格斗赛 国产“慧眼”如何让机器人精准识敌
广州日报· 2025-05-28 19:01
机器人格斗赛事技术突破 - 宇树G1格斗比赛展现机器人稳定性与瞬间抗冲击能力超预期表现 成为机器人技术发展风向标 有望带动机器人行业新一轮行情 [1] - 比赛机器人采用力传感器 触觉传感器 视觉方案等感知技术 以及谐波减速器 电机等核心传动装置 其中视觉感知技术是理解环境的核心能力 [1] - 参赛G1机器人配备双目深度相机和3D激光雷达 实现360度环境感知 通过多传感器融合技术实时调整姿态完成高强度动作 [2] 机器视觉技术路线对比 - 特斯拉Optimus采用2D摄像头视觉方案 延续车端纯视觉感知技术路线 [2] - 国内厂商主要采用3D视觉(结构光/ToF/双目)结合激光雷达方案 相比2D视觉增加深度信息 提升环境建模与导航精度 [2] - 奥比中光在国内服务机器人视觉市场占有率超70% 为全球少数全面布局六大3D视觉感知技术路线的公司 [2][4] 机器人技术发展阶段 - 当前比赛采用"手动遥控"方式 依赖"机器人选手+真人选手操控"协同配合 [3] - 人形机器人重大进展体现在关节灵活度和平衡运动控制方面 人为指令执行效果超预期 [3] - 未来全自动格斗需机器人具备自动化感知决策能力 视觉传感器感知数据将成为重要基础 [3] 行业发展趋势 - 12月深圳将举办全球首个人形机器人"机甲拳王"自由格斗赛 打造开源竞技联盟 推动跨界融合 [4] - 奥比中光已将双目结构光系列产品送样 适配大部分人形机器人客户 [4] - 机器人格斗竞技将加速技术迭代和场景落地 国产3D视觉感知技术 多维传感技术 精密传动技术等供应链将加速崛起 [4][5]
3D视觉核心优势,物理AI第一步
2025-05-25 15:31
纪要涉及的公司和行业 - 公司:思看科技、行创公司、先临 3D 公司、海克斯康、卡尔蔡司、联赢光、奥普特、铂力特 [1][17][21] - 行业:3D 扫描技术行业、汽车制造、航空航天、工程机械、文物保护、医疗、游戏 [1][10][18] 纪要提到的核心观点和论据 思看科技市场地位和产品特征 - 市场地位:国内市占率第一,全球市占率第二 [2] - 产品特征:产品包括手持式扫描枪、跟踪式扫描设备及一体化质量检测设备,精度可达 0.03 毫米以下,具有高毛利率和高净利率特点,广泛应用于逆向工程、质量检测等高端制造领域 [1][2] 思看科技发展方向 - 深耕工业专业领域和拓展机器人应用,探索新应用场景如 3D 打印,通过与 FDM 3D 打印机结合实现更高效精确建模和打印 [1][3][4] 思看科技重要客户及应用场景 - 重要客户:商飞集团、比亚迪等 [1][5] - 应用场景:客户用跟踪式扫描设备进行大物体、大面积工件扫描,一体化质量检测设备用于高端制造业质量检测,如汽车制造中对车门建模并与理想图纸对比 [5] 思看科技软件算法优势 - 软件算法全部自主研发,能无缝兼容主流 CAD 格式,提供硬件和软件解决方案,在质量检测系统中可快速识别工件误差并实时反馈 [1][6] 思看科技财务状况和收入结构 - 财务状况:过去几年收入稳健增长,毛利率稳定在 76%左右,净利率接近 40%,经营性现金流每年保持 1 亿元以上净流入 [1][7] - 收入结构:海外收入增速显著,目前海外市场贡献约占总收入的 40%,得益于替代海外同类产品和经销模式 [1][7][8] 思看科技国内外市场增速预期 - 海外市场:增速预计保持乐观,得益于直销点落地带来客单价和利润率提升 [1][9] - 国内市场:增速可能放缓,因 2022 年汽车行业资本开支高峰已过,采购周期进入相对平缓期 [1][9] 思看科技产品结构 - 产品包括手持式 3D 扫描仪(价格 10 万元以上)、大型跟踪式 3D 扫描产品、工业级自动化检测系统,新发布消费级产品价格约 2000 美元,正在拓展专业级及消费级市场,增长潜力大 [1][11] 思看科技技术优势 - 体现在识别重建、立体延伸和立体标定三个方面,通过 FPGA 和 SoC 模块进行端侧计算,实现无线状态和多波段复合扫描,在 3D 重建领域有显著竞争优势 [3][13] 扫描技术发展趋势 - 非接触式扫描精度提升,有望替代接触式扫描,未来占据 80%市场份额,思看科技非接触式产品具显著竞争力 [3][14] 思看科技未来驱动力 - 全球高端制造业出海,产品渗透率和市占率稳步提升;物理计算 AI 的应用,在机器人及工业侧有更多应用场景 [15][16] 全球 3D 扫描仪市场参与者 - 主要参与者有行创公司、先临 3D 公司、海克斯康、卡尔蔡司,市场规模目前不大但未来发展潜力大 [17] 3D 扫描技术应用 - 工业领域用于高精度设备如焊缝质量检测;专业级领域用于文物保护、医疗、游戏场景等 [18] 物理 AI 与 3D 扫描技术结合 - 构建完整物理场和生成更多场景,避免传统测试问题,确保数据质量,适用于家居和工业级机器人视觉系统 [19] 思看科技消费级产品及机器人视觉优势 - 消费级产品不断拓展,结合算法有望相同精度下实现更低成本,进入更多机器人场景,在工业级机器人视觉模块输出上表现突出 [20] 思看科技未来盈利预测 - 专业级领域预计翻倍以上增速,工业级预计维持 25% - 30%增速,增速快且盈利水平高,市盈率有提升空间 [21] 其他重要但是可能被忽略的内容 - 思看科技股东结构稳定,由三位浙大系创始人组成一致行动人,还有员工持股平台 [12] - 余杭区政府曾推送思看科技与斯泰科技合作,通过脑机接口捕捉电信号实现截面 1:1 复刻 [18]
奥普特(688686):2024年报及2025年一季报点评:业绩短期承压,研发高度重视
国元证券· 2025-05-21 15:16
报告公司投资评级 - 维持“增持”评级 [1] 报告的核心观点 - 奥普特2024年业绩短期承压但重视研发,2025Q1营收因产品结构优化及AI算法升级推动3C电子领域需求回暖而增长 [2] - 技术突破驱动应用深化,在锂电、3C电子、半导体和汽车领域有显著进展 [3] - 预计公司2025 - 2027年营收和归母净利润增长,维持“增持”评级 [4] 根据相关目录分别进行总结 业绩情况 - 2024年营收9.11亿元,同比 - 3.44%;归母净利1.36亿元,同比 - 29.66%;扣非净利润1.16亿元,同比 - 28.62%;毛利率63.57%,同比 - 0.66pct;净利率14.95%,同比 - 5.57pct;研发投入2.17亿元,同比增长7.28%,研发投入占比达23.81% [2] - 2025Q1营收2.68亿元,同比 + 18.09%;归母净利0.58亿元,同比 + 0.97% [2] 各领域业务进展 - 锂电领域:高精度成像技术及AI检测方案在核心工艺突破,模型与数据共享使项目实施效率提高50%,XG系列相机检测率达99.8%,覆盖头部厂商 [3] - 3C电子领域:2024年营收58,478万元,同比增长0.74%,10GigE相机成像一致性提升约10% [3] - 半导体和汽车领域:半导体行业收入5,081万元,同比增长44.08%;汽车行业收入3,210万元,同比增长89.95%,晶圆缺陷检测达亚微米级精度,芯片缺陷检测精度达0.2μm [3] 投资建议与盈利预测 - 预计2025 - 2027年营收分别为10.99/13.21/15.74亿元,归母净利润分别为1.96/2.45/2.97亿元,对应EPS为1.60/2.01/2.43元/股,对应PE估值分别为54/43/36倍 [4] 财务数据 - 2023 - 2027年营业收入分别为9.44/9.11/10.99/13.21/15.74亿元,收入同比分别为 - 17.27%、 - 3.44%、20.62%、20.17%、19.11% [6] - 归母净利润分别为1.94/1.36/1.96/2.45/2.97亿元,同比分别为 - 40.37%、 - 29.66%、43.66%、25.34%、21.00% [6] - ROE分别为6.73%、4.67%、6.35%、7.49%、8.47% [6] - 每股收益分别为1.58/1.11/1.60/2.01/2.43元 [6] - 市盈率分别为54.89/78.04/54.32/43.34/35.82倍 [6]
机械一周解一惑系列:机器人大脑算法迭代对视觉方案的影响
民生证券· 2025-05-09 12:23
报告行业投资评级 - 推荐,维持评级 [8] 报告的核心观点 - 3D 视觉技术应用场景广泛,是工业自动化及众多行业智能化变革的重要驱动力,3D 点云数据在机器人学习中优势显著,为机器人智能化发展提供有力支持,未来应用前景广阔,建议关注 3D 视觉领域领先公司奥比中光 [2][3][106] 根据相关目录分别进行总结 商业应用——3D 视觉工作原理及应用场景 主要任务 - 3D 重建包括 3D 场景深度估计、物体表面数字化采样及数据处理展示,有单目、双目等重建方式及大场景、移动端三维重建 [11] - 位姿感知是对相机或物体在三维物理空间中位置和朝向的计算与实时跟踪 [12] - 3D 理解涵盖物体检测、识别、检索及场景或物体的分割和语义标记等 [13] 工作原理 - 飞行时间法(TOF)通过测量光发射到接收的时间差计算物体距离,分直接 TOF(DTOF)和间接 TOF(I - TOF),用于大视野、远距离、低精度、低成本 3D 图像采集及智能无人系统环境感知 [15] - 结构光投影 3D 成像由投影仪投射特定图案,相机摄取变形图像,通过处理分析计算物体三维坐标信息,有单次投影和多次投影 3D 方法,用于工业检测、3D 建模等领域 [17] - 扫描 3D 成像方法包括扫描测距、主动三角法、色散共焦法等,不同方法有不同特点和适用场景,如单点飞行时间法适合远距离扫描,色散共焦法可扫描多种物体 [30][34] - 立体视觉 3D 成像从不同视点获取图像重构目标物体 3D 结构或深度信息,可通过单目、双目、多目视觉、光场 3D 成像实现,各有其原理和应用场景 [37] - 3D 视觉成像方法比较:ToF 相机、光场相机体积小、实时性好,但存在精度低或成本高问题;结构光投影 3D 系统精度和成本适中,有应用前景;被动立体视觉 3D 成像在工业领域有应用但场合有限;开发成本低廉、精度适中的被动单目 3D 成像系统是 Eye - In - Hand 系统的最佳方案 [48] 应用场景 - 3D 高精度扫描用于精密物件扫描与测量,在工业制造中可检测产品质量,结合三维设计与 3D 打印技术应用于多领域,如先临三维的相关扫描仪有出色表现 [50] - 机器人领域智能优化升级:3D 视觉赋予工业机器人强大感知能力,实现高精度操作,提高生产柔性和自动化程度;在人形机器人领域,帮助机器人实现路径规划、物体抓取与操作、人机交互等功能,如奥比中光的技术助力机器人实现多种功能,北京人形机器人创新中心的“天工 Ultra”配置深度相机提高感知和安全能力 [58][59][63] - 智能物流与仓储管理:3D 视觉技术用于货物识别、定位和测量,实现自动化分拣、码垛和存储,合理规划仓库空间,还可用于库存盘点和货物状态监测,如迈尔微视的视觉解决方案在多个关键场景落地应用 [64] - 生物识别:奥比中光在支付和智能家居安防领域提供 3D 视觉解决方案,如 3D 刷脸支付和 3D 人脸辨识门锁门禁系统 [69] 3D 视觉算法 3D 点云数据在机器人大模型中的优势 - 增强空间推理能力,提升任务成功率:基于点云的方法在成功率和平均排名上超越 RGB 和 RGB - D 方法,注入 3D 点云数据的 VLA 模型能提供更全面空间信息,解决 2D 模型空间感知局限,提高任务成功率 [3][73] - 提高少样本多任务学习能力:PointVLA 利用点云数据丰富信息,在少量训练样本下完成多个不同任务,降低数据采集和训练成本,在真实世界实验中表现出优势 [79] - 具备实际与照片区分能力:PointVLA 基于 3D 点云数据能区分真实物体和照片,避免错误操作,提高系统安全性和可靠性 [80] - 增强泛化能力:3D 点云数据在不同相机视角、光照条件、视觉外观变化下鲁棒性更强,在相关实验中表现优于其他方法,在长时域打包任务中也有良好性能 [83] 机器人视觉图像数据获取与 3D 传感器技术应用 - 机器人视觉数据获取方式与形式:数据采集向高精度、多模态方向发展,主流厂商采用多模态传感器集成,开源数据集为算法训练提供标准化测试环境 [88] - 主要的数据形式与特征:主要数据形式有 3D 点云与深度图、RGB - D 图像等,多模态传感器融合成趋势 [90] - 视觉数据驱动的机器人训练流程:包括数据采集与预处理、算法训练与优化、部署与实时控制几个阶段,通过合成数据扩充训练集,采用 AI 强化学习等方式训练机器人 [91] - 3D 视觉传感器在机器人中的核心作用:成为人形机器人“感知 - 决策 - 执行”链路的核心,体现在环境感知与建模、动作规划与执行、市场驱动与技术趋势几方面,市场需求持续增长,多传感器融合成主流 [92] 3D 传感器算法框架 - Intel RealSense:以开源 SDK 2.0 为核心,统一管理多模态硬件,具有跨平台兼容性与灵活生态,在不同技术方面有不同实现方式和应用场景,但在户外强光环境和复杂场景下有一定局限性 [94] - 奥比中光:以自研 MX 系列芯片为核心构建闭环体系,核心竞争力源于硬件级深度处理与多模态融合技术,在不同技术方面有独特优势,在场景化应用中展现出强大环境适应性 [100] - 核心技术差异与场景适配性分析:两者在技术路线与市场定位上互补,硬件架构和算法生态有差异,影响场景适配性,Intel RealSense 适合轻量场景,奥比中光适合对精度与鲁棒性要求严苛的领域 [104] 投资建议 - 关注 3D 视觉领域的领先公司奥比中光 [5][106]