Workflow
视觉数据
icon
搜索文档
大摩:视觉数据重构AI机器人竞争格局 特斯拉(TSLA.US)为核心关注标的
智通财经网· 2025-09-24 13:36
文章核心观点 - AI机器人竞争焦点从算法迭代转向数据争夺 视觉数据成为VLA模型训练的核心资源 企业通过场景覆盖和数据积累构建技术壁垒 [1] - 光子之争将随具身人工智能技术成熟而加剧 能平衡数据收集效率 用户隐私与商业化落地的企业有望脱颖而出并重塑产业格局 [1] 视觉数据价值与行业共识 - 视觉-语言-动作模型是AI机器人实现自主交互的核心 现实捕捉数据成为全球科技与制造巨头争夺焦点 [2] - 视觉数据被比喻为胖金枪鱼 需配备数据处理能力才能释放价值 企业需掌握尧级次浮点运算能力处理数据 [3] - 高质量多场景视觉训练数据稀缺 Figure AI联合创始人强调大规模获取家庭场景超高清视频是获胜关键 [3] 特斯拉数据采集策略 - 特斯拉Optimus通过人类演示视频自主执行任务 从第一视角转向第三人称视角 实现数据驱动自主学习 [4] - 2025年8月预训练彻底去人工化 通过录制工厂工人执行任务视频获取数据 降低训练成本并学习复杂操作逻辑 [4] - Skild AI构建机器人基础模型 使用互联网人类动作视频作为核心训练数据 印证现实场景数据通用性价值 [4] 巨头竞争格局 - Meta在眼镜产品嵌入2个超高清摄像头 捕捉手部动作现实数据 预计2年内设备保有量达2000万台 [5][6] - 用户脸部成为数据战场 全栈式布局为抢占下一代计算平台奠定基础 视觉数据收集是核心环节 [6] - 布鲁克菲尔德开放超过100万套住宅单元 5亿平方英尺商业办公空间和1.6亿平方英尺物流仓储空间用于数据收集 [6] - 场景多样性提供多维度训练素材 帮助机器人学习在人类为中心场景中移动感知与行动 形成数据收集-模型训练-场景落地闭环 [7] 投资关注方向 - 特斯拉被列为核心关注标的 获增持评级和目标股价410美元 AI机器人技术突破与数据积累支撑长期估值 [8] - 行业面临传统车企 中国车企及科技巨头竞争加剧 特斯拉多工厂投产与技术迭代执行风险等挑战 [8]
光子之争:AI机器人视觉数据成核心战场,特斯拉与Meta竞逐现实捕捉赛道
智通财经· 2025-09-24 12:58
视觉数据在AI机器人领域的核心地位 - 视觉-语言-动作模型是AI机器人实现自主交互的核心 训练这类模型需要现实捕捉数据 现实捕捉数据成为全球科技与制造巨头争夺焦点[1] - 视觉数据是AI机器人的燃料 企业需要掌握尧级次浮点运算数据处理能力才能释放其价值 高质量多场景视觉训练数据稀缺[2] - AI机器人竞争从算法迭代下沉至数据争夺 视觉数据获取能力直接决定企业行业地位[8] 特斯拉的纯视觉训练策略 - 特斯拉Optimus机器人通过人类演示视频自主执行任务 从第一视角转向随机部署摄像头捕捉的第三人称视角 实现从人工操控辅助向数据驱动自主学习的关键跨越[3] - Optimus预训练彻底去人工化 不再依赖动作捕捉服与VR远程操控 转而录制工厂工人执行任务视频获取训练数据 降低训练成本并学习真实工业场景复杂操作逻辑[3] - 特斯拉被列为核心关注标的 获得增持评级 目标股价410美元 AI机器人技术突破与数据积累是支撑长期估值关键变量[7] 科技巨头在视觉数据领域的布局 - Meta在眼镜产品中嵌入2个超高清摄像头 重点捕捉用户手部动作现实数据 包括弹钢琴织毛衣倒咖啡倒垃圾等日常动作[5] - Meta眼镜设备保有量未来2年内或达2000万台 接近当前全球特斯拉汽车数量的2倍 用户脸部成为数据争夺战场[5] - Meta全栈式布局包括自主研发硬件AI操作系统内容生态 为抢占下一代计算平台奠定基础 视觉数据收集是核心环节[5] 不动产资源在数据收集中的应用 - 布鲁克菲尔德与Figure AI合作 开放超过100万套住宅单元5亿平方英尺商业办公空间1.6亿平方英尺物流仓储空间用于AI机器人训练数据收集[6] - 合作核心价值在于场景多样性 住宅办公物流等不同场景提供多维度训练素材 帮助机器人学习在以人类为中心场景中移动感知与行动[6] - 计划探索在不动产中部署人形机器人的长期商业化机会 形成数据收集模型训练场景落地闭环[6] 行业竞争格局与发展趋势 - 传统车企中国车企及科技巨头在AI机器人领域竞争加剧[7] - 特斯拉多工厂投产与技术迭代存在执行风险 FSD搭载率用户平均收入不及预期可能影响Dojo超级计算机赋能服务业务的价值认可[7] - 光子之争将愈发激烈 能平衡数据收集效率用户隐私与商业化落地的企业有望脱颖而出 重塑全球AI机器人产业格局[8]
大摩:视觉数据决定AI未来,特斯拉(TSLA.US)站上“光子竞赛”前沿
智通财经· 2025-09-24 09:55
(原标题:大摩:视觉数据决定AI未来,特斯拉(TSLA.US)站上"光子竞赛"前沿) 智通财经APP获悉,摩根士丹利在最新研报指出,随着多家企业将资源和注意力转向物理/具身AI与机器人技术,一场针对现实世界视觉数据 的"光子竞赛"正在悄然爆发。在这一背景下,该行给予特斯拉"增持"评级,目标价410美元。 特斯拉、Meta和Figure AI等公司正通过不同路径积极布局视觉数据的收集与利用。该行强调:"你可以拥有世界上所有的计算资源,但若没有视觉 数据,就无法训练视觉-语言-行动模型(VLA)。"大摩指出,视觉数据已成为AI训练中最稀缺、最具战略价值的资源。 大摩通过一个生动的比喻阐明视觉数据的价值:一条600磅的蓝鳍金枪鱼在远离海岸的地方游弋,若没有渔船和渔具,其价值为零;但若具备捕捞 能力,其价值可能高达310万美元。同理,世界的视觉数据若无法被捕获和处理,其价值也为零;但若能大规模收集并处理海量数据,则其价值将 不可估量。 特斯拉:转向"纯视觉"训练 2025年5月,特斯拉前Optimus负责人发布了一系列视频,展示Optimus通过人类视频学习自主完成任务。这些视频以第一人称视角(摄像头位于演 示者身上 ...
大摩:特斯拉、Meta与Figure--一场“光子争夺战”正在上演
美股IPO· 2025-09-23 12:26
人工智能机器人领域正在经历一场前所未有的"光子争夺战",各大科技巨头正在疯狂收集现实世界的视觉数据来训练AI机器人。 摩根士丹利在最新研报中表示,随着AI机器人和具身人工智能的发展,特斯拉、Meta和Figure AI等大规模收集视觉数据来训练视觉语言行动 (VLA)模型。 具体来看,特斯拉转向"纯视觉"训练方法,Meta通过智能眼镜收集日常活动数据,而Brookfield与Figure AI合作在庞大的房地产组合中部署数据 收集。 这一趋势对投资者意味着,视觉数据成为AI训练的新"金矿",拥有数据收集能力的公司将在AI机器人竞赛中占据优势地位。 摩根士丹利用"肥金枪鱼"比喻来解释视觉数据的价值:2019年一条612磅的蓝鳍金枪鱼在东京拍卖会上售价310万美元,但如果没有捕捞工具, 这条鱼的价值为零。同样,如果没有处理能力(yottaflops级算力,1 yottaflop = 1万亿teraflops),世界的视觉数据价值也为零。但一旦具备了 收集和处理能力,这些数据就变得极其珍贵。 摩根士丹利表示,视觉数据成为AI训练的新"金矿",拥有数据收集能力的公司将在AI机器人竞赛中占据优势地位。目前特斯拉转向"纯 ...