大小脑融合
搜索文档
人形机器人的落地难题,竟被一顿「九宫格」火锅解开?
机器人大讲堂· 2025-11-26 08:06
文章核心观点 - 当前具身智能/人形机器人在迈向大规模工业应用时面临核心瓶颈,即“大脑”(智能认知)与“小脑”(实时控制)分离的算力架构导致性能、成本与集成难题 [3][4] - 英特尔提出“大小脑融合”方案,通过集成CPU、GPU、NPU的单一SoC(酷睿Ultra处理器)统一智能与实时控制,旨在解决算力、功耗、延迟和开发复杂度问题,推动具身智能落地 [5][6] - 英特尔通过提供从硬件到软件的全栈解决方案(包括AI Edge Systems、Open Edge Software Toolkit、oneAPI、OpenVINO+IPEX-LLM、AI Suites),降低开发门槛,并坚持开放生态策略,以加速行业应用 [11][13][14][15] 行业现状与挑战 - 近期多款知名机器人演示出现故障,例如俄罗斯AI人形机器人“艾多尔”迅速摔倒,特斯拉Optimus被指反应迟缓,1X预售款演示被揭露依赖远程遥控,暴露出现实与演示的差距 [1][2][3] - 业内成熟的人形机器人多采用“大脑+小脑”架构:“大脑”负责LLM、VLM等世界建模和理解(慢系统),“小脑”负责3D定位导航、机械臂控制等实时任务,控制频率高达500Hz~1000Hz(快系统)[3] - 动作生成模型、多模态感知与大模型推理叠加,使算力需求呈几何级增长,现有芯片算力(如100~200 TOPS稀疏算力)仍感不足 [4] - 为满足双重需求,许多企业采用“拼凑”方案,例如用Intel酷睿跑“大脑”,NVIDIA Jetson Orin跑“小脑”,导致跨芯片通信延迟、系统协同复杂,是造成机器人精度、效率问题及端侧控制器性能瓶颈的原因之一 [4] - 算力平台不仅是技术挑战,更是经济挑战,制造业对机器人ROI(投资回报率)考核严苛,需权衡稳定性、安全性、成本、功耗等因素 [4] - 企业还希望机器人能灵活扩展或缩减,以适应产线变化,避免成为“一次性死资产”,而硬件堆叠的“两套班子”方案在开发成本、散热、功耗、价格、部署和可扩展性上难以满足要求 [4][5] 英特尔的核心解决方案:“大小脑融合” - 方案核心是使用一颗SoC(系统级芯片)将智能认知与实时控制统一到同一架构,即英特尔的酷睿Ultra处理器 [5] - 酷睿Ultra在单一封装内集成CPU、英特尔锐炫™ GPU和NPU,三者协同工作,兼顾AI推理、高性能计算与工业级实时控制 [6] - 该方案类比“九宫格火锅”,各计算单元(IP)可像菜品一样按需自由组合,满足机器人厂商的不同需求 [8] - 该设计使得原本需上云的大模型推理可直接在端侧运行,提升响应速度、隐私性和经济性 [8] - 酷睿Ultra在保持类似功耗下实现约100 TOPS的AI算力,用户通过升级CPU即可让原有产品获得AI能力,无需重构系统 [8] - **GPU部分**:内置GPU提供77 TOPS AI算力,专用于处理重型视觉与大模型任务,可支撑7B~13B级别VLM运行,胜任物体识别、路径规划等任务;需更强AI算力时可外接Intel Arc独显扩展 [8] - **NPU部分**:负责轻负载常驻AI任务(如语音唤醒、动态物体检测),保证低功耗和“零感延迟” [9] - **CPU部分**:凭借多年机器人运控积累和底层优化,CPU运行传统视觉算法、运动规划更快更稳,实时抖动小于20微秒,能处理平衡控制、复杂力控等对延迟极敏感的任务;CPU还加入专用AI加速指令,可分担部分原由GPU执行的AI推理与轨迹规划任务,使算力调度更灵活、能效更优 [9] - 未来规划:明年1月发布的Panther Lake(18A工艺)将进一步提升性能,图形性能最高提升50%,同等性能下功耗降低40%,AI加速力提升至180 TOPS,并支持扩展温度范围与工业级实时性,进一步推开具身智能应用边界 [9] 软件栈与生态支持 - 英特尔提供全栈软件套件,覆盖从机器人感知、学习、行动到系统调度、驱动、实时控制的完整链条,让开发者无需从零开始 [11] - **对硬件制造商(OXMs/ODMs/OEMs)**:提供整机级方案AI Edge Systems,打包操作系统、驱动、SDK、实时优化、BSP、EtherCAT驱动等,例如已打好Preempt-RT的BSP可让机器人快速具备“工业级心跳” [13] - **对系统软件厂商**:提供Open Edge Software Toolkit,包含AI库、工具及大量OSV级优化,确保在不同平台稳定榨取芯片算力 [13] - **关键软件工具1:oneAPI**:作为贯通CPU/GPU/NPU/FPGA的“算力高速路”,允许开发者写一次代码,系统自动调度和优化算力单元,打破算力“孤岛”,并支持通过接入Intel Arc扩展算力 [13] - **关键软件工具2:OpenVINO + IPEX-LLM组合**:OpenVINO负责AI推理加速,对TensorFlow、PyTorch等模型进行自动压缩、量化及格式转换,并自动决定推理执行单元与负载均衡;IPEX-LLM优化大模型本地运行速度;该组合能适配不同年代和规格的边缘设备,应对工业现场复杂环境 [14] - **对行业方案开发者(ISV/SI)**:提供现成的行业模板AI Suites,集成抓取、导航等常见技能,可一键接入LLM、VLM、VLA等大模型,并自带参考Demo,大幅缩短从“裸机”到“能干活的机器人”的开发周期 [14] 开放生态与合作进展 - 英特尔的技术路径强调开放与弹性:同一套代码可在CPU/GPU/NPU/FPGA及Intel与Arm平台间自由切换;兼容主流AI框架与模型,不锁定库或模型;全面支持ROS2与各类开源算法库 [15] - 企业可按需自由组合从底层算力、网络到软件栈、模型框架、应用框架的各个部分,无需推翻既有系统或被单一供应商锁定,可在现有IT/OT基础上演进 [15] - 合作进展:过去几个月,英特尔已与国内数十家具身智能厂商深入合作,其中十余家已进入验证或POC(概念验证)阶段 [15]
人形机器人的落地难题,竟被一顿「九宫格」火锅解开?
机器之心· 2025-11-24 07:27
行业现状与核心挑战 - 当前人形机器人在从演示走向实际工业应用过程中存在巨大鸿沟,大量机器人连稳定完成基本操作都困难,例如特斯拉Optimus反应迟缓、1X演示被揭露依赖远程遥控[7] - 行业普遍采用“大脑+小脑”架构,大脑负责LLM、VLM等复杂认知任务,小脑负责高频率(500Hz~1000Hz)的实时控制如步态控制和机械臂操作[9] - 算力需求呈几何级增长,现有芯片方案(100~200 TOPS稀疏算力)仍无法满足工业场景需求,导致企业被迫采用拼凑方案如Intel酷睿搭配NVIDIA Jetson Orin,造成跨芯片通信延迟和系统协同问题[10] - 算力平台不仅是技术瓶颈,更是经济性问题,制造业对ROI考核严苛,需综合考虑稳定性、安全性、成本、功耗等硬指标,以及部署灵活性和可扩展性等软指标[10][11] 英特尔解决方案:大小脑融合架构 - 公司推出“大小脑融合”方案,通过单颗酷睿Ultra处理器SoC将智能认知与实时控制统一到同一架构,集成CPU、GPU和NPU并实现三者协同[14] - 该方案在单一封装内提供约100 TOPS的AI算力,内置GPU拥有77 TOPS算力,可支持7B~13B级别VLM运行,NPU负责低功耗常驻任务,CPU则优化实时控制(抖动小于20微秒)[17][18][20][21] - 方案支持按需扩展,通过Intel Arc独显可将算力提升至千TOPS量级,并结合云脑或边缘大脑协同推理,明年将推出的Panther Lake进一步将AI算力提升至180 TOPS,图形性能最高提升50%,同等性能下功耗降低40%[19][22] 软件生态与部署支持 - 公司提供全栈软件套件,包括整机级方案AI Edge Systems(含操作系统、驱动、SDK等)、Open Edge Software Toolkit(AI库和OSV级优化)以及行业模板AI Suites,缩短开发周期[24][26][29] - 通过oneAPI实现CPU/GPU/NPU/FPGA算力自动调度与优化,OpenVINO与IPEX-LLM组合优化AI推理和本地大模型运行,支持不同年代和规格的边缘设备[27][28] - 技术路径开放弹性,支持代码在Intel与Arm平台间切换,兼容主流AI框架和ROS2等开源算法库,已有国内数十家具身智能厂商进入验证或POC阶段[31]
国产人形机器人,用的哪家处理器?
36氪· 2025-09-19 10:47
人形机器人市场增长与潜力 - 全球人形机器人市场规模预计从2025年90亿元增长至2029年1500亿元,复合年增长率超75% [2] - 工业搬运与医疗场景成为核心增长引擎,短期以试点补位为主,中期逐步规模化应用于制造与服务领域,长期有望普及至家庭场景 [5] 处理器技术架构与分工 - 人形机器人依赖"大脑-小脑-肢体"协同体系:大脑负责语音识别、环境感知等认知功能,小脑承担运动控制,肢体执行指令任务 [5] - 大脑功能主要由英伟达GPU承担(如环境感知、任务规划),小脑功能普遍采用英特尔CPU(如平衡维持、轨迹规划) [8] - 英特尔Core i5/i7作为标配电控芯片,满足基础控制与数据处理需求,i7在核心频率与线程数上优于i5 [8] 主流处理器供应商与产品应用 - 英伟达Jetson Orin系列提供最高275TOPS算力,性能为上一代芯片的8倍,支持生成式AI与边缘应用开发 [9] - Jetson Orin NX主打高性价比,提供100TOPS算力,适用于中高端机器人 [9] - 英伟达2025年8月发布Jetson AGX Thor开发者套件,起售价3499美元,提供2070 FP4 TFLOPS算力,为前代Jetson Orin的7.5倍 [9][10] - 特斯拉具备自研芯片能力(Dojo用于训练,FSD用于端侧运算),其他厂商多依赖外购英特尔或英伟达芯片 [6] - 优必选Walker X采用Intel i7-8665U(双路1.9GHz)与NVIDIA GT1030显卡(384核心) [6][7] - 宇树科技H1-2标配Intel Core i5/i7,可选配Nvidia Jetson Orin NX(最多三块) [6][7] 国产芯片研发进展与优势 - 瑞芯微RK3588/RK3588S芯片被智元、逐际动力等采用,集成四核Cortex-A76与四核Cortex-A55,NPU算力达6TOPS,支持8K编解码 [11] - 地平线地瓜机器人推出RDK S100开发套件,集成CPU+BPU+MCU架构,提供80TOPS或128TOPS算力,定价2799元,为英伟达同等方案一半价格 [12][14] - 黑芝麻智能与中科院合作提供"华山A2000"(大脑)与"武当C1236"(小脑)双芯片方案,A2000算力对标4颗英伟达OrinX [13] - 云天励飞开发DeepXBot系列芯片,加速感知与认知推理任务 [13] - 国产芯片优势包括高性价比与定制化服务,可针对工业、家庭、教育等场景调整功能 [14] 技术发展趋势:大小脑融合架构 - 当前大小脑分离架构存在算力需求激增、通信延迟、开发成本高、传感器融合困难等瓶颈 [16] - 大小脑融合通过单芯片或一体化设计实现感知-决策-执行无缝衔接,成为主流发展方向 [15][17] - 英伟达与英特尔宣布合作,未来可能推出融合X86与CUDA生态的SoC芯片 [17] 行业挑战与瓶颈 - 数据积累不足限制具身智能模型训练 [18] - 硬件架构需优化算力密度、功耗控制与散热性能 [19] - 高端芯片、伺服电机与传感器导致整机成本过高,难以普及消费级市场 [20] - 安全性需求包括运动安全与数据隐私保护 [20] - 系统架构非一致性、解决方案泛化能力不足与场景适配复杂性高需产业链协同创新 [20]