物理AI成为核心竞争范式与中美双极格局 - 物理AI是连接虚拟与现实、驱动下一代产业革命的核心驱动力,正成为衡量全球科技企业核心竞争力的新标尺[2][4] - 自动驾驶作为AI与物理世界交互的核心战场,已形成由特斯拉和小鹏汽车共同引领的“中美双极”竞争格局[2][4] - 特斯拉定位为“现实世界AI公司”,小鹏汽车则完成了物理AI全栈自研体系的构建,成为全球唯一实现该突破的企业[4] 行业技术路线共识与核心优势 - 行业技术路线高度收敛,特斯拉与小鹏均采用“纯视觉 + 端到端 + 大模型”路径,跳过争议性L3阶段,直接用L4架构迭代L2产品[2][4] - 该技术路线通过摄像头感知并直接生成驾驶指令,无需语言转译,降低了硬件成本并依靠海量数据优化泛化能力[5][6] - 小鹏汽车的核心优势始于中国复杂的道路场景,混合交通流、不规则路口等构成全球最丰富的“AI训练场”[8][17] - 小鹏汽车构建了从自研AI芯片到VLA大模型的“芯片—算子—模型”全栈自研体系,形成了核心壁垒[8] 小鹏第二代VLA模型的技术突破 - 小鹏第二代VLA是“首个量产物理世界大模型”,创新性地去掉了“语言转译”环节,实现从视觉信号到动作指令的端到端直接生成[8][10] - 该模型让自动驾驶反应速度与决策精度大幅提升,从技术底层验证了L2直通L4的可行性[8] - 车端第二代VLA参数达数十亿级,较行业普遍仅千万级的规模提升约10倍[8] - 模型训练数据量达1亿 clips,相当于人类司机连续驾驶6.5万年的极限场景总和,覆盖大量中国长尾场景[17] 中美技术路径相互验证与性能对比 - 特斯拉FSD V14相较V12实现“代际跨越”,车道保持、复杂路口决策等表现全面提升,验证了大模型驱动路径的正确性[10][11] - 基于中国复杂路况训练的小鹏第二代VLA在更具挑战性的场景中展现出差异化优势,例如在应对紧贴切入的电动车时策略更流畅[11] - 在高速场景变道等情况下,小鹏第二代VLA表现更适应中国路况,而FSD V14的策略更偏保守或“更美国”[11] - 两家企业的实践共同证明,L3阶段因责任划分模糊将被“人负责的L2”和“车负责的L4”所取代[13] 商业化落地路径与规模优势 - 小鹏汽车具备L4级能力的第二代VLA平台,预计将于2026年第一季度实现量产落地,推出软硬件均达L4水平的量产车型[14] - 相较于Waymo等依赖高精地图的传统路线,“纯视觉+端到端”路线能摆脱地图束缚,通过量产车型摊薄研发成本,具备更强商业潜力[14] - 小鹏实现Robotaxi与第二代VLA同源研发,共享硬件与能力,硬件成本较传统方案降低超过40%,破解了商业化不可能三角[18] - 公司计划于2026年量产L4级车型与Robotaxi,标志着商业化浪潮的开启[3][20] 中国场景的数据与迭代效率优势 - 中国复杂的本地化道路场景已成为锤炼AI能力的战略资源,直接转化为数据优势[17] - 小鹏汽车依托3万卡云端算力集群,运行效率超过90%,可支撑720亿参数基座模型每五天完成一次全链路迭代[8][18] - 庞大的车辆保有量形成了“数据采集—模型训练—实车验证—数据回流”的快速研发闭环,迭代效率相较海外企业具有显著优势[18] - 公司对技术迭代速度充满信心,并与北美团队立下赌约,目标在2026年8月30日前使VLA 2.0达到FSD V14在硅谷的水平[16]
L3只是过渡?小鹏Robotaxi与L4同源,中国车企弯道超车倒计时