端到端
搜索文档
元戎启行获国内头部Tier 1战略投资......
自动驾驶之心· 2025-12-20 02:16
以下文章来源于红色星际 ,作者红色星际科技 红色星际 . 让更多人,更深入地了解自动驾驶行业! 来源 | 红色星际 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 据悉,元戎获得了国内头部Tier 1和海外豪华车企的战略投资。这笔交易的背后是带有产业资源的产投资本在重金下注优质城市NOA供应商。 所以,基石客户是26年衡量一家智驾公司实力的重要指标。 26年智驾市场又会发生什么变化呢?最大的变化可能是城市NOA超越高速NOA成为市场最主流的方案。 26年,城市NOA将会迎来最大一波放量,放量主要是两条线。一条线是下沉,26年城市NOA的硬件成本将会下降到几千元的水平,这个成本就能下沉 到十多万的车型上;另外一条线是油车上智驾,传统车企在油车智驾上全面向电车对齐,这将会给智驾带来近千万辆的增量,所以也会带来城市NOA 一波放量。 另外,不仅是产投在追逐元戎,国内芯片公司地平线和黑芝麻也找到元戎,寻求和元戎在芯片上进行合作。 目前,元戎启行已交付20万辆搭载城市NOA(领 ...
寻找散落在世界各地的自动驾驶热爱者(产品/4D标注/世界模型等)
自动驾驶之心· 2025-11-06 00:04
公司业务拓展 - 公司收到来自业内企业和个人的多样化需求 包括企业技术培训 发布会方案解读 行业总结以及求职辅导等 [2] - 为满足市场需求 公司正面向全球招募自动驾驶领域从业者 计划在技术服务 培训 课程开发与科研辅导等多个领域展开合作 [4] - 合作将提供高额酬金与丰富行业资源 主要面向B端企业 高校 研究院所以及C端学生和求职人群 [5][6] 合作方向与岗位 - 合作技术方向涵盖自动驾驶产品经理 4D标注/数据闭环 世界模型 VLA 自动驾驶大模型 强化学习 端到端等多个前沿领域 [5] - 岗位职责主要包括自动驾驶培训合作 课程开发以及原创文章创作 [6]
某头部车企的自研大考......
自动驾驶之心· 2025-09-26 16:03
公司智驾研发进展与目标 - 某头部车企智驾自研团队面临重要时限目标,内部计划于9月30日研发出无图城区NOA,并于12月30日研发出端到端技术 [6] - 此次研发时限被视为对智能化总负责人及算法负责人的关键考核,其结果将直接影响其职业前途 [7] - 公司当前量产的高速NOA仍高度依赖高精地图,其无图城区NOA与端到端技术的研发进度已落后于新势力及头部智驾公司至少一年以上 [8] 公司资源投入与人才策略 - 公司在智驾研发上投入巨大,资金规模已超过部分新势力,公司管理层将智驾视为未来战略核心,在研发投入上非常慷慨 [9] - 为吸引技术人才,公司提供业界最高档水平的薪资待遇,总包薪酬以更多现金形式发放,避免了因股价波动导致员工总包缩水,实际到手收入有保障 [9] 公司研发挑战与管理问题 - 公司从某新势力挖角团队进行端到端研发,但进展未达预期,核心问题在于数据基础薄弱,而数据驱动是端到端技术的核心 [10] - 传统车企在智驾自研上普遍存在管理问题,负责人多具传统领域背景,对算法认知停留在传统IT编程层面,管理方式上倾向于考核代码量而非算法思路 [13] - 尽管投入巨大,但因管理水平是核心制约因素,传统车企的技术产出往往不如新势力 [14] 行业趋势与公司未来计划 - 公司计划于明年大规模普及高阶智驾城区NOA至十几万价位的车型,届时将根据自研团队今年端到端技术的研发成果决定采用自研方案或继续使用供应商方案 [15] - 明年预计成为端到端技术普及的关键年份,新势力及头部智驾公司的一段式技术性能体验已接近满足C端用户愉悦点的临界值,用户对高阶智驾的认同将进入拐点 [15] - 行业竞争焦点从技术概念拉齐转向用户体验,智驾功能必须达到“好用”的标准,性能不佳若遭用户吐槽将带来更大代价 [16]
VLA:有人喊“最强解法”,有人说“跑不动”
36氪· 2025-09-11 08:17
智能驾驶技术路径分化 - 智能驾驶行业出现VLA(视觉-语言-动作)与反VLA两大阵营分化 理想、小鹏、元戎启行支持VLA路线 华为、Momenta、博世、卓驭持反对立场 [1][27][43] - VLA技术通过引入语言桥梁实现隐式逻辑推理 旨在突破端到端模型90%性能瓶颈 提升系统认知与决策能力 [12][14][16] - 行业技术竞争焦点从纯技术路径转向资源分配策略与技术价值观博弈 [4][40][47] 端到端技术局限性 - 端到端模型存在两大缺陷:决策逻辑不透明(黑箱问题)及未见过场景处理能力缺失 [8][9] - 该模型可解决90%智驾难题 但剩余10%涉及安全的关键场景需依赖规则兜底 [10][11] - 当前行业共识认为端到端需结合规则代码保障基础交通规则遵守 [10] VLA技术优势与挑战 - VLA具备三维动态信息理解能力 如潮汐车道标识、交警手势 支持语音交互与风险预判 [19][20][21] - 技术落地面临三大挑战:多模态特征对齐困难、训练数据获取复杂度高、现有智驾芯片算力不足 [31][32] - VLA需7B-10B参数规模理想部署 但当前芯片带宽限制导致决策频率难以稳定维持10Hz [31] 阵营资源投入差异 - VLA路线需数十亿级资金投入 小鹏宣称仅投入数亿只能实现"微型VLA" [28][29] - 小鹏通过自研图灵芯片提供750TOPS算力 构建72B参数基座大模型支撑VLA [41] - 理想早期布局端到端+VLM融合 元戎启行聚焦英伟达Thor芯片应用 三方均具备人形机器人研发协同优势 [41][42] 替代技术路径发展 - 华为推出WEWA世界模型架构 通过端云结合降低时延 主张该路径为智驾终局解决方案 [36][37] - 地平线基于征程6P计算平台打造软硬一体方案 博世强化一段式端到端工程化量产能力 [43][45] - Momenta采用数据飞轮模式开发R6强化学习模型 强调商业可扩展性与成本控制 [46] 行业监管与发展阶段 - 监管政策禁止"自动驾驶"宣传用语 要求OTA升级需备案 智驾安全被提至绝对优先 [39] - L3政策未放开导致行业处于L2+功能优化阶段 用户感知的"利己效益"不明显 [39] - "车位到车位"功能落地后行业进入瓶颈期 技术突破需百倍级安全提升方能支撑L4落地 [35][38]
VLA之外,具身+VA工作汇总
具身智能之心· 2025-07-14 02:21
具身智能领域研究进展 2025年核心研究方向 - 扩散策略优化:多篇研究聚焦扩散策略在机器人操作中的应用,包括Latent Space强化学习[2]、流轨迹简化处理[2]、推理时模态组合[2]以及接触式操作的慢快策略学习[2] - 多模态融合:涉及视觉-触觉策略[3][5]、雷达-相机融合抓取[3]、跨模态表示学习[7][9]以及视觉-语言模型课程设计[3] - 通用化策略开发:包括跨机械臂适配的抓取策略[3]、零样本仿真到现实迁移[3][6]、物体中心表示法[7]以及大规模仿真训练[3][6] 技术方法创新 - 模仿学习革新:提出无机器人的人类视频训练[4]、单次演示学习[2][5]、演示数据生成[3]以及去噪加速策略[5][8] - 世界模型构建:Robotic World Model强调神经模拟器优化[2],LaDi-WM利用潜在扩散进行预测操作[7],Unified World Models耦合视频与动作扩散[6] - 高效策略架构:包括混合专家去噪器[6]、一致性蒸馏[8][9]、稀疏可重用策略[8]以及十亿参数级Transformer扩展[11] 应用场景突破 - 灵巧操作:涵盖双手协调策略[2][5]、非抓取式操作[5]、透明物体抓取[3]以及不规则物体追踪[4] - 跨领域迁移:研究分割掩码跨载体迁移[4]、人类视频到机器人动作转换[3][5]以及跨形态技能表示[6] - 实时控制优化:开发高频重规划策略[3]、事件相机驱动跑酷[5]以及流匹配快速策略[6][7] 数据集与训练范式 - 超大规模训练:Dex1B项目使用10亿演示数据训练灵巧操作[9],DataMIL研究数据选择对模仿学习影响[6] - 仿真-现实协同:Sim-and-Real联合训练方法在平面推动[5]和操作策略[5][6]中验证有效性 - 新兴训练技术:包括无数据模仿学习[5]、强化与模仿学习交错[5]以及人类视频预训练[7][11]