自动驾驶

搜索文档
万马科技:全资子公司上海优咔与英伟达在自动驾驶数据闭环平台中的应用正开展合作
每日经济新闻· 2025-09-04 04:26
公司与英伟达合作情况 - 公司全资子公司上海优咔与英伟达在自动驾驶数据闭环平台中开展合作 [2] - 合作内容为赋能车企智能驾驶数据闭环工具链 涵盖数据采集至仿真的全链路性能挖掘和技术迭代 [2] - 公司建议投资者通过公司公告及公众号等平台继续关注相关业务合作进展 [2] 合作业务范围 - 合作聚焦于自动驾驶数据闭环平台的应用开发 [2] - 工具链覆盖数据采集 数据处理 数据标注 数据训练及数据仿真全链路环节 [2]
百度集团-SW(09888.HK)季报点评:百度核心广告业务承压 萝卜快跑领跑ROBOTAXI行业
格隆汇· 2025-09-04 03:57
财务业绩表现 - 25Q2实现营业收入327.13亿元 同比下降3.59% 环比增长0.80% [1] - 25Q2实现归母净利润73.22亿元 同比增长33.42% [1] - 25Q2实现NON-GAAP净利润47.95亿元 同比下降35% [1] - 百度核心实现收入262.51亿元 同比下降2% [1] - 百度核心实现NON-GAAP净利润47.92亿元 同比下降34% [1] - 25H1回购金额达6.77亿美元 2023年股份回购计划累计回购23亿美元 [1] 在线营销业务 - 25Q2百度核心在线营销业务收入162亿元 同比下降15% [2] - 百度APP MAU同比增长5%至7.35亿 [2] - 超过50%移动搜索结果页面包含AI生成内容 高于4月的35% [2] - 7月64%移动搜索结果页面包含AI生成内容 [2] - AI搜索逐步取代基于传统链接的结果 [2] AI搜索商业化进展 - 正逐步探索AI搜索商业化 开发更灵活原生的广告格式 [2] - AI搜索可覆盖传统搜索难以变现的长尾查询和非商业场景 [2] - 长期有望提升变现效率 短期对收入和利润率造成压力 [2] 智能云业务 - 百度核心非在线营销业务收入100亿元 同比增长34% [3] - 增长主要受云智能业务带动 [3] - MaaS平台千帆扩展模型库 新增开源文心4.5系列模型 [3] - 整合更多AI工具及功能支持AI原生应用开发 [3] - 6月开源文心4.5系列基础模型 包含十个不同架构及大小的模型 [3] 自动驾驶业务 - 25Q2萝卜快跑接单量220万单 同比增长148% [4] - 较25Q1的75%增速继续加速 [4] - UE优化预期下加速推进 投放更多车辆和开拓新区域 [4] - 截至6月全球足迹覆盖16个城市 [4] - 7月与优步建立战略合作 计划部署数千辆自动驾驶汽车 [4] - 8月与Lyft建立战略合作 将在欧洲部署数千辆自动驾驶汽车 [4] 业绩展望 - 预计2025-2027年实现营收1233.8/1345.0/1451.1亿元 [4] - 预计经调整归母净利润188.75/211.87/236.10亿元 [4] - 对应PE分别为11.7/10.4/9.3倍 [4]
既是接驳车又是“课堂”,北京亦庄自动驾驶小巴再添应用场景
新京报· 2025-09-04 02:37
应用场景拓展 - 自动驾驶小巴在北京亦庄新增通勤接驳、重大活动保障、党校移动课堂、定制出行四大应用创新场景[1] - 此前已落地工业科技旅游、文旅创新零售、中小学研学实践、健康生活体验四大应用场景[1] - 累计形成八大应用场景体系[1] 运营数据表现 - 自动驾驶通勤接驳服务开通6条线路[1] - 累计运行超过400班次[1] - 总行驶里程突破5000公里[1] - 重大活动场景累计接待体验者超1000人[1] 服务模式创新 - 党校移动课堂场景规划2条专线和2门课程[1] - 单程课程时长约40分钟[1] - 市民可通过"智行小巴"小程序查询站点路线并预约行程[1] - 采用"4高配+4标配"车辆配置策略[1] 商业化进展 - 在工业科技旅游和重大活动场景已初步验证商业模式可行性[1] - 下一步将完善信息化系统搭建[1] - 计划实现全流程数字化管理[1]
理想郎咸朋分享对VLA里语言部分的作用
理想TOP2· 2025-09-04 02:32
文章核心观点 - 语言能力是自动驾驶系统认知理解与决策规划的核心 语言在VLA架构中承担对视觉感知内容的认知理解并形成行动规划和决策 而非仅作为交互界面的文字输出或语音输入[1][2] - VLA架构在L3/L4高阶自动驾驶阶段将展现显著优势 当前辅助驾驶任务简单时与其他方案差异不明显 但在复杂AGI任务中预计将获得碾压性胜利[2] 技术架构解析 - VLA架构由三部分组成 V代表视觉感知 L代表语言能力 A代表动作执行 其中L核心功能是通过人类语言数据学习进行隐式逻辑推理[2] - 语言能力本质是认知框架 语言塑造和限制人类对世界的认知、理解与表达能力 不同语言体系形成差异化认知框架 这是人类与动物的关键区别[1] 技术实现路径 - L语言部分不依赖显式文字推理 而是通过语言数据学习实现隐式逻辑推理 背后核心是长思维链推理过程 文字输出与语音输入仅为可选交互方式[2] - 自动驾驶系统类比人类认知优势 人类视觉不如鹰 行动速度不如猎豹 但凭借语言衍生的认知理解能力成为地球主导物种[2]
对话特斯拉前工程师:独家解读特斯拉宏伟蓝图第四篇章,万字蓝图的真正野心是什么?
36氪· 2025-09-04 02:15
公司战略转型 - 特斯拉发布宏伟蓝图第四篇章 撕掉电动汽车制造商标签 转向AI与物理世界深度融合的可持续富足愿景 [1][4] - 战略从可持续能源转向可持续富足 提出五大指导原则:无限增长 创新消除限制 技术解决实际问题 自动化惠及全人类 普及推动增长 [8] - 投资特斯拉变为押注AI+能源+机器人集成生态系统 公司约80%未来价值将来自人形机器人Optimus [9][10] 技术布局与规划 - 人形机器人Optimus计划2025年底推出第三版原型机 2026年启动量产 五年产能目标达年产100万台 [10][12] - 自动驾驶Robotaxi已在得州奥斯汀启动服务 计划2025年底前扩展至湾区及其他州 目标车辆使用效率提升5-10倍 [13] - 特斯拉通过垂直整合能力保持优势 掌握从芯片设计 神经网络训练到电池系统和大规模制造的全产业链 [12] 市场前景与竞争 - 全球人形机器人市场规模到2050年预计达5万亿美元 远超当前全球汽车市场的3万亿美元体量 [10] - 中国竞品萝卜快跑已于2024年7月进入武汉试运营 而特斯拉Cybercab最快2026年才能量产 存在两年时间差 [18] - 太阳能屋顶业务推广十年收入占比仍不足5% 部分历史目标如电动半挂卡车和无人驾驶出租车服务尚未完全实现 [16][20]
中智行被认定破产,王劲自动驾驶创业落幕
36氪· 2025-09-04 01:20
公司破产清算 - 中智行被法院核准开启破产清算程序 法院调查发现公司无财产可供执行且失联[1][6][10] - 公司涉及近10件合同纠纷案件 总金额接近2500万元 最小单笔欠款仅15000元工资[8][9] - 各地分公司已陆续解散注销 包括香港、福州、深圳和北京分公司[12] 创始人背景 - 创始人王劲为百度自动驾驶事业部首任总经理 2015年提出"三年量产 五年商用"目标[2][35] - 王劲曾带领Google中国工程师成建制加入百度 通过改进广告系统使中国区搜索收入增加四倍[29][31] - 2017年离职百度后先后创办景驰科技和中智行 但两次创业均未成功[4][43] 技术路线选择 - 2019年正式确定车路协同技术路线 认为单车智能是死胡同[15][17] - 2022年发布L4方案"轻车熟路" 车端仅需50TOPS算力且无激光雷达 路端每公里建设成本约35万元[19][21][22] - 车路协同需改造整个交通体系 实际推进难度比单车智能高5-10倍[26] 商业化挑战 - 车路协同需要政府强力推动和基础设施改造 涉及5G网络部署、专用频段和设备升级等复杂问题[17][24] - 仅苏州一地道路改造就需要35亿元投入 且跨城市需重复建设[22][26] - 公司缺乏造血能力且无后续融资 最终未能走出测试验证阶段[28] 行业竞争格局 - 百度自动驾驶事业部成为"AI黄埔军校" 分出小马智行、文远知行等头部公司[37][39] - 景驰科技创始团队分化后成立文远知行 最终成为Robotaxi第一股[4] - 2018-2019年单车智能遇寒冬 车路协同开始受到关注[17]
知行科技(01274.HK):研发取得较快进展 积极拓展具身智能业务
格隆汇· 2025-09-03 18:47
核心财务表现 - 2025年上半年公司实现营收3.66亿元 同比下滑42.47% [1] - 归母净利润为-1.78亿元 去年同期为9861万元 [1] - 毛利率为4.7% 同比下滑2.4个百分点 [1] - 销售费用率2.9% 同比提升1.0个百分点 [1] - 管理费用率8.6% 同比提升4.9个百分点 [1] - 研发费用率42.8% 同比大幅提升27.1个百分点 [1] 产品研发进展 - 全栈自研iDC500组合辅助域驾驶控制器正式量产 [1] - 搭载地平线征程6系列的域控制器有望下半年在多个中国头部汽车集团主力车型实现量产 [1] 战略业务布局 - 设立艾摩星机器人公司 聚焦具身智能技术研发与商业化落地 [1] - 与"小工匠"签署股权转让框架协议 快速布局具身智能关键零部件领域 [1] 业绩展望 - 预计2025-2027年归母净利润分别为-1.58亿元/0.63亿元/1.63亿元 [1] - 对应2026年PE为47.59倍 2027年PE为18.52倍 [1]
海外Robotaxi支付意愿或较强,国内关注To-B RoboX放量 | 投研报告
中国能源网· 2025-09-03 07:08
投资分析意见:建议关注受益海外Robotaxi高支付意愿/国内To-B解决方案加速落地的代 表公司,如:文远知行、小马智行、地平线机器人、黑芝麻智能、经纬恒润、德赛西威等; Robotaxi在高购买力市场支付意愿或强于网约车/出租车:Waymo在北美较之uber/lyft有 较高溢价;且较之网约车/出租车更看重价格与时效的特点,Waymo用户核心关注车的安全 性(系统安全+人身安全,例如规避人类司机),价格敏感度较低;国内市场目前可能还是 传统出租车/网约车平替的定位,而在中东、欧洲、北美等高购买力市场Robotaxi可能是高端 需求(专车级别);引申到UE模型的差别可能是海外市场盈利空间可能更大;国内则需要 关注Robotaxi在去补贴情况下的支付意愿; 技术进步端:Robotaxi的技术路线跟乘用车有收敛趋势,Waymo同样在基于Gemini做 VLA/世界模型;不过从终端的MPI数据来看,以FSDV13为代表的乘用车智驾最 高水平与Waymo等比起来还有数量级的差距;需要重点关注特斯拉的9月之后V14版本 的体验与去安全员/面向公众开放后的Robotaxi运营表现; 国内To-B解决方案或许是变化更快的 ...
锦秋基金被投地瓜机器人:从VGGT到数据闭环,具身智能的突破与探索
锦秋集· 2025-09-03 04:30
文章核心观点 - 人工智能正经历从自动驾驶向具身智能的范式转变 机器人行业处于早期发展阶段 硬件形态和算法框架尚未统一 但技术迁移和VGGT等新模型带来突破机遇[5][6][7] - 地瓜机器人作为行业代表 承接自动驾驶技术经验 横跨机器人1 0到3 0代际 通过差异化路径探索通用人形机器人的未来[6][18][19] - VGGT模型可能改变未来十年3D视觉技术架构 其视觉几何基础能力可提升机器人定位 避障和操作任务的泛化性 并降低硬件成本[51][62][64] 从自动驾驶到机器人:技术迁移与挑战 - 自动驾驶技术栈已进入工程收敛期 端到端成为主流 后续更多是工程优化 而机器人处于早期未解之地 硬件形态和算法框架尚未统一 数据规模远小于汽车行业[5][8][10] - 机器人硬件缺乏统一标准 存在轮式 双足 双臂 灵巧手等多种形态 自由度从7到20+不等 导致无法形成大规模保有量和数据积累[10][14] - 算法尚未完全收敛 VLA模型不一定是未来技术框架 模型和数据都未达到ready状态 具身智能需要通用性 当前工厂封闭环境下的搬运等应用不算真正具身[11][12][13] - 自动驾驶经验正迁移至机器人 包括芯片 视觉 标注与数据闭环能力 但最大挑战是硬件不确定性导致难以积累数据和快速迭代算法[14][17][21] 自动驾驶算法的演进:从BEV到Transformer - 2019年前自动驾驶采用模块化方法 图像感知用AI完成 后续跟踪 预测 决策等几乎都是规则化方式 适应能力不强 工程难度大[25][26] - 2019年后BEV发展 通过传感器数据特征融合直接输出3D空间目标 减少后处理环节 使系统更加端到端 Transformer在其中发挥特征融合作用 实现空间转换和时序融合[26][27] - Transformer适合跨传感器融合 可将自车位姿 GPS IMU 激光雷达等数据token化后与图像特征融合 简化系统并避免信息损失[27][28] - 4D标注系统(3D加时序)帮助生成训练数据提升BEV模型 数据闭环通过双系统设计快速回传bad case 高效提升模型性能[29][30] 机器人落地的现实困境与技术路径选择 - 当前VLA主要处于"秀肌肉"的验证阶段 离真正落地还有距离 需要稳定性 成功率和成本控制 封闭场景仍多用规则算法[33][34][35] - 务实路线是端到端模型提proposal后用规则化方法选最优方案 模型方法上限高但下限低 需规则兜底 类似自动驾驶发展路径[35][48] - 现阶段的1 0和2 0机器人承接不住自动驾驶算法 因缺乏舒适性要求(如割草机 扫地机) 唯一需要模型协助的是脱困等特殊场景[36][37][38] - 特斯拉是人形机器人方向旗手 其纯视觉方案体验最好 得益于数据闭环和模型积累 关键看如何搭建数据闭环并提升出货量规模[39][40][42] VGGT模型的技术突破与行业影响 - VGGT是视觉几何基础模型 基于Transformer架构 用大数据和大模型方法解决传统3D几何问题 可能改变未来十年3D视觉技术架构[51][56][67] - 在公开数据集上表现接近或超过传统方法最佳水平(如COLMAP) 重建精度高 其backbone具备空间感知能力 可提升下游任务泛化性[62][69][82] - 使纯视觉方案有望替代深度相机 普通RGB相机价格仅十几到几十元 深度相机则需几百到几千元 可显著降低机器人BOM成本[64][65] - 目前处于早期预研阶段 未形成共识 训练用了17个公开数据集 数据量估计百万到千万级 模型大小1 2B 算力需求可控[72][73][74] - 最先受益的是封闭空间机器人 如工业搬运或自动驾驶地库场景 因主要依赖视觉定位和避障 无GPS[75] - 主要不足是尺度问题和时序问题 需要多传感器融合提供尺度信息 且需改造为时序化SLAM方案以适应实时需求[81] 行业生态与人才培养 - 地瓜机器人与全国200多所高校合作 甚至延伸至中学 通过开发者套件和可视化编程培养年轻开发者 12岁初中生已能开发机器人[93][95][96] - 生态建设是长期战略 类似英伟达培养开发者习惯 从学校阶段开始使用工具 未来进入公司会倾向继续使用相关开发工具和芯片[97] - 在具身智能方向主要竞争对手是英伟达 已推出RDK S100和S600产品 其中RDK S100已上市 凭借智能驾驶技术积累快速响应需求[98]
自动驾驶论文速递 | DriveQA、闭环仿真、AIGC、世界模型等~
自动驾驶之心· 2025-09-03 03:19
分享下最近自动驾驶领域的相关工作! DriveQA 基于多模态大语言模型的交通规则理解与评测 波士顿大学与圣路易斯华盛顿大学团队ICCV25中稿的论文,本文提出了DriveQA数据集,通过整合美国各 州驾驶手册文本与CARLA仿真环境中的视觉场景,构建了包含474K样本的驾驶规则问答基准,在表1中与 现有多模态数据集(如NuScenes-QA、DriveLM等)对比突显其全面覆盖交通规则的优势,并在表2-9中验 证了其对模型泛化与推理能力的提升效果。 主要贡献: 算法框架: 论文标题:DriveQA: Passing the Driving Knowledge Test 论文链接:https://arxiv.org/abs/2508.21824 项目主页:https://driveqaiccv.github.io/ 1. 提出 DriveQA 多模态驾驶知识基准 :构建了涵盖文本(DriveQA-T)与视觉 - 文本(DriveQA-V)的大 规模评估基准,其中 DriveQA-T 含 26K QA 对(源自美国 51 个地区驾驶手册,覆盖 19 个问题类别, 含答案解释),DriveQA-V 含 68K 图 ...