Workflow
自动驾驶
icon
搜索文档
从车库创业到冲刺港股,魔视智能3年亏超6.6亿元
21世纪经济报道· 2025-09-28 10:42
港股又迎来一家自动驾驶公司。 近日,魔视智能科技(上海)股份有限公司(下称"魔视智能")向港交所递交上市申请。经历8轮融资后,这家由上海交大博士 带领的智驾企业终于要开始冲刺资本市场了。 不过,虽然已交付逾330万套解决方案、用于92款车型。但激烈的市场竞争下,魔视智能过去3年累计亏损超6.6亿元,尚未实现 盈利。 (图片来源:公司官网) 上交大博士车库创业 魔视智能成立于2015年,是一家AI创新驱动的智能驾驶解决方案提供商,主要为主机厂及一级供货商提供具备L0-L4级智能驾驶 功能的一体化软硬件解决方案。 创始人虞正华有丰富的学界和产业界经验,魔视智能是其二次创业的产物。虞正华拥有上海交通大学模式识别博士学位,并曾 任博康智能副总裁、澳大利亚国家信息通信技术研究院(NICTA)高级研究员、新南威尔士大学博士生导师等职。 虞正华第一次创业是2008年,当时主要瞄准的是把AI应用到智能交通领域,诸如电子警察,交通事故监测这类项目,并最终在 2015年前后登陆了上交所主板。 那个时期,由于ImageNet上AlexNet的卓越表现,正在带动深度学习的兴起。彼时的虞正华也与同事做了个demo,验证深度学习 是否可 ...
清华教研团队!两个月从零搭建一套自己的自动驾驶VLA模型
自动驾驶之心· 2025-09-28 07:21
端到端之后,学术界和工业界聚焦的方向是什么?无疑是VLA。VLA提供了类人思考的能力,把车辆决策的过程通过思维链的形式展现出来,从而提供 更可靠更安全的自动驾驶能力。 自动驾驶VLA目前可以分为模块化VLA、一体化VLA和推理增强VLA三个子领域。 自动驾驶VLA涉及的核心内容包括视觉感知、大语言模型、Action建模、大模型部署、数据集制作等等。最前沿的算法包括CoT、MoE、RAG、强化学 习。通过学习VLA,可以让自己对自动驾驶的感知系统有更深刻的认知。 为此我们联合 清华大学的教研团队 开展了这门《自动驾驶VLA与大模型实战课程》!课程包含自动驾驶VLA三个子领域前沿算法的细致讲解,并会配 备两个实战及一个课程大作业深入理解自动驾驶VLA。 扫码报名!抢占早鸟名额 讲师介绍 咖喱,清华大学硕士生 :在ICCV/IROS/EMNLP/Nature Communications发表论文若干篇。目前从事多模态感知、自动驾驶VLA、大模型Agent等前沿算 法的预研,并已主持和完成多项自动驾驶感知和大模型框架工具,拥有丰富的自动驾驶、大模型研发和实战经验。 从技术的成熟度及就业的需求来看,自动驾驶VLA是各家 ...
净负债逾10亿、三年亏损6.6亿:魔视智能的“交叉依赖”能撑多久
经济观察网· 2025-09-28 07:15
经观感知 港股市场迎来又一家自动驾驶方案商。 9月27日晚,魔视智能科技(上海)股份有限公司向港交所递交上市申请,联席保荐人为国泰君安国际 和国信证券(香港)。 此前在2025年6月23日,魔视智能(Motovis)刚刚获得浙江美大实业股份有限公司(股票代码:002677)等 投资人数亿元人民币的D轮融资。 这家成立于2015年的公司,凭借自研算法与"Motovis智驾大模型",布局行车、泊车、主动安全等解决 方案,并已在奇瑞、广汽、上汽等乘用车,以及陕重汽、宇通等商用车上量产。招股书显示,截至2025 年上半年,累计交付量达到330万套以上。 表面上看,魔视的数据亮眼。2022年至2024年收入从1.18亿元升至3.57亿元,三年增长两倍有余,2025 年上半年继续同比大增76.4%至1.89亿元。毛利率也在经历低谷后回升,2025年上半年为20.1%,高于 2024年全年的14.2%。 但这些曲线难掩背后的隐忧。公司三年累计净亏超过6.6亿元,2025年上半年再亏损1.12亿元。现金流更 显脆弱,2022年至2025年上半年经营现金流持续为负,累计流出超过4亿元。公司不得不依赖外部融资 来维持扩张,而截至 ...
登上NeurIPS,Genesis开创无需OCC引导的多模态生成新范式,在视频与激光雷达指标上达到SOTA水平
机器之心· 2025-09-28 04:50
由华中科技大学与小米汽车提出了业内首个无需 OCC 引导的多模态的图像 - 点云联合生成框架 Genesis 。该算法只需基于场景描述和布局(包括车道线和 3D 框),就可以生成逼真的图像和点云视频。 为了以结构化语义引导生成过程,本文引入了 DataCrafter (一个基于 VLM 的数据标注模块),可提供场景级与实例级的信息描述。在 nuScenes 基准数据集上的大量 实验表明,Genesis 在视频与激光雷达指标上均达到了当前 SOTA 水平。 论文链接:https://arxiv.org/abs/2506.07497 Github 链接:xiaomi-research/genesis 论文题目:Genesis: Multimodal Driving Scene Generation with Spatio-Temporal and Cross-Modal Consistency Genesis 采用两阶段架构:第一阶段基于透视图投影的布局和场景描述等条件,利用基于 DiT 的扩散模型学习 3D 变分自编码器编码的环视图特征; 第二阶段将第 一阶段多视角视频序列转到鸟瞰图的特征空间,并结合场景描述和 ...
为什么自动驾驶中的强化学习,没有很好的落地?
自动驾驶之心· 2025-09-28 03:50
如果您也想和自动驾驶学术界或工业界的大佬交流,欢迎加入自动驾驶之心知识星球。 我们是一个认真做内容的社区,一个培养未来 领袖的地方。 『自动驾驶之心知识星球』目前集视频 + 图文 + 学习路线 + 问答 + 求职交流为一体,是一个综合类的自驾社区,已经超过4000人了。 我们期望未来2年内做到近万人的规模。给大家打造一个交流+技术分享的聚集地,是许多初学者和进阶的同学经常逛的地方。 为什么自动驾驶领域内的强化学习,没有很好的落地? 柱哥昨晚和星球嘉宾讨论自动驾驶强化学习的内容,分享给大家。 强化学习一直面临一个很严重的问题 - reward hack,当安全要求提高后,效率会降低。效率提升又可能导致安全性降低。所以这就引申 出一个问题,如何设计一个balance的reward,能够去平衡每一项表现。想得到一个全面性能提升的强化学习模型,其实非常难。多个 reward之间如何达到平衡也非常困难的。当然也有类似使用逆强化学习的方法去训练每一个reward的权重。 具身智能在我的理解中是一个local motion 的工作,它的目标很清晰。但自动驾驶不仅要完成最终行驶的目标,在中间的过程还要强依 赖某些驾驶规则。比 ...
自动驾驶的流派纷争史
36氪· 2025-09-28 02:50
自动驾驶商业化进展 - 截至2025年5月 Waymo在美国4个城市运营1500辆自动驾驶出租车 每周完成超25万次付费出行服务[1] - 百度Apollo全球部署超1000辆无人驾驶汽车 累计提供超1100万次出行服务 安全行驶里程超1.7亿公里[1] 传感器技术路线分歧 - 纯视觉方案采用8个环绕摄像头模拟人类视野 依赖深度学习算法从二维图像重建三维环境 成本极低适合大规模商业化[7] - 多传感器融合方案以激光雷达为主 可生成精确3D点云图 早期造价达7.5万美元 但能应对恶劣天气条件[5][9] - 主流车企包括Waymo、小鹏、蔚来选择多传感器融合 认为安全冗余是不可逾越的红线[9] 传感器内部选择差异 - 激光雷达角分辨率极高 能清晰分辨行人姿态和车辆轮廓 是L4/L5自动驾驶必备传感器[11] - 4D毫米波雷达成本仅数百元 具备强大穿透能力 可在恶劣天气下工作 但点云稀疏无法勾勒物体轮廓[13] - L4 Robotaxi和豪华车采用"激光雷达为主 毫米波雷达为辅"策略 L2+/L3经济车主要依赖"摄像头+毫米波雷达"方案[15] 系统架构发展路径 - 模块化设计将驾驶任务拆分为感知、预测、规划、控制等独立子任务 可解释性强且易于调试[16] - 端到端模型直接将传感器原始数据映射到驾驶控制指令 全过程无信息损失但存在黑箱难题[18] - 行业出现"显式端到端"折中方案 保留可行驶区域等中间输出以平衡性能与可解释性[18] 大模型应用方向 - VLM视觉语言模型追求过程可控 利用图像-文本配对数据预训练 技术相对成熟更易落地[19][23] - VLA视觉语言动作模型主张模型自主学会驾驶规则 需要海量视频-控制信号配对数据 训练成本高昂[21][23] - Waymo、Cruise、华为、小鹏选择VLM路线 特斯拉、吉利和理想探索VLA路线[25] 技术融合趋势 - 纯视觉方案开始引入更多传感器 多传感器融合方案中视觉算法地位提升[9] - 模块化架构开始吸收端到端优势 大模型为所有系统注入认知智能[25] - 激光雷达与视觉正在融合为多模态感知系统[25]
智驾中国队闯全球:生态输出与协同共建
中国汽车报网· 2025-09-28 02:35
今年,慕尼黑国际汽车及智慧出行博览会(IAA)的舞台上,一股来自中国的"智驾力量"以前所未 有的声势,改写着全球自动驾驶产业的叙事格局。 在这场备受瞩目的行业盛会上,中国智驾企业集体亮相,充分彰显着全球化野心。轻舟智航正式启动全 球化战略,与芯片巨头高通Qualcomm达成深度合作,同时敲定在德国设立欧洲总部的关键布局。 Momenta宣布将与优步携手,于2026年在德国慕尼黑联合启动Robotaxi运营服务。地平线宣布成立欧洲 区总部,携手全球顶级Tier-1及合资、外资品牌客户共同推进智能驾驶技术的全球落地进程。卓驭科技 也宣布正式面向全球发布欧洲战略。 从技术研发的"闭门造车"到全球化生态的"开门共建",中国自动驾驶企业的"出海"路径正变得愈发清 晰。过去,中国企业更多是在国内市场打磨技术、积累数据;如今,它们主动走出舒适区,带着经过本 土市场验证的算法、硬件与解决方案,在全球舞台上寻找合作伙伴,拓展应用场景,也为全球自动驾驶 产业的加速落地注入"中国动能"。 全球化:锁定长期生存权的必然选择 中国智驾企业加速推进全球化布局,并非单纯的市场扩张,而是在行业特性与国内竞争格局双重驱动下 的战略必然,核心逻 ...
开源鸿蒙6.0版发布;雷军回应小米17全系破纪录丨科技风向标
21世纪经济报道· 2025-09-28 02:12
21世纪经济报道新质生产力研究院综合报道 早上好,新的一天又开始了。在过去的24小时内,科技行业发生了哪些有意思的事情?来跟21tech一起 看看吧。 在开源鸿蒙技术大会上,开源鸿蒙6.0版本正式发布,可支持手机、平板、电脑等终端设备。 目前,开 源鸿蒙已汇聚9200多名社区贡献者,累计贡献1.3亿多行代码,推出70多个行业发行版,应用于金融、 交通、教育、能源等关键行业。同时,大会计划孵化开源鸿蒙跨平台框架PMC(项目管理委员会)及 具身智能PMC。据悉,具身智能PMC采用模型原生操作系统设计方法,完成首套开源鸿蒙与昇腾算力 赋能的全尺寸类人型机器人。 苹果公开反对欧盟《数字市场法案》 据央视新闻,针对近日美国苹果公司提出废除欧盟科技监管法规《数字市场法案》的要求,欧盟委员会 发言人雷尼耶作出强硬回应。他表示,自《数字市场法案》生效以来,苹果公司就对该法案提出各种质 疑,并且拒绝了欧盟委员会为帮助其遵守法案而进行的积极谈判。雷尼耶称,另一项针对苹果公司的调 查仍在进行,"所有选项都摆在桌面上"。苹果公司此前曾因违反《数字市场法案》相关条款,被处以5 亿欧元的罚款。苹果公司发表声明,要求欧盟废除《数字市场法案 ...
会自检的VLA!ReflectDrive:更安全更高效scaling的端到端框架(理想&清华)
自动驾驶之心· 2025-09-27 23:33
会自检的ReflectDrive:我的轨迹我做主,安全感拉满! 端到端自动驾驶已成为一个重要且快速发展的研究领域。通过大规模数据集学习类人驾驶策略具有相当大的潜力。但是在多模态性能以及长尾场景, 没有可持续解决问题的框架。如果仅依赖强化学习来加强,那么reward hack又成为了棘手的问题,很难写出一个全面的reward可以适用连续轨迹复杂的 三维空间。所以近年来大语言模型的泛化能力突破让大家看到了希望,是否能够利用模型scaling以及数据scaling去激发模型的泛化性能,也就是vla模 型的兴起。 大家都想利用上vlm的泛化能力,用更少的数据去解决few shot/zero shot的场景。下面是对于目前自动驾驶方案vla方案的痛点分析: 基于上面的描述,可以看出目前迫切需要做到的是L模态和A模态的融合,一种更容易scaling的统一的架构,同时还要做到高效生成。为应对这些挑 战, 理想和清华的团队提出ReflectDrive——一种新型学习框架,通过离散扩散的反思机制实现安全轨迹生成。 我们首先将二维驾驶空间离散化以构 建动作代码本,从而能够通过微调将预训练扩散语言模型用于规划任务。该框架的核心是安 ...
NeurIPS 2025 | SURDS 数据集与 GRPO 全面强化自驾空间推理
自动驾驶之心· 2025-09-27 23:33
以下文章来源于深蓝AI ,作者深蓝学院 深蓝AI . 专注于人工智能、机器人与自动驾驶的学习平台。 作者 | 深蓝学院 来源 | 深蓝AI 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 摘 要 在大模型飞速发展的当下,让多模态大语言模型(VLM)在自动驾驶场景图像中做出准确的空间推理,依然是人工智能领域的一大挑战。学术界一直缺 乏针对自动驾驶场推理的大规模基准,现有方法往往依赖外部专家模型,难以全面衡量模型能力。 与此形成鲜明对比的是,人类可以凭借已有知识轻松判断图像中物体的朝向,或推理多个物体的相对位置。而VLM同样具备丰富的知识,却仍在此类任务上 表现不足。 为此,武汉大学联合中科院自动化所,北京智源人工智能研究院 (BAAI)等多家单位推出 首个面向驾驶场景的VLM空间推理大规模基准 SURDS ,系统评测了 包括 GPT 系列在内的通用模型及 SpatialRGPT 等空间推理模型,全面揭示了当前VLM在空间理解方面的短板。研究团队通过设计"感知准确性"和" ...