Workflow
自动驾驶大模型
icon
搜索文档
自动驾驶之心在招募业务合伙人!
自动驾驶之心· 2025-12-14 02:03
联系我们 作为国内自动驾驶领域创作的技术平台,我们期望能够在这波激流中贡献自己的力量,成为一个真的能 给行业带来价值的平台。 众人拾柴火焰高,我们需要更多优秀的伙伴加入我们。 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 岗位说明 大家好,我是柱哥。最近收到很多小伙伴的咨询和求助,希望我们能够联系更多的技术专家分享业内最 新的动态和观点。自动驾驶已经进入下半场,行业的难点和痛点需要更多有志之士参与进来一起突破。 后面我们将陆续为大家增加圆桌访谈、实战&工业级课程、咨询等各类输出。 主要面向自动驾驶培训合作(B端主要面向企业和高校、研究院所培训,C端面向较多学生、求职类人 群)、课程开发和原创文章创作。 主要方向 包括但不限于:自动驾驶产品经理、4D标注/数据闭环、世界模型、VLA、自动驾驶大模型、强化学 习、端到端等多个方向。 待遇与合作方式,欢迎添加微信wenyirumo做进一步沟通。 ...
Percept-WAM:真正「看懂世界」的自动驾驶大脑,感知到行动的一体化模型
机器之心· 2025-12-10 02:09
在过去几年,自动驾驶圈流行一句话: 「大模 型会说话,但不会开 车。」 一方面,大规模视觉语言模型(VLM)在文本理解和逻辑推理上突飞猛进;另一方面,一旦把它们放到真实道路上,让它们处理长尾场景、远距离目标和复杂博 弈时,这些 "聪明大脑" 却常常犯低级错误:看不清、定位不准、反应不稳定。深层原因在于 —— 现有 VLM 在空间感知和几何理解上的能力,远远跟不上它们在 语义层面的 "表达能力" 。 为了让大模型真的能 "看懂世界",在很多现有方案中,研究者会在训练中加入一些 "感知类 QA" 问题,比如问 "左前方有没有车""两车距离有多远"。但这类监督 更多停留在语义标签和粗略相对关系层面,并没有让模型真正学会可用于控制决策的强 2D/3D 感知能力 —— 例如精确、稳定的检测框、分割结果和 BEV 感知信 息。换句话说,今天很多 VLA 仍然停留在「会回答关于世界的问题」,而不是「真的看清这个世界」。这种 "弱感知的大模型",显然不足以支撑自动驾驶和广义 具身智能对空间理解的高要求。 近日,来自引望智能与复旦大学的研究团队联合提出了一个面向自动驾驶的新一代大模型 ——Percept-WAM(Percept ...
寻找散落在各地的自动驾驶热爱者(产品/部署/世界模型等)
自动驾驶之心· 2025-12-06 03:04
行业阶段与平台定位 - 自动驾驶行业已进入下半场 行业面临难点与痛点需要更多参与者共同突破 [2] - 平台定位为国内自动驾驶领域创作技术平台 旨在行业激流中贡献力量并创造价值 [2] 平台发展规划 - 平台计划陆续增加圆桌访谈、实战及工业级课程、咨询等多种形式的内容输出 [2] - 平台呼吁更多优秀伙伴加入以共同发展 [3] 业务聚焦方向 - 平台业务主要聚焦于自动驾驶产品经理、4D标注与数据闭环、世界模型、视觉语言动作模型、自动驾驶大模型、强化学习、端到端等多个技术方向 [4] - 平台岗位主要面向自动驾驶培训合作 包括面向企业与高校的B端培训以及面向学生与求职人群的C端培训 同时涉及课程开发与原创文章创作 [5]
模型部署/产品经理方向合伙人招募
自动驾驶之心· 2025-11-26 00:04
公众号内容升级与行业定位 - 公众号内容正从单篇文章解读向更深入的技术梳理、方案分析和观点讨论过渡[2] - 行业已进入技术深水区 难点和痛点需要更多参与者共同突破[2] - 平台致力于成为能为自动驾驶行业带来价值的技术创作平台[2] 近期行业技术动态 - 特斯拉、小鹏、理想等公司近期的技术分享引发了广泛深入的行业讨论[2] 人才招募与合作方向 - 招募方向涵盖自动驾驶产品经理、4D标注、数据闭环、世界模型、VLA、自动驾驶大模型、强化学习、端到端等多个技术领域[4] - 合作岗位主要面向自动驾驶培训合作 包括B端企业、高校、研究院所培训以及C端学生和求职人群[5] - 合作内容涉及课程开发和原创文章创作[5]
留给端到端和VLA的转行时间,应该不多了......
自动驾驶之心· 2025-11-25 00:03
课程核心观点 - 自动驾驶技术正从模块化量产算法向端到端和视觉语言动作模型演进,掌握相关前沿技术对职业发展至关重要 [1] - 行业端到端和视觉语言动作模型岗位即将饱和,为从业者留下的窗口期已不多 [1] - 推出《端到端与视觉语言动作模型自动驾驶小班课》和《自动驾驶视觉语言动作模型和大模型实战课程》,旨在帮助学员快速高效入门 [1] 自动驾驶视觉语言动作模型与大模型实战课程 - 课程聚焦视觉语言动作模型领域,内容涵盖从视觉语言模型作为自动驾驶解释器到模块化、一体化及当前主流的推理增强视觉语言动作模型 [1] - 课程配套理论基础梳理,包括视觉、语言、动作三大模块、强化学习、扩散模型等,并设有大作业章节指导学员从零搭建自己的视觉语言动作模型及数据集 [1] - 由学术界专家带队,适合刚接触大模型和视觉语言动作模型的学员 [1] 端到端与视觉语言动作模型自动驾驶课程 - 课程聚焦端到端自动驾驶宏观领域,梳理一段式/两段式方向的重点算法和理论基础,详细讲解鸟瞰图感知、大语言模型、扩散模型和强化学习 [9] - 课程设计两大实战项目:基于扩散模型的Diffusion Planner和基于视觉语言动作模型的ORION算法 [9] - 由工业界专家带队,讲师为国内顶级主机厂算法专家,拥有端到端算法研发和产品量产交付经验 [9][11] 师资团队 - 讲师团队由学术界和工业界专家组成,包括清华大学硕士生、QS30高校博士等,在ICCV、IROS、EMNLP等顶级会议发表多篇论文 [6][8][11] - 团队拥有多模态感知、自动驾驶视觉语言动作模型、大模型Agent等前沿算法预研经验,并主持完成多项自动驾驶框架工具和产品量产 [6][8][11] - 一位讲师在GitHub上维护的自动驾驶与计算机视觉开源项目总Star数已超过2k [6] 目标学员与技术要求 - 学员需自备GPU,推荐算力在4090及以上 [12] - 要求具备一定的自动驾驶领域基础,熟悉基本模块,了解Transformer大模型、强化学习、鸟瞰图感知等技术概念 [13] - 需具备概率论、线性代数基础及Python和PyTorch编程能力 [13]
招募4D标注和世界模型方向的合伙人!
自动驾驶之心· 2025-11-08 16:03
文章核心观点 - 自动驾驶之心公众号正在积极拓展业务范围 从内容平台向企业培训 求职辅导和技术服务等领域延伸[2][4] - 公司面向全球招募自动驾驶领域从业者进行合作 合作方向涵盖产品经理 4D标注 世界模型等多个前沿技术领域[4][5] - 合作模式主要包括B端企业高校培训 C端学生求职辅导 课程开发和原创内容创作[4][6] 业务拓展方向 - 企业培训需求多样化 包括技术进展梳理 发布会方案解读和行业发展总结[2] - 求职辅导需求集中在简历优化和项目经验补充方面[3] - 合作领域覆盖自动驾驶产品经理 4D标注/数据闭环 世界模型 VLA 自动驾驶大模型 强化学习和端到端等方向[5] 合作模式与资源 - 合作岗位主要面向自动驾驶培训合作 B端服务企业和高校研究院所 C端服务学生和求职人群[6] - 合作形式包括课程开发和原创文章创作[6] - 公司将提供高额酬金与丰富行业资源吸引合作伙伴[5]
招募4D标注和世界模型方向的合伙人!
自动驾驶之心· 2025-11-08 12:35
公司业务拓展 - 公司正积极拓展业务范围,从原有的内容平台向企业培训和求职辅导等方向进行能力输出 [2] - 业务拓展的驱动力来自行业内越来越多的企业和个人的明确需求 [2] - 公司面向全球自动驾驶领域从业者发出合作邀请,计划在技术服务、培训、课程开发与科研辅导等多个领域展开合作 [4] 市场需求分析 - 企业端培训需求呈现多样化特征,涵盖技术进展梳理、发布会方案解读以及行业发展趋势总结 [2] - 个人用户端存在显著的求职辅导需求,求职者普遍面临简历缺乏亮点、急需项目经验补充和专业技能指导的困境 [3] 合作方向与岗位说明 - 合作聚焦于多个前沿技术方向,包括自动驾驶产品经理、4D标注/数据闭环、世界模型、VLA、自动驾驶大模型、强化学习、端到端等 [5] - 合作岗位主要涉及自动驾驶培训、课程开发及原创文章创作 [6] - 培训业务明确划分为面向企业和高校研究院所的B端市场,以及面向学生和求职者的C端市场 [6] 合作激励 - 公司为合作者提供具有吸引力的高额酬金 [5] - 合作者将有机会获得公司提供的丰富行业资源 [5]
何小鹏:为搞AI“烧掉”20多亿,曾“每月花1个多亿”
凤凰网· 2025-11-05 07:46
研发投入与规模 - 公司为探索VLA技术路线,自2024年至今已投入3万卡的算力资源 [1] - VLA项目整体训练费用巨大,累计投入超过20亿元人民币 [3] - 项目月度训练费用高昂,曾出现单月支出超过1亿元人民币的情况 [3] 技术突破与战略调整 - 基于物理世界模型、跳过语言环节的创新VLA方案于今年第二季度取得技术突破 [3] - 技术突破促使公司决定停止标准VLA方案的开发,全力转向新技术路线 [3] - 此项进展被认为将公司自动驾驶技术的升级换代进程提前了接近两年 [3] 研发过程与挑战 - VLA项目研发过程充满挑战,在很长时间内未能看到明确希望 [3] - 研发团队内部曾多次讨论是否终止VLA团队项目 [3] - 高昂的月度账单给公司带来了持续的巨大压力 [3]
端到端和VLA,正在吸引更多智驾公司的关注......
自动驾驶之心· 2025-10-23 00:04
端到端与VLA自动驾驶行业需求 - 主机厂和供应商对端到端及VLA技术人才的需求旺盛,反映出行业技术迭代加速 [1] - 端到端自动驾驶算法主要分为一段式和两段式两大技术范式,其中UniAD是一段式的代表性工作 [1] - 基于VLA的端到端算法是当前学术和工业界的热点,相关论文呈爆发式增长并正推动量产落地 [1] 端到端与VLA技术栈 - 核心技术涉及BEV感知、视觉语言模型、扩散模型、强化学习、世界模型等多个前沿领域 [3] - 一段式端到端算法可进一步细分为基于感知、扩散模型、世界模型及VLA等多种实现路径 [1] - 从模块化算法演进至端到端,再发展到VLA,代表了自动驾驶技术发展的主要方向 [3] 自动驾驶VLA与大模型实战课程 - 课程由学术界专家主导,系统梳理从VLM作为解释器到模块化VLA、一体化VLA及推理增强VLA的技术体系 [3] - 课程内容涵盖Vision/Language/Action三大模块,并设有大作业指导学员从零搭建VLA模型及数据集 [3] - 授课教师来自清华大学及QS30高校,在ICCV/IROS/EMNLP等顶级会议发表多篇论文,GitHub项目总Star数超过2k [8][11] 端到端与VLA自动驾驶课程 - 课程由工业界专家主导,重点讲解一段式/两段式端到端算法的核心理论与模型 [12] - 课程设计包括基于扩散模型的Diffusion Planner和基于VLA的ORION算法两大实战项目 [12] - 授课教师为国内顶级主机厂算法专家,拥有端到端及大模型算法的预研和量产交付经验 [14] 课程目标人群要求 - 学员需自备GPU,推荐算力为4090及以上 [15] - 要求学员具备一定的自动驾驶领域基础,并熟悉Transformer、强化学习、BEV感知等基本概念 [16] - 学员需拥有概率论、线性代数基础,并掌握Python和PyTorch编程能力 [16]
影响市场重大事件:全球首个陆上商用模块式小型堆“玲龙一号”全球首堆冷试成功;固态电池新突破,新能源车续航有望翻倍
每日经济新闻· 2025-10-16 22:17
核能技术进展 - 全球首个陆上商用模块式小型堆“玲龙一号”冷态性能试验成功,为后续安全稳定运行奠定基础 [1] - “玲龙一号”建成投运后,预计年发电量达10亿度,可满足52.6万户家庭用电需求,并减少二氧化碳排放量约88万吨 [1] 算力基础设施发展 - 工信部启动专项行动,目标到2027年实现城域算力1毫秒时延圈覆盖率不低于70%,构建高品质毫秒入算底座 [2] - 推动光网络设备向用户侧部署,并开展小颗粒光传送网(OTN)、确定性网络等新技术验证 [2] 电池技术突破 - 中国科学家攻克全固态金属锂电池关键技术,使新能源汽车续航里程有望从500公里突破至1000公里 [3] - 固态电池作为下一代锂电池核心技术,在新能源汽车、低空经济等领域具备广阔应用前景 [3] 智能网联汽车产业 - 工信部将高水平建设汽车行业人工智能中试基地,并编制十五五智能网联新能源汽车产业发展规划 [4] - 中国科协提出加快生成式自动驾驶大模型研发验证,以构建自动化训练与迭代闭环,提升行车安全 [9] - 北京将聚焦大算力、环境感知等领域共建创新平台,其自动驾驶等测试里程已超过6200万公里 [10] 人工智能市场展望 - 报告预测到2027年,AI软硬件整体市场规模将达到7800亿至9900亿美元,年均增速为40%-55% [5] - AI应用程序和交易平台的平均增速预计为60%-85%,为中国企业提供巨大全球化机遇 [5] 储能电池市场动态 - 2025年第三季度中国储能锂电池出货量达165GWh,同比增长65% [6] - 2025年前三季度合计出货量430GWh,已超2024年全年总量30%,预计全年出货量将达580GWh,增速超75% [6] 宏观经济与政策 - 美国财政部国库券规模激增,其一般账户余额在下次季度报告中可能至少达到9000亿美元 [7] - 国家医保局要求,在定点医药机构申报截止次日起不超过20个工作日内拨付结算资金,以提高效率 [8]