Workflow
强化学习模型
icon
搜索文档
特斯拉再一次预判潮水的方向
自动驾驶之心· 2025-12-18 09:35
文章核心观点 - 特斯拉通过其AI负责人发布的长文,系统性阐述了其FSD的技术方法论,核心是采用端到端神经网络模型,并融合了视觉重建(世界模型)和语言解释(VLA)技术来解决自动驾驶的长尾问题[4][6][8][10] - 行业对端到端、VLA(视觉-语言-动作)和世界模型三大技术概念存在争论,但文章提出反共识观点,认为三者并非对立,而是层层递进的关系:端到端是基座,VLA是升级,世界模型是终极形态[11][12] - 特斯拉的技术路径预判并整合了当前所有主流技术方向,其闭麦两年后通过一篇论文强势回归,再次引领行业技术潮流[4][20] 技术概念解析与关系 - **端到端神经网络**:是一个完全颠覆性的模型,需要将所有的设计思路、代码编写、验证方式全部推倒重来,被视为自动驾驶行业一次彻底的升级变革[11] - **VLA(视觉-语言-动作)**:本质上是端到端模型的延伸,在模型中加入了语言(Language)信息,其核心并非多一个信息输入,而是让模型通过语言方式将信息可视化输出[12] - **世界模型**:通俗理解是根据提示生成视频,目标是建立基于视频/图像的“时空认知”,以弥补语言模型在低带宽和信息描述上的短板[12][15][16] - **三者关系**:端到端是基座,VLA是在此基础上加入语言模型的升级,世界模型则是对空间的理解和重塑,与前两者不同,三者是层层递进而非非此即彼[12][19] 行业技术路线与玩家格局 - **端到端路线**:主要由智驾公司推动,如地平线、博世、Momenta,因其成本相对较低、稳定度高且易于规模化部署[13] - **VLA路线**:理想、小鹏、元戎启行是主要拥趸者,但该路线的长期价值遭到华为和蔚来高层的反对[13] - **世界模型路线**:华为和蔚来是主要拥趸者,认为自动驾驶更需要“时空认知”或“空间智能”,而非依赖语言通道[13][16] - **技术融合现状**:端到端与规则代码并不冲突,头部企业如华为在采用端到端方案时仍会使用规则兜底[11] 目前行业存在一段式和两段式端到端方案并存的局面[11] 在实际系统中,为保障高效运转,通常会组合使用多个模型,并可能加入强化学习[19] 特斯拉的技术方案与创新 - **解决端到端模型调试难题**:提出两种方法,一是利用“生成式高斯泼溅”技术在220毫秒内根据摄像头视频实时生成动态3D环境模型(视觉重建/世界模拟器)[8] 二是训练AI用自然语言解释自身行为,一个小型化语言推理模型已在FSD v14.x版本中运行[10] - **云端训练与仿真**:在云端开发“神经世界模拟器”,这是一个能实时生成以假乱真虚拟世界的强大AI,用于对FSD进行极端场景的压力测试和7x24小时训练,再将训练好的模型下放到车端实现降维打击[17] 技术发展的本质与趋势 - **端到端的意义**:标志着自动驾驶真正由人工规则进入智能学习的开始[19] - **VLA的争议核心**:争议焦点在于将所有信息转换为语言是否必要,反对者认为智能驾驶的本质更需要对空间的理解而非语言能力[16] - **世界模型的目标**:旨在补齐语言模型在“时空认知”上的短板,直接建立高带宽的认知系统[15][16] - **系统架构演进**:从理想早期包含端到端和VLM两个模型的“快慢思考”架构,到VLA的单一模型决策,再到世界模型与端到端等多个模型的组合,系统架构随技术演进不断变化[19] - **学习模式进化**:行业趋势正从模仿学习转向强化学习,让系统通过探索“好的行为”并获得奖励来超越人类驾驶水平[19]
零一之间——Agent眼中的市场
2025-06-04 01:50
纪要涉及的行业或公司 主要涉及转债市场,未明确提及具体公司 纪要提到的核心观点和论据 - **市场观点与投资建议** - 当前市场观点偏中性,指标表现不上不下,模型观点为 0.51 即中性偏好,投资者应仔细评估策略 [3][14] - 市场观点鲜明时强调具体投资建议,模糊时关注结构性机会,寻找特定领域或行业投资机会 [1][6] - 当前适合购买长期上涨且溢价率较低的看涨期权、YTM 偏高且正股走势平稳的个券、中等估值弹性的个券,其中看涨期权最多,中等估值弹性个券次之 [2][15] - **强化学习模型特点及应用效果** - 强化学习模型评估当前购买行为及未来卖出时机优化转债收益,样本外数据显示 2020 年后多数时间建议为 0,需更高激励改变决策 [1][5] - 与普通深度学习模型不同,强化学习模型考虑动作后状态及其价值,适用于转债环境 [4] - 模型可通过引入更多因子、采用退火算法等随机探索策略、使用缓存池记录训练数据避免局部最优化问题,提升泛化能力 [1][9] - 在转债个券应用中,模型可降低最大回撤约 9.4%,提高年化回报 2%,但不适用于电力、银行等超级大盘转债 [1][10] - 历史数据显示模型能有效规避趋势性风险,如避开 2024 年 1 月和 2025 年 3 月市场下跌,趋势上升时重新进入,但对小盘流动性问题等特殊情况难分辨 [1][11] - **仓位管理策略** - 仓位管理可根据市场状态动态调整,长期平均仓位为 46%,适合与二级债基或半仓转债结合使用,极端情况可完全退出市场,近期保持中性观点灵活调整 [1][13] 其他重要但是可能被忽略的内容 - 研究转债应细致结合基本面和策略分析,基金内部分工后最终需结合两者得出结论 [16] - 临期债券表现通常不如全样本测试,新客户可参考报告,老客户无需过多关注 [17] - 转债投资经理需具备研究和表达能力,清晰交流有助于非专业人士理解复杂产品 [18]