Workflow
理想TOP2
icon
搜索文档
如果存在理想第一代AI眼镜, 先降低预期可能是上策
理想TOP2· 2025-11-24 11:54
李想对AI终端的战略构想 - 人工智能时代终端需具备四个特点:360度物理世界感知能力、认知决策能力、行动能力、自我反思反馈能力[1] - 公司未来开发的任何终端产品都必须符合以上四个能力标准[1] - 关于机器人业务,公司不会直接设定明确节奏,而是根据行业进展进行研究和分析,并决定哪些能力需自行解决[1] - 公司对终端产品的选择与业务规模相关,规模较小时尽可能收敛,规模扩大后则必须进行业务扩张[1] 眼镜作为AGI终端的发展现状与挑战 - 2025年4月,公司认为眼镜具备360度感知能力,但显示效果不佳,无法成为长期使用方式,且存在电池电量、独立计算、通讯等技术问题待解决[1] - 眼镜可能成为人类穿戴式AGI终端的一条可行路径,但也可能出现其他替代路径[1] - Rokid创始人指出眼镜存在“不可能三角”:展现力、穿戴性、续航难以兼顾,满分10分下,Vision Pro展现力9分、续航6-7分、穿戴性几乎0分;Rokid眼镜穿戴性7-8分、续航7-8分、展现力3分[2] - 若三点能同时达到7-8分将迎来技术奇点,但这需要突破电池、材料、半导体、光学、通信等广泛技术领域,且大量算力无法全部集成于眼镜设备上[2] 公司当前业务运营表现 - 公司今年多个部门表现一般,包括销售管理、供应链、i86产能、智驾部门面向高频智驾用户的运营等[2] - 小同桌、卡片大师、理想同学生活助手Agent等产品在理念层面获得好评,但实用层面现阶段表现不佳[2] - 广州车展提及生活助手将进行OTA升级,但未承诺小同桌和卡片大师的更新计划,产品更新速度偏慢[2] - 基于公司整体状态,难以预期其第一代AI眼镜能做得特别惊艳,AI眼镜前进方向明确但需解决大量技术问题[2]
理想提出首个包含自车和他车轨迹的世界模型
理想TOP2· 2025-11-23 11:56
技术模型创新 - 公司首次提出包含自车和他车轨迹的驾驶世界模型,旨在更逼真地模拟自车与驾驶场景的交互,并能通过改变自车-他车轨迹生成多样化的新颖场景[1][8] - 为解决缺乏交互性、特征分布不匹配和空间映射困难三大缺陷,公司提出EOT-WM模型,将轨迹点投影到图像坐标系并在空白视频上绘制轨迹,生成用于学习的轨迹视频,实现统一视觉模态[6] - 采用时空变分自编码器对场景视频和轨迹视频进行编码,获得共享特征空间的场景视频隐变量和轨迹隐变量,确保时空对齐[7] 模型架构与训练 - 预训练阶段在云端训练32B视觉语言基座模型,包含3D视觉、高清2D视觉以及驾驶相关语料,随后蒸馏成3.2B的MoE模型以适应车端算力[1] - 后训练阶段引入action将模型转化为视觉语言行动模型,参数量接近4B,采用短链条思维链并利用扩散模型对未来4-8秒的轨迹和环境进行预测[1] - 强化学习阶段包含人类反馈强化学习和不依赖人类反馈的纯强化学习,基于舒适性、无碰撞、遵守交规三大指标自我进化,目标驾驶水平超越人类[1] 模型控制与评估 - 设计注入轨迹的扩散Transformer,将轨迹隐变量提供的运动引导集成到视频隐变量中,以便更精确地对噪声视频隐变量进行去噪[7][9] - 整个模型可在文本和轨迹控制下基于给定初始帧预测未来帧,并提出基于控制隐变量相似度的指标用于比较预测轨迹隐变量与真值轨迹隐变量[7][9] - 与GEM模型和英伟达Cosmos模型对比,指出GEM模型使用未来物体特征和人体姿态不切实际,Cosmos模型参数量达70亿以上且推理训练成本高昂[5] 研究进展与发布 - 驾驶世界模型论文第一版于2025年3月12日发布,AAAI 2026会议录用版于2025年11月19日发布[2] - 论文第三版于2025年7月31日发布,新增作者并担任项目负责人,同时移除另一位作者,增加对GEM模型和英伟达Cosmos模型的讨论[5] - 论文第四版主要根据AAAI排版要求进行微调和双栏排版,各项量化实验结果与第一版保持一致[5]
如何评价理想为i6欣旺达电池额外赠送2年4万公里质保?
理想TOP2· 2025-11-22 05:57
理想汽车电池供应商策略 - 公司为确保长期供应链安全 明确需要至少两家电池供应商[1] - 存在强大舆论场认为宁德时代电池更优 导致部分消费者愿意花相同价格优先选择宁德[1] - 为解决i6发布的主要矛盾 销售私下向用户承诺2025年款i6均使用宁德电池[1] - 因电池产能不足 公司于2025年11月21日通知锁单车主 自2025年12月起将供应欣旺达电池 并额外赠送2年4万公里质保[1] - 公司面临三个关键变量权衡:用户等待周期、是否开放电池品牌可选、是否为欣旺达电池提供额外质保[1] 电池品牌选择方案评估 - 公司最倾向直接混装方案 但其对应的舆情风险不可控[2] - 开放品牌可选方案在初期能让用户早提车 但稳态下选择宁德电池的比例可能过高[2] - 开放可选并给予欣旺达额外质保可稳定其份额 但若质保相同则对选择宁德的消费者不公 若质保更低则与公司“标准一致”的表述矛盾[2] 消费者认知与公司叙事差异 - 公司官方叙事强调欣旺达与宁德电池无区别 均符合设计标准 是“土豆与马铃薯”的关系[2] - 但相当比例消费者不信任此说法 其认知锚点包括:宁德电池售价更高且市占率/利润水平显著领先 高端车型中宁德占比更高 专业拆解视频普遍认为宁德更优 宁德市场广告投入显著更多[3] - 公司的解释仅停留在“符合设计标准”和“欣旺达也是大厂” 对多数消费者说服力不足[3] 电池性能差异的专业观点 - 专业人士指出 磷酸铁锂电池的差异小于三元锂电池的差异是确定性很高的观点[5] - 对于磷酸铁锂 在消费者最关心的安全和寿命上没有太大差异 二线厂商为弥补品牌和工程能力差距可能更舍得用料做冗余[5] - 对于三元锂 事故概率存在差异 行业龙头更值得信赖[5] 公司沟通策略的局限性 - 公司的公开解释说服力差 叙事链单一 仅强调设计标准一致 缺乏细化数据支撑[6] - 展示欣旺达电池厂画面和工艺流程 只能说明其高标准 但无法从根本上解释为何宁德“更贵且销量更大”[6] - 细化指标的大数据可能是最有说服力的依据 但公司可能基于种种原因不便公开[6] 内部一致性验证 - 公司电池部门员工内部也明确表示两种电池没有区别 且员工自认购买欣旺达版本并无吃亏[4] - 公司公开使用“土豆与马铃薯”的比喻 其背后应有大数据支撑 而非仅凭设计标准一致[5]
理想2025广州车展视频版/图文压缩版
理想TOP2· 2025-11-21 04:22
公司愿景与产品理念 - 公司愿景是活成自己真正喜欢的样子 [1] - 优秀智能驾驶的评判标准包括选对路、速度对、舒适度、安心感、可沟通、高效率 [1] 智能驾驶运营数据 - 两个月内视觉智能驾驶里程达3.12亿公里,里程渗透率提升2.2倍 [3] - 日活跃用户提升3倍,有5000多名用户单日行驶里程达1000公里 [3] - 累计拥有52万AD Max用户 [3] 技术进展与功能更新 - 通过强化学习技术优化智能驾驶表现,新版本即将推送 [6] - 在理想充电站,除下车插枪外其余充电步骤均可实现自动化 [6] - 计划在2026年1月、2月、3月分别有1400、2400、2900座充电站具备全自动充电能力 [6] - 累计避免潜在碰撞事故1132万次,避免极端烈性事故14034次 [9] - 夜间主动避险达208万次 [9] - AES功能新增防御性加速避让和防御性加速前进 [9] - 未来将具备360度全方向AES能力 [9] 产品路线图与功能推送 - 城市NOA功能不久将面向AD Pro焕新版用户推送 [13] - 今年后续将有更多OTA更新内容 [11]
理想主动安全负责人发文《主动安全之死》
理想TOP2· 2025-11-20 16:15
文章核心观点 - 主动安全技术正经历从基于规则的传统方法向模型化或端到端技术的根本性转变,这将带来业务质的飞跃 [15][18] - 激光雷达对于提升主动安全性是必要的,尤其是在人类驾驶占主导的当下,能极大程度弥补人眼和视觉系统的感知局限 [6] - 主动安全业务的长期发展是“向死而生”,随着事故减少和高级别自动驾驶的到来,其形态将发生涅槃重生,而非彻底消亡 [16][18] 主动安全与辅助驾驶的关系 - 辅助驾驶系统根据导航全程控制车辆,将用户送至目的地,在L2阶段需要人类监督 [2] - 主动安全功能通过预警、刹车、转向等方式,在人类或系统驾驶时拦截潜在碰撞风险,其控制权会短暂“抢占”车辆 [2] - 主动安全的目标更纯粹:无论何种驾驶方式或驾驶者,核心是避免碰撞 [3] 激光雷达的必要性 - 对于主动安全,激光雷达可以极高程度提高安全性,短期看是必须的 [6] - 人类是交通事故主因,其驾驶决策并非仅围绕安全,常将车辆置于“冒险”状态 [6] - 人眼感知依赖光照条件,在逆光、炫光、无光或目标纹理与环境难区分时存在局限,激光雷达可有效弥补 [6] - 雨雪天气下激光雷达性能受影响的争议被指出意义不大,因这类天气在全量驾驶里程中占比不足10% [6] 传统主动安全技术的瓶颈 - 当前基于枚举场景和规则代码的开发方式,难以覆盖用户真实事故的纷繁复杂性,例如醉汉突然摔倒、两轮车突然切入等场景 [8][10] - 串联式技术架构在信息传递过程中存在信息损耗和校验时延,增加处理时间 [12][13] - 安全领域毫秒必争,该架构对复杂场景(如人群中冲出的行人、夜间鬼探头等)应对能力存在瓶颈 [11] 模型化/端到端技术的优势 - 模型化或端到端技术可极大缓解传统规则方法的两个核心问题,并对复杂场景的泛化应对立竿见影 [15] - 规则方法被比喻为“在烧饼里捡芝麻”,而模型化则是“一口一口吃芝麻”,处理效率更高 [15] - 对于主动安全所需的极短时序(约10秒)本能安全反应,端到端技术无比适合 [15] 主动安全业务的未来演进 - 业务呈现“向死而生”态势:人类驾驶事故不断减少,以及未来L3/L4级自动驾驶系统的谨慎策略,都可能降低其对传统主动安全的需求 [16] - 传统主动安全将成为过去式,但通过模型化技术的应用,业务将凤凰涅槃,在未来三年内出现超乎想象的进步 [18] - 规则与模型在安全领域相辅相成,行业内部将专注于如何共创未来,持续优化以降低事故概率和烈度 [18]
基于准确的原始材料对比小鹏理想VLA
理想TOP2· 2025-11-20 10:42
小鹏汽车自动驾驶技术架构 - 技术核心为拆掉中间的Language层,采用Vision和Language联合输入的语料,认为中间的L影响数据使用效率和scaling up [1][3][5] - 架构使用Latent CoT作为隐空间进行生成和diffusion,侧重世界模型理解物理世界运行规律以输出动作 [3] - 明确没有纯粹Language语料,VL联合语料具体训练方式未解释 [1][5] - 自动驾驶能力取决于数据规模和使用效率,最难数据为corner case,海外泛化性不错 [3][4] - 目前未做Agent,计划2026年基于该架构在广州进行L4级Robotaxi测试 [4] - 强化学习在现有架构中非核心,仅被提及两次,涉及未来需解决如何使强化学习更通用等问题 [6] - 对技术路线存在模糊点,包括scaling持续程度、安全下限、超级对齐有效性及定制化影响等 [5] 理想汽车VLA训练体系 - 训练分三个阶段:预训练云端32B VL基座模型、后训练引入Action转为接近4B参数量VLA、强化学习阶段优化驾驶行为 [8][10][11][13][14][15] - 预训练VL基座包含3D视觉、清晰度提升3-5倍的高清2D视觉、驾驶相关Language语料及VL联合语料(如导航信息与人类判断同步记录) [10] - 为适配车端算力,将32B云端模型蒸馏为3.2B的MoE模型以保证推理速度 [11] - 后训练采用短链条CoT限制在2-3步以内,并加入Diffusion预测未来4-8秒轨迹和环境 [13] - 强化学习分两部分:RLHF实现与人类驾驶习惯及安全对齐;纯强化学习利用世界模型生成数据,基于舒适性(G值)、无碰撞、遵守交规三大指标自我进化,目标超越人类驾驶水平 [14][15][19] - 司机Agent分层处理指令,通用短指令由端侧VLA直接处理,复杂长指令上传至云端32B VL基座模型处理后交由端侧执行 [16][17] 行业技术路线共识与差异 - 小鹏与理想均将VLA、VLM、世界模型等视为端到端体系架构,本质均为Physical AI,技术方向大同小异 [5] - 关键差异在于理想VL基座明确包含驾驶相关纯Language语料,而小鹏强调没有纯粹L语料 [1][2] - 理想认为交通领域是VLA最早落地场景,因规则清晰、控制自由度低(2-3个)、易于模仿学习及强化学习反馈明确 [18][19] - 理想预计2025年底至2026年初强化学习闭环后实际体验将有显著提升 [2]
36氪分享理想2025年秋季战略会部分内容
理想TOP2· 2025-11-19 13:26
公司战略反思与调整 - 公司承认自身效率变慢,未预料到YU7爆单升级了汽车市场竞争态势[1] - 计划将车型平台大迭代周期从四年缩短至两年,并已动员供应链配合此加速计划[1] - 未来车型将加大区分度,不再仅依靠配置差异,而是通过设计定义进行区分[1] 研发体系改革 - 反思过去过度强调研发费效比,导致收入下降时研发投入随之压缩,认为MEGA失利后立即裁员严重打击士气[1] - 计划淡化费效比考核,研发技术部门正酝酿成立独立体系,类似小米汽车架构部,作为一级部门直接向集团董事长汇报,以参与更多产品创新[1] 出海战略 - 公司认为最大失误是全力出海启动过晚,计划全面加快官方海外市场布局[1] 人工智能投入方向 - 计划继续加大AI投入,特别是推理算力的储备[1] - 第二代芯片预计两年后推出,将更侧重推理能力[1] - 对AI的探索不局限于与产品融合,还将对机器人、AI终端应用等领域做大量投入[1]
理想各项目负责人微博梳理|截至25年11月18日
理想TOP2· 2025-11-18 09:39
公司核心团队与沟通策略 - 公司鼓励技术负责人通过社交媒体直接与用户沟通,以优化产品迭代闭环效率,例如理想整车电动产品负责人唐华寅的微博账号关注数从10.4万增长至13.3万,并积极回复用户技术疑问[2] - 第一产品线负责人老汤哥通过原创长文字/视频内容获得大量关注,微博关注数从23.2万大幅增长至61.7万,活人感非常强[2] - 产品营销负责人硬哥是公司员工中除创始人外关注者最多的账号,关注数从165.8万增长至187.3万,外号千币侯[4] 产品线负责人特质与贡献 - 第二产品线负责人张骁虽内向且微博内容少,关注数从9641增长至2.1万,但曾在李想反对下成功说服其保留L7产品线,并敢于当面拍桌子[5] - 第三产品线负责人李昕旸关注数从9434增长至5.9万,特别热爱汽车本身,同时担任公司财报电话会议的英文翻译[6] - 高级副总裁范皓宇自我介绍倾向产品经理,其与飞猪合拍的视频显示团队对智能座舱有超越李想需求的独立想法,并有利润之上的追求[7] 技术研发与创新重点 - 自动驾驶负责人郎咸朋关注数从7512增长至8433,长期被外界评价为水平最低,但随着公司自动驾驶水平提升口碑好转,其信任并欣赏李想的做事风格[9] - 材料技术负责人吉超超有材关注数从2.4万增长至7.9万,是公司最有创作激情的账号,不断优化视频封面并主动进行跨部门合作拍视频[11] - 智能空间产品负责人胡含关注数从4140增长至4904,分享较多对智能空间细节的思考,如儿童成语接龙功能注重寓教于乐而非竞技的设计[17] 制造与质量管控进展 - 制造工程负责人徐爸关注数从9246增长至2.4万,近期发布大量制造相关长文字或工厂视频,信息质量较过去明显提升[12][13] - 虚拟开发与验证负责人东哥聊车关注数从2887增长至2.2万,非常高频发布微博内容,但低信息密度转发占比过高[15] - 电池性能开发负责人罗博士关注数从1716增长至8322,从2025年10月开始有信息量的内容占比变多[16] 智能驾驶与安全技术发展 - 智能驾驶产品经理陈两把关注数从5.3万增长至6.9万,喜欢高频使用"帅比们"称呼用户,会分享智驾功能与用户价值内容[19] - 智能驾驶产品负责人韩龄关注数从4415增长至4969,侧重发布智驾产品信息,内容广告感较浓,可通过只言片语推测进度[19] - 主动安全负责人杨杰关注数未统计目前1023,最近3个月多次提及特斯拉FSD,显示对行业技术的关注[23] 员工成长与文化认同 - 整车电动产品经理吴限作为入职一年多的校招生,关注数目前1.2万,微博显示对公司的认同度高且认为自己成长很快[20] - 品牌部员工静静关闭弹幕起步负责L6789 MEGA发布会讲稿,其同名视频号分享的内部片段短视频情感浓度非常强[17] - 增程系统负责人增程强哥于2025年4月7日开通微博,关注数从4190增长至5.9万,内容形式包括增程器科普和活人感感受[11]
理想汽车基座模型团队近期斩获12篇顶会论文
理想TOP2· 2025-11-18 09:39
文章核心观点 - 公司在2025年三季度以来,其基座模型团队在人工智能基础研究领域取得重大进展,共有12篇高质量研究论文入选AAAI、NeurIPS、EMNLP、ACM MM、ICCV五大国际顶级AI学术会议 [4][6] - 这标志着公司正从传统车企向AI科技公司转型,通过深度布局人工智能基础研究,为智能汽车的下一代技术革新奠定基础 [6] - 研究成果呈现技术深度、应用广度和生态协同三大特点,技术正在从实验室走向量产车,形成“研究即产品,产品即研究”的双向循环 [9][51] AAAI 2026 研究成果 - 提出首个跨历法时间推理测试基准(SPAN),覆盖6种历法的10个历法推理方向,并采用创新的模板驱动的动态评估协议 [8] - 提出全新评测基准(LexInstructEval),通过建立形式化语法规则将复杂自然语言指令分解为机器可读的标准结构,以评估大型语言模型精确遵循复杂指令的能力 [11][13] - 提出SRSplat框架,一种仅需少量低分辨率视图即可重建高分辨率3D场景的前馈式框架,在多个数据集上的性能优于现有方法 [14][15][16] - 其中一篇SRSplat论文被选为Oral报告 [6] NeurIPS 2025 研究成果 - 提出类脑运动规划框架(NeuroMP),通过模拟人类大脑的路径寻优方法,以视觉空间感知和语义-情景协同决策解决车辆的感知-决策困境 [18][22] - 提出针对多角色姿态驱动动画的系统性解决方案(EverybodyDance),基于身份匹配图架构解决身份对应问题,在身份对应准确性和视觉保真度上显著超越现有方法 [23][24][25] EMNLP 2025 研究成果 - 提出新的评测框架(Collab-Overcooked)以评估大型语言模型多智能体协作能力,将协作解构为发起和响应两个关键阶段并设计细粒度过程化指标 [27][29][31] - 提出含数据集与预训练策略的解决方案(HED-COLD)以提升冒犯性语言检测模型对谐音攻击的防御能力,该方案在多个基准上均达到最优性能 [30][33][34] - 其中一篇Collab-Overcooked论文获得Senior Area Chair Highlight荣誉 [6][26] ACM MM 2025 研究成果 - 提出首个专门针对大型视觉-语言模型的跨模态知识一致性评测基准(PRISM),系统性地揭示并评估模型产生矛盾回答的知识不一致性现象 [36][38] - 提出VL-DynaRefine框架,通过实时验证与两阶段优化机制,让视觉语言模型在推理步骤中动态检测并纠正错误,在多项视觉任务上取得领先性能 [39][41] ICCV 2025 研究成果 - 提出业界首个大规模高质量人脸视频数据集DH-FaceVid-1K,具备多种族、高质量、大容量等特性,对视频生成领域有重要贡献 [43][45] - 提出全新的图像定制化微调范式QR-LoRA,训练参数为普通LoRA的一半,微调速度更快,可用于多属性组合生成等定制化场景 [46][48] - 提出自适应VLM Token压缩与推理加速方法Twig,通过Token剪枝和自投机解码策略,在长问答任务上可实现1.5倍的提速 [47][50] 技术应用与生态建设 - 研究成果已开始赋能实际产品,例如跨历法时间推理应用于AI日历,语言安全技术保障座舱交互安全,3D重建技术支撑辅助驾驶场景理解 [9][51] - 公司与10余所顶尖高校建立深度合作,形成“高校出理论、企业给场景、联合攻难关”的产学研新模式 [9]
李想详细阐述理想未来3-6年战略核心思路
理想TOP2· 2025-11-17 13:00
公司战略核心与规模驱动 - 公司战略的核心是规模,规模变化受三个关键变量影响:用户需求、技术产品、组织能力 [5] - 公司2024年收入达1450亿元人民币,2025年预计将超过1000亿元人民币 [5] - 为实现更大规模,公司计划拓展产品线,包括推出轿车和更丰富的MPV车型,同时有效控制SKU数量 [6] - 当汽车实现全自动驾驶后,将成为人工智能时代营收最高的终端,单一企业营收可能达到千亿美元级别,超过中国所有手机厂商收入之和 [7] 人工智能时代终端定义与布局 - 人工智能时代的终端需具备四个特点:360度物理世界感知能力、认知决策能力、执行能力、自我反思反馈能力 [8] - 公司目标是成为全球领先的人工智能终端企业,未来进入的任何终端都必须符合以上四个特点 [14][18] - 除了汽车,公司也在研究其他AGI终端可能性,如穿戴设备(眼镜)和家庭机器人,但具体节奏取决于行业进展和技术成熟度 [25][26] - 公司从人工智能公司到人工智能终端企业的定位变化,是明确战略选择的结果 [15] 技术产品演进路径 - 软件层面需具备三大能力:优秀的模型能力(尤其需理解物理世界)、实时并行操作系统能力、高效的工具生态 [18][19] - 硬件层面将发生三大变化:自研线控系统等本体变化、强化终端NPU本地推理能力、制造环节变革(工厂机器人化) [20][21] - 操作系统需满足实时性要求,不能采用安卓的任务排列式或Autosar的链式架构,而要并行且实时 [19] - 服务层面需解决AGI运营以及AGI与人连接的问题,传统IT软件无法有效管理Agent [22][23] 组织能力学习与进化 - 公司发展分为三个阶段:第一阶段学习丰田工作法、GM研发流程、谷歌OKR,实现理想ONE超100亿美元营收 [10] - 第二阶段学习华为IPD及三支柱模式(财务/流程/人力资源),借助L系列产品实现年营收超1000亿元人民币 [11] - 第三阶段计划学习苹果,借鉴其从电脑公司成功转型为多终端及服务生态公司的能力 [12][13] - 组织能力建设与规模直接相关,千亿规模后需要构建万亿收入公司级别的能力 [9] 关键业务举措与成本考量 - 公司开展操作系统、芯片、基座大模型等自研项目,主要目的是为了降低成本,当前千亿收入规模下进行这些投入是合理的 [29] - 自研操作系统虽投入10亿元人民币,但预计可节省成本50-60亿元人民币,具备经济合理性 [29] - 公司认为实现L4级自动驾驶后,可用5-10万人员规模实现1000亿美元营收,从而证明人工智能战略的价值 [28] - 对AGI在制造业的应用,应关注生产效率提升而非简单替代人工,因为工厂人力成本占比不高且就业有必要性 [21] 风险与生存基础 - 公司生存依赖于三个基础:把握用户需求、掌握最好的产品和技术、强大的组织能力,任何一方面出问题都会导致公司消失 [30] - 公司承认当前市场给予其汽车公司估值是合理的,因为人工智能能力带来的价值尚未充分体现 [28] - 公司强调基本功的重要性,在人工智能时代能力建设没有捷径,必须脚踏实地 [29]