世界模型

搜索文档
21对话|卓驭陈晓智:用有限算力做极致性能,这是我们血液里的东西
21世纪经济报道· 2025-05-10 00:36
公司技术路线与产品策略 - 公司定位为软硬一体供应商,通过自研硬件和软件实现极致成本控制,如补盲雷达成本控制在千元以内[1][5] - 采用7V+32TOPS低算力配置实现城市记忆领航、高速领航驾驶功能,对比行业主流254TOPS方案显著降低成本[1][7] - 推出基于英伟达Thor平台的VLA大模型,单颗700TOPS域控成本低于双OrinX(500TOPS×2)方案[3][6] - 2024年推出"成行平台"提供7V/9V方案,通过BEV+双目视觉技术降低对高精地图与激光雷达依赖[2] 市场定位与客户拓展 - 聚焦8万-15万元中低端市场,已实现8万元车型标配高阶智驾功能[1][3] - 2024年合作客户包括一汽、大众、比亚迪等9大车企,20余款车型量产+30款待量产[2] - 计划拓展豪华品牌及海外客户,推进本土化车型合作[7] 核心技术突破 - 强化"视觉优先"策略,认为激光雷达主要起安全冗余作用,2024年将量产激目1.0系统[5] - 世界模型技术实现"千人千面"个性化驾驶,通过思维链推理生成N种未来场景进行决策[12][15] - 强化学习与模仿学习结合提升安全性,可使长尾场景处理能力提升一个数量级[13][17] - 2024年技术重点为强化学习与世界模型落地,预计年内实现L2级更自然的车位自主寻找功能[12][20] 行业趋势判断 - 中低端市场将成为2025年智驾主战场,公司在该领域具备先发优势[3] - 世界模型将成为2024-2025年行业技术升级方向,推动端到端驾驶体验革新[19] - L3落地需以L2功能完善为前提,当前重点为硬件预埋而非商用推广[9][10]
MCP:AI时代的“万能插座”,大厂竞逐的焦点
36氪· 2025-04-29 08:11
MCP协议技术发展 - MCP协议由Anthropic于2024年11月提出,旨在为大模型与客户端提供标准化接口,实现外部数据源和工具的高效安全调用[1] - MCP协议类比USB-C接口,实现"一次封装全球可用",使AI模型能像搭积木一样便捷调用外部工具,降低接入成本50%以上[2] - 百度发布全球首个电商交易MCP和搜索MCP,开发者可快速调用商品搜索、交易处理等功能[2] 科技巨头MCP生态布局 百度 - 2025年Create AI大会发布文心大模型4.5 Turbo和X1 Turbo,全面支持MCP[3] - 百度智能云千帆平台集成MCP Server,实现从书籍推荐到购买的全流程操作[3] - 百度地图于3月21日成为最早兼容MCP的地图应用[3] 阿里 - 阿里云百炼MCP平台提供50+预置服务,构建商业闭环[5] - 支付宝、高德地图等核心应用接入MCP,形成生态协同效应[5] 腾讯 - 腾讯云TI平台支持MCP插件托管,聚焦微信生态和支付工具[7] - 通过MCP在微信小程序集成AI聊天机器人、智能推荐等功能[7] 字节跳动 - Coze空间集成MCP协议,实现Excel处理、PPT生成等基础功能[9] - 通过MCP调取高德地图、飞常准等工具,自动化生成旅行攻略[9] AI网络与物理世界连接 - 谷歌通过Google Earth将实体世界转化为三维数字模型[12] - 英伟达与软银推进AI-RAN解决方案,构建日本AI基础设施[12] - 特斯拉"世界模型"构建高精度物理环境模拟系统[12] - SpaceX星链通过低轨卫星实现全球互联网覆盖[12] 自动驾驶领域应用 - MogoMind大模型实现物理世界实时数字孪生映射[13] - 多模态感知层实现400米无死角覆盖,误差控制在厘米级[13] - 边缘云协同架构将决策时延控制在100ms以内[13] MCP未来发展趋势 - 当前MCP生态存在割裂,未来可能实现跨厂商融合[16] - MCP将与量子计算、区块链等新技术结合拓展应用场景[16] - 百度、阿里等大厂推动MCP技术发展,重塑AI开发范式[16]
2025上海车展:当智驾不再让人兴奋,汽车智能化暗战升级
新浪财经· 2025-04-29 07:10
文章核心观点 - 2025年上海车展车企在技术、商业与社会效益中寻求平衡,汽车行业回归产品和用户核心本质,L3自动驾驶受关注,智驾技术升级,车企面临自研与合作挑战,需精准把握用户需求以穿越周期 [1][23] 车展变化 - 2025年上海车展少了拉踩引战和喧嚣,在技术、商业与社会效益中寻求平衡,反映车企对销量的渴求与焦虑,行业回归产品和用户核心本质 [1] L3自动驾驶进展 - 车展前一天华为联合11家车企谈L3,华为发布ADS 4.0乾坤智驾系统及高速L3商用解决方案,判断2025年L3具备商用能力 [2] - 小鹏、理想等车企将2025年实现L3级有条件自动驾驶落地作为目标,广汽今年四季度启动首款L3自动驾驶车型量产上市,奇瑞2026年实现量产L3级自动驾驶车辆,长安2026年实现全场景L3级有条件自动驾驶 [2][3] 自动驾驶分级及区别 - 汽车驾驶自动化技术分为L0 - L5的6个等级,L3级为有条件自动驾驶,特定条件下车辆自主完成驾驶任务,驾驶员为监督者 [3] - L2级辅助驾驶阶段驾驶员掌控主导权,系统特定场景协助,需时刻监控车辆;L3级车辆控制权逐渐让渡给系统,特定条件下独立完成任务,驾驶员必要时接管 [4][5][7] - L3级相比L2级在驾驶任务执行主体、驾驶员参与度和系统自主性上有本质区别,对技术架构提出感知融合、决策算法、冗余安全三大核心挑战 [9] 智驾技术升级 - 智驾研发技术从“端到端”升级至“世界模型 + 强化学习 + 云端蒸馏”方案,“端到端”技术有响应速度快等优点,但存在安全边界难界定等问题 [10] - 世界模型为人工智能系统提供内部环境模拟,能预测外部世界状态变化,在强化学习和自主决策系统中显示出强大潜力,多家车企和公司提出该概念 [12][14] - 汽车行业超90%企业进行AI大模型相关技术试点或应用,多个品牌接入DeepSeek,结合蒸馏训练可构建智能系统,提高思考和推理能力 [15] 责任认定变化 - 《深圳经济特区智能网联汽车管理条例》规定L3级开启状态下事故,驾驶员通常为第一责任人,因车辆质量缺陷造成可向生产者、销售者追偿;《北京市自动驾驶汽车条例》规定系统激活期间事故车企承担主要责任,驾驶员未及时接管承担部分责任 [16] 智能辅助驾驶系统 - 智能辅助驾驶系统是“人 - 车 - 路 - 云”协同体系一环,需多方配合,探索相关技术综合应用和路侧信息发送机制可提升安全性 [17] 车企自研情况 - 车企自研渐成趋势,用户对智能座舱和辅助驾驶提出更高要求,不同类型车企自研决策有不同侧重和优先级 [18][19] - 车企更适合自研核心竞争技术、差异化技术、高成本技术部件,蔚来提出智能汽车“新三大件” [20] - 车企需在自研与配套间找到平衡点,做好战略规划和优先级设定,采用分阶段研发和投资策略,与其他企业合作联盟 [22] 行业发展趋势 - 新势力车企需平衡流量与安全,传统车企补齐智能化短板,合资品牌证明电动化进化,品牌跃升需精准理解和兑现用户需求 [23]
王晓刚:物理世界模型用于驾驶辅助训练很重要
新浪财经· 2025-04-24 09:04
上海车展与行业趋势 - 上海车展于4月23日开幕 主题为"拥抱创新 共赢未来" 涵盖传统燃油车、新能源车、智能驾驶和供应链技术等领域 高阶智驾、AI大模型和多模态感知等前沿技术加速落地 [1] 供应链成本控制策略 - 保证产品品质和安全性是第一位 通过扩大智驾市场合作量产车辆分摊智能驾驶系统成本 [3] - 行业逐渐形成硬件配置共识 车厂注重传感器型号平台化 减少对特定车型的重复开发和适配工作 [3][4] 技术突破方向 - 生成式智驾是未来重要趋势 利用世界模型重建物理场景 通过仿真环境复现问题场景并生成大量危险场景数据 解决端到端模型的数据局限性和不确定性问题 [5][6] - 多模态大模型改变智能座舱交互形态 具备深度思考能力 支持多轮多人对话和观点综合 打破传统一对一交互模式 [6][10] 数据有效性分析 - 99%的用户真实数据对训练模型没有帮助 因为90%的驾驶数据是匀速直线行驶 缺乏信息增量 只有踩刹车、避让或拐弯等场景的信号才有效 [7] - 复杂场景中80%的驾驶行为可能停止 仅少数高水平驾驶者能顺利通过 这些是高质量数据 类似GPT等大模型也需筛选互联网数据 删除90%以上低质量数据 [7] 模拟数据应用 - 模拟仿真解决驾驶行为生成问题 通过强化学习改进模型 但困难场景仍需寻找 类似DeepSeek面临难问题稀缺的挑战 [8] - 模拟数据需保持硬件系统时空一致性 例如11个摄像头生成的视频轨迹必须一致 避免训练问题 并可兼容设备故障 [8] 智能座舱产品进展 - 多模态识别功能已在某主机厂实现 更多新功能在上海车展展示 正在寻找量产机会 [9] - New Member产品支持多对多、多轮多人对话 能识别对话者身份并参与讨论 总结观点 实现根本性交互变革 [10] - 主动交互可应对长途驾驶犯困问题 如播放音乐或说话 但更需与驾驶结合确保安全 避免长时间聊天 [10][11] 行业变革节点 - 自动驾驶时代到来将根本改变座舱状态 解放人员自由度 [12] - New Member类聊天机器人可与手机等设备打通 实现无处不在的交互 [12] 软硬件开发生态 - 软硬一体可降低成本 但通用性更好的软件生态是关键 如英伟达GPU的强软件生态 [13] - 芯片厂商如英伟达、高通、MTK和英特尔均强调生态建设 软硬结合是趋势 但最优解仅在成本有优势 不影响纯软件开发公司 [13]
上海车展
数说新能源· 2025-04-24 06:29
智能驾驶行业趋势 - 主要公司弱化"智能驾驶"宣传,比亚迪将"天神之眼"改称为驾驶辅助,强调安全性 [1] - 理想等企业在产品发布中突出紧急情况下的用户安全性能 [1] - 行业技术竞争焦点从车端算力转向云端构建的"世界模型",小鹏、理想、华为、地平线等均在展示该技术 [2] 车企出海战略 - 中国车企在SUV/MPV等热门车型上新品发布增多,国内市场同质化趋势加剧 [2] - 欧美、日本、中东、东南亚等地记者和博主增多,反映中国智能电动车在海外市场竞争力强劲 [2] - 比亚迪出海战略重点发力东南亚市场 [8] 供应链与电池技术 - 主机厂在电芯采购上兼顾性能与成本 [5] - CATL储能市场增速高于动力电池市场 [10] 行业社群与资源 - 提供锂电行业社群加入渠道,可获取行业动态、干货报告及人脉资源 [11]
商汤绝影打造智能驾驶新路标——生成式智驾R-UniAD,让安全更有确定性,超越人类驾驶极限
观察者网· 2025-04-24 01:18
.强化学习+世界模型,绝影构建VLAR技术架构,突破端到端瓶颈 .R-UniAD创新链路:挖掘复杂场景、4D仿真复现、强化学习、泛化验证 .近实时在线交互的4D世界模型"绝影开悟2.0",生成式智驾R-UniAD的核心基石 .绝影辅助驾驶目前已合作4家车企,上车7款车型,基于地平线征程6、英伟达DIRVE AGX Thor平台打造的方案将在今年上车东风、奇瑞等车企伙伴 随着辅助驾驶普及的不断深入,公众越来越关注驾驶系统的安全性,期待辅助驾驶带来更安全也更流畅的智慧出行体验。只是许多辅助驾驶方案在遇到新场 景时难以妥善处理,事故时有发生,暴露出当前技术方案的诸多瓶颈。 想要提高安全性,端到端模型需要海量高质量数据训练,然而,即使是百万量产车回流的数据量,极端场景有效信息提取率不足1%。 不仅如此,因为端到端的范式是模仿学习,遇到没有见过的新场景,它的驾驶决策存在很大的不确定性,安全边界模糊,给驾驶安全带来风险,更难以超越 人类的驾驶能力。 因此,商汤绝影发布了生成式智驾R-UniAD技术方案,将强化学习引入到智能驾驶,让端到端智驾与世界交互的不断深入,通过生成的方式真实还原并深度 理解驾驶环境,从而主动预测并处 ...
大模型驱动空间智能综述:具身智能体、智慧城市与地球科学的进展
欧米伽未来研究所2025· 2025-04-20 14:32
空间智能与大模型 - 空间智能是人类和机器对空间环境的感知、理解和运用能力,大语言模型(LLMs)展现出显著的空间智能潜力[2] - 大模型通过内化吸收(预训练数据)和外部调用(查询专业数据库)两种方式获取空间知识[3] - 大模型存在"幻觉"现象和知识动态更新困难等空间记忆方面的挑战[3] 空间推理能力 - 抽象空间推理包括定性空间推理、几何推理和图论推理三个关键方向[5] - 大模型在处理多步骤传递性推理和复杂几何逻辑推演时准确率显著下降[5] - 当前大模型主要利用语言建模能力"模仿"空间任务,而非真正拥有深层空间认知机制[5] 微观尺度应用(具身智能) - 多模态大语言模型(MLLMs)推动机器人空间感知与理解能力提升[7] - 大模型用于生成环境三维表征并规划复杂操作序列[7] - 机器人空间交互面临多模态信息融合和动态环境适应等挑战[7] 中观尺度应用(城市空间智能) - 大模型结合卫星影像、街景图片和POI数据理解城市功能特征[8] - 用于城市知识图谱构建、交通流优化和规划决策支持[9] - 面临数据异构性、动态环境适应和决策可解释性等挑战[9] 宏观尺度应用(地球空间智能) - 大模型处理地球观测数据用于气候变化预测和自然资源管理[10] - 在气候科学领域提升天气预报精度和极端天气预警能力[10] - 地理学应用中结合GIS工具增强专业空间分析能力[10] 未来研究方向 - 需要建立跨领域、跨尺度的通用空间智能评估框架[13] - 城市空间智能需发展实时数据整合和因果推理能力[13] - 地球空间智能需加强多学科数据融合和物理约束整合[13]
智元机器人首席科学家罗剑岚:如果机器人实现“操控”,是比大语言模型更高级的智能
每日经济新闻· 2025-04-02 07:35
公司合作与技术发展 - 智元机器人与Physical Intelligence(Pi)达成合作伙伴关系,将在具身智能领域展开深度技术合作,重点关注动态环境下的长周期复杂任务 [1] - 罗剑岚加入智元机器人并全面领导具身智能研究中心,同时推进双方深度合作 [1] 机器人自主决策与智能等级 - 遥控与自主决策的核心差别在于机器人需具备感知、预测、行为生成的泛化能力,并建立Internal Model(世界模型)以预测未来和执行动作链 [1] - 机器人实现Manipulation(操控)的智能等级为7至8,远高于大语言模型(LLM)的3级 [1] 关键技术路径 - 强化学习和DeepSeek R1的推理能力是关键技术,但模仿学习不足,需结合世界模型预测环境变化 [1] - 核心挑战在于构建开放数据链的鲁棒策略,以及感知、预测、行为生成机制的泛化能力 [1] 数据收集与场景部署 - 人形机器人缺乏大规模应用场景数据,需通过部署产生数据循环(如1000台机器人在星巴克工作可快速积累数据) [1] - 机器人部署难度低于智能驾驶,可从封闭或半封闭空间开始,逐步生成数据 [1]
电动汽车百人会(2025)|博世吴永桥:中阶智驾将是标配,座舱才是车企主战场
中国经济网· 2025-03-31 02:40
中国经济网3月31日讯(记者 姜智文)"未来中阶智驾一定不是汽车的灵魂,而是标配,就像今天的安全 带、安全气囊一样。一旦成为标配后,主机厂没必要花费巨大的人力物力财力进行全栈自研,应该交给 供应商去做,座舱才是车企差异化竞争的主战场。"博世智能驾控系统中国区总裁吴永桥,在中国电动 汽车百人会论坛(2025)智能汽车创新技术与产业分论坛上表示。 据吴永桥介绍,今年2月,比亚迪发布了天神之眼标配中阶智驾,算力达到80—150TOPS,拥有高速领 航、城市记忆行车、全自动泊车等功能,并在8万—15万元标配此技术。 "在三年之内,8万—15万元车辆将标配80—150TOPS的中阶智驾,主机厂一定会放弃全栈自研。"吴永 桥预测,三年之后,高阶智驾逐步普及,在15万元以上车型中标配全领域领航,包括高速、城区、全自 动泊车等,以中国汽车"卷"的速度一定会快速实现。 吴永桥指出,中阶智驾的数据闭环和工具链,每年需要投入几个亿甚至数十亿,博世去年在智驾领域投 入接近20亿。中阶智驾成为标配后,以博世、元戎启行、华为和momenta为代表的Tier1供应商可以支持 七八个客户,几十款车型,甚至50—100个车型;主机厂投入100 ...
中国银河证券:推理算力重要性提升 光模块等算力细分赛道发展再加速
智通财经· 2025-03-24 08:58
文章核心观点 中国银河证券认为英伟达GTC 2025大会后硬件发展带动软件及大模型高景气,推理应用发展刺激算力需求,算力相关板块有较大投资价值,建议关注运营商、光模块、光芯片及AIDC相关等细分子板块 [1][4] 推理算力增长情况 - 英伟达CEO称通往AGI、具身智能机器人、构建Omniverse与世界模型及虚拟“平行宇宙”均需算力,2024 - 2025年美国前四云厂采购GPU芯片数量成倍数增长 [1] - Semianalysis数据显示如今模型处理token数量是之前20倍,计算量是150倍,Blackwell性能比Hopper提高68倍,成本降87%,Rubin计划性能提升至Hopper 900倍,成本降99.97% [2] 英伟达软硬件发展情况 硬件方面 - 发布基于Blackwell架构的升级版Blackwell Ultra,强调推理端重大进展,可为数据中心提供50倍增收机会 [3] - 明确26 - 27年及更远期发展规划,硬件性能加速提升 [3] - 展示基于1.6T硅光引擎的CPO交换机系列,硬件端性能将持续高质量全方位提升 [3] 软件方面 - 发布专注简化推理部署和扩展的开放AI引擎栈Nvidia Dynamo,或开创推理软硬件效率新范式 [3] - 发布Nvidia Llama Nemotron,望以其推理模型为基础,通过NVIDIA AIQ架构探索相关方向形成生态闭环 [3] 投资建议 - 推理应用发展刺激算力需求,当前市场认为推理应用增长挤压算力板块成长空间的判断或偏离实际 [4] - 建议关注运营商如中国移动、中国联通、中国电信等;光模块如中际旭创、新易国盛等;光芯片如源杰科技、仕佳光子等;AIDC相关如光环新网、数据港等 [4]