Workflow
蒙特卡洛树搜索
icon
搜索文档
图灵奖得主加持,蒙特卡洛树搜索×扩散模型杀回规划赛道|ICML 2025 Spotlight
量子位· 2025-08-01 04:23
核心观点 - 蒙特卡洛树扩散(MCTD)通过结合蒙特卡洛树搜索(MCTS)和扩散模型,解决了扩散模型在长程任务推理中缺乏可扩展性的问题,并在迷宫导航、机械臂操作等任务中表现优异,通关率高达100% [3][4][17] - Fast-MCTD通过并行MCTD和稀疏MCTD技术,将推理速度提升100倍,同时保持高性能,成为更实用的解决方案 [25][36][40] 方法创新 - **MCTD的核心机制**: - 将轨迹划分为独立子规划(如N=500划分为5个子轨迹),实现异步去噪控制 [9][11][12] - 通过MCTS的四个阶段(Selection/Expansion/Simulation/Backpropagation)动态平衡探索与利用,提升长程规划效率 [8][18] - **Fast-MCTD的优化技术**: - 并行MCTD:引入冗余感知选择(RAS)和批处理去噪,支持K个并发rollouts,提升GPU并行效率 [30][31][34] - 稀疏MCTD:通过轨迹粗化(下采样H步)减少子规划数量,降低搜索复杂度 [35] 实验结果 - **性能表现**: - 迷宫导航:MCTD在medium/large/giant地图中接近100%成功率,显著优于Diffuser等基线 [17] - 机械臂操作:MCTD-Replanning在双方块任务中将成功率从22%提升至50%,Fast-MCTD进一步将规划时间从38.8秒缩短至5.9秒 [19][39] - 视觉迷宫:Fast-MCTD比MCTD快25-60倍,且在更大迷宫中性能更优 [39] - **效率提升**:Fast-MCTD在特定任务中实现80-110倍加速,性能损失极小 [36][40] 研究背景 - 论文由KAIST博士生尹在植主导,指导老师安成镇(Sungjin Ahn)为贝叶斯推理与深度学习专家,曾师从Yoshua Bengio [41][43] - 相关论文入选ICML 2025 Spotlight,开源代码及学术主页已公开 [4][45]
芯片设计效率提升2.5倍,中科大华为诺亚联合,用GNN+蒙特卡洛树搜索优化电路设计 | ICLR2025
量子位· 2025-04-09 08:58
芯片设计逻辑优化技术突破 核心观点 - 中科大与华为联合研发的CMO框架通过神经符号函数挖掘技术,将传统逻辑优化算子效率最高提升2.5倍[2][4] - 该技术采用图神经网络与蒙特卡洛树搜索结合的创新方法,实现电路逻辑的智能"剪枝",已集成至华为EMU逻辑综合工具[4][6] - 在工业测试中,CMO使超大规模电路Sixteen的运行时间从78,784秒缩减至32,001秒,效率提升59.4%[34] 技术背景 - 逻辑优化是EDA核心环节,通过减少电路规模与深度提升芯片PPA性能,但传统启发式算法存在30%无效转换[5][8] - 现有打分函数方案中:人工设计泛化性差,GNN方案依赖GPU且缺乏可解释性[5][11] - 行业痛点集中在推理效率(CPU环境GNN推理耗时占比达30%)与模型可靠性[11] 方法论创新 - 提出CMO框架: - 结构-语义特征分解策略,将高维特征分离为连续/离散两类分别处理,降低搜索复杂度[19] - 教师-学生范式:GNN教师模型指导符号函数学生模型,融合泛化性与轻量化[30][31] - 开发GESD方案: - 蒙特卡洛树搜索结合数学/布尔运算符,支持{+−×÷log exp sin cos}与{与或非}运算[27] - 创新奖励函数设计,通过ηT/(1-L)公式平衡标签准确性与教师知识迁移[32] 性能验证 - 效率指标: - Hyp电路深度从8,259层优化至5,762层,延迟降低30.23%[34] - 关键算子Mfs2实现2.5倍加速,10分钟任务缩短至4分钟[4][6] - 质量指标: - 2CMO-Mfs2模式通过多次迭代,进一步改善电路规模与深度[34] - 在EPFL/IWLS/工业数据集上全面超越GPU方案与人工设计[6][34] 应用落地 - 技术已部署于华为自研EDA工具链,支持国产化替代[4][6] - 论文入选ICLR 2025,作者团队来自中科大MIRALab与华为诺亚方舟实验室[2][37]