蒙特卡洛树搜索 - 财报，业绩电话会，研报，新闻

蒙特卡洛树搜索

搜索文档

图灵奖得主加持，蒙特卡洛树搜索×扩散模型杀回规划赛道｜ICML 2025 Spotlight

量子位· 2025-08-01 04:23

核心观点 - 蒙特卡洛树扩散（MCTD）通过结合蒙特卡洛树搜索（MCTS）和扩散模型，解决了扩散模型在长程任务推理中缺乏可扩展性的问题，并在迷宫导航、机械臂操作等任务中表现优异，通关率高达100% [3][4][17] - Fast-MCTD通过并行MCTD和稀疏MCTD技术，将推理速度提升100倍，同时保持高性能，成为更实用的解决方案 [25][36][40] 方法创新 - **MCTD的核心机制**： - 将轨迹划分为独立子规划（如N=500划分为5个子轨迹），实现异步去噪控制 [9][11][12] - 通过MCTS的四个阶段（Selection/Expansion/Simulation/Backpropagation）动态平衡探索与利用，提升长程规划效率 [8][18] - **Fast-MCTD的优化技术**： - 并行MCTD：引入冗余感知选择（RAS）和批处理去噪，支持K个并发rollouts，提升GPU并行效率 [30][31][34] - 稀疏MCTD：通过轨迹粗化（下采样H步）减少子规划数量，降低搜索复杂度 [35] 实验结果 - **性能表现**： - 迷宫导航：MCTD在medium/large/giant地图中接近100%成功率，显著优于Diffuser等基线 [17] - 机械臂操作：MCTD-Replanning在双方块任务中将成功率从22%提升至50%，Fast-MCTD进一步将规划时间从38.8秒缩短至5.9秒 [19][39] - 视觉迷宫：Fast-MCTD比MCTD快25-60倍，且在更大迷宫中性能更优 [39] - **效率提升**：Fast-MCTD在特定任务中实现80-110倍加速，性能损失极小 [36][40] 研究背景 - 论文由KAIST博士生尹在植主导，指导老师安成镇（Sungjin Ahn）为贝叶斯推理与深度学习专家，曾师从Yoshua Bengio [41][43] - 相关论文入选ICML 2025 Spotlight，开源代码及学术主页已公开 [4][45]

蒙特卡洛树搜索

扩散模型

长程规划

蒙特卡洛树扩散（Monte Carlo Tree Diffusion

MCTD）

快速蒙特卡洛树扩散框架（Fast Monte Carlo Tree Diffusion

蒙特卡洛树搜索

扩散模型

长程规划

蒙特卡洛树扩散（Monte Carlo Tree Diffusion

MCTD）

快速蒙特卡洛树扩散框架（Fast Monte Carlo Tree Diffusion

芯片设计效率提升2.5倍，中科大华为诺亚联合，用GNN+蒙特卡洛树搜索优化电路设计 | ICLR2025

量子位· 2025-04-09 08:58

芯片设计逻辑优化技术突破核心观点 - 中科大与华为联合研发的CMO框架通过神经符号函数挖掘技术，将传统逻辑优化算子效率最高提升2.5倍[2][4] - 该技术采用图神经网络与蒙特卡洛树搜索结合的创新方法，实现电路逻辑的智能"剪枝"，已集成至华为EMU逻辑综合工具[4][6] - 在工业测试中，CMO使超大规模电路Sixteen的运行时间从78,784秒缩减至32,001秒，效率提升59.4%[34] 技术背景 - 逻辑优化是EDA核心环节，通过减少电路规模与深度提升芯片PPA性能，但传统启发式算法存在30%无效转换[5][8] - 现有打分函数方案中：人工设计泛化性差，GNN方案依赖GPU且缺乏可解释性[5][11] - 行业痛点集中在推理效率（CPU环境GNN推理耗时占比达30%）与模型可靠性[11] 方法论创新 - 提出CMO框架： - 结构-语义特征分解策略，将高维特征分离为连续/离散两类分别处理，降低搜索复杂度[19] - 教师-学生范式：GNN教师模型指导符号函数学生模型，融合泛化性与轻量化[30][31] - 开发GESD方案： - 蒙特卡洛树搜索结合数学/布尔运算符，支持{+−×÷log exp sin cos}与{与或非}运算[27] - 创新奖励函数设计，通过ηT/(1-L)公式平衡标签准确性与教师知识迁移[32] 性能验证 - 效率指标： - Hyp电路深度从8,259层优化至5,762层，延迟降低30.23%[34] - 关键算子Mfs2实现2.5倍加速，10分钟任务缩短至4分钟[4][6] - 质量指标： - 2CMO-Mfs2模式通过多次迭代，进一步改善电路规模与深度[34] - 在EPFL/IWLS/工业数据集上全面超越GPU方案与人工设计[6][34] 应用落地 - 技术已部署于华为自研EDA工具链，支持国产化替代[4][6] - 论文入选ICLR 2025，作者团队来自中科大MIRALab与华为诺亚方舟实验室[2][37]