Workflow
蒙特卡洛图搜索(MCGS)
icon
搜索文档
AI智能编程新框架,节省一半时间就能“聪明”地写代码丨上海AI Lab&华师大
量子位· 2025-10-17 09:45
文章核心观点 - 大语言模型在代码生成方面表现出色,但在需要持续迭代和性能调优的机器学习工程场景中仍存在差距 [1] - AutoMLGen框架通过融合通用大模型推理与领域知识,实现了AI智能体从"代码生成"到"算法优化"的能力转变 [3][4] - 该框架在MLE-Bench基准测试中以12小时计算预算实现36.4%平均奖牌率和18.7%金牌率,性能优于现有方法 [4][21] AutoMLGen框架设计 - 框架由领域知识库、蒙特卡洛图搜索和细粒度算子库三大模块组成,构建经验指引→智能探索→方案精修的自进化闭环 [10] - 领域知识库覆盖模型层、数据层与策略层,为智能体提供经验启发,有效缓解冷启动问题 [11][12] - 蒙特卡洛图搜索通过分支—节点动态融合打破传统MCTS的孤立局限,实现轨迹复用和跨分支聚合 [4][13] - 细粒度算子库定义了解法之间的演化方式,为图搜索提供通用的演化逻辑 [17] 技术创新亮点 - MCGS图搜索具备四种核心机制:主扩展、分支内演化、跨分支参考和多分支聚合 [14][16] - 框架实现了从"线性树"到"图式网络"的跃迁,让智能体具备跨分支学习与多解融合能力 [14] - 系统能在动态试探与自我修正中实现经验迁移,使智能体从"新手"进化为"专家型AI" [12][18] 性能表现 - 在MLE-Bench测试中仅用标准时长一半的计算预算(12小时),达到36.4%平均奖牌率和18.7%金牌率 [4][21] - 在MLE-Bench-Lite测试中以62.1%的奖牌率领先现有方法,体现出一致的性能与出色泛化能力 [22][23] - 消融实验显示各模块在性能提升中均发挥关键作用,知识库提供方向指引,演化机制实现反思与修正 [24] - 框架在不同基础模型上展现优异适配性,更强的基模型带来更高上限 [25] 案例分析与应用前景 - 典型案例展示系统从问题理解到方案实现的全过程,具备自主进化能力 [28] - 性能曲线快速收敛并持续上升,始终高于基线,展现动态优化与稳健成长能力 [27] - 该技术标志着智能体在复杂工程与算法设计任务中的能力演进,为AI向更高层次智能化奠定基础 [31] - 理念可向算法发现、科研自动化、工程设计等更广泛智能系统范式扩展 [31]