Program Search 纠错模块
搜索文档
SIGGRAPH Asia 2025 | 让3D场景生成像「写代码」一样灵活可控
机器之心· 2025-11-14 10:32
文章核心观点 - 生成式AI在3D场景生成领域出现范式转变,从直接输出几何参数转向生成可执行的程序化构建脚本,从而解决现有方法在逻辑一致性和物理合理性上的局限 [2][3] - 布朗大学与加州大学圣地亚哥分校的研究团队提出的Procedural Scene Programs框架,通过“从语言到程序再到场景”的新路径,使AI具备程序化建模能力,输出结果具备高度可编辑性、可复用性与结构可控性 [3][8] - 该框架结合了程序生成语言和自动纠错模块,在人类主观评测和自动评估中均显著优于现有方法,为AI构建3D世界提供了新的逻辑基础 [16][17][20] 研究方法与系统组成 - 系统采用两阶段设计:首先生成可执行构建脚本,再通过程序执行构建完整场景,核心思想是让AI输出生成逻辑而非静态几何 [8] - 系统包含两大关键组件:Procedural Scene Description Language负责定义场景结构与布局的生成逻辑;Program Search纠错模块负责在程序执行后自动检测并修复几何错误 [9] - PSDL语言嵌入在Python中,支持函数、循环、条件与变量绑定,使模型能够通过编写规则定义空间关系,例如“围绕桌子等角放置三把椅子” [10][11] 技术优势与性能表现 - Program Search模块无需反复调用大模型,直接在程序空间中搜索修复方案,平均仅需约7次程序修改即可修复大多数错误 [13][14] - 在70个开放世界场景提示的测试中,PSP在人类主观评测中对DeclBase和Holodeck的偏好率分别达到82.9%和94.3% [16][17] - PSP的生成速度更快,从文本到完整场景平均仅需约38秒,而对比方法DeclBase与Holodeck分别需要40.8秒和约42秒 [16] - 基于多模态LLM的自动化评估方法对PSP的偏好选择率分别为77.1%和90.0%,与人类主观偏好趋势一致 [17][18] 行业意义与应用前景 - 该技术让AI的“想象力”与“编程逻辑”深度融合,既保留了命令式生成的灵活性,又以符号化修正机制弥补了大模型在空间推理上的不足 [20] - 框架为3D内容生成带来了前所未有的可控性与自解释性,在虚拟城市、游戏关卡、具身智能的视觉环境等应用领域具有重要价值 [21]