Workflow
原生3D分割
icon
搜索文档
业界首个高质量原生3D组件生成模型来了!来自腾讯混元团队
量子位· 2025-09-27 04:46
行业背景与应用场景 - 现有3D生成算法通常生成一体化模型,但下游应用需要语义可分解的3D形状,即每个组件需单独生成 [1] - 组件式3D生成主要应用于视频游戏制作管线:资产需绑定不同游戏逻辑(如汽车主体与可滚动轮子),组件拆分可降低下游算法(低模拓扑、UV展开等)处理难度 [1] - 3D打印行业受益:用户可逐组件打印并组装,提升制造灵活性 [2] 技术瓶颈与创新需求 - 现有组件式3D生成方法存在可控性不足、部件几何质量不佳及语义连贯性有限等问题 [3] - 腾讯混元3D团队提出Hunyuan3D-Part新范式,旨在实现可投入生产的高质量、可编辑且结构合理的组件生成 [4] 技术流程核心架构 - 整体流程分三步:基模型获取整体形状(Hunyuan3D V2.5/V3.0)→ 部件检测模块(P3-SAM)提取语义特征与边界框 → X-Part模块分解为独立部件 [6][7][8] - 技术亮点包括:业界首个原生3D分割模型P3-SAM(摆脱2D数据依赖)及工业级组件生成模型X-Part(重构生成质量与可控性标准) [10][11] P3-SAM模型技术细节 - 基于Point- Promptable Part Segmentation架构,简化SAM体系结构,仅采用单一正点提示实现全自动分割 [13] - 特征提取器采用PointTransformerV3,融合多层级特征,结合FPS点提示与NMS算法优化掩码合并 [14][16] - 完全依赖原生3D部件监督训练,构建含370万个高质量部件级掩码的数据集,显著提升模型鲁棒性与精确性 [18][19] X-Part模型技术优势 - 利用P3-SAM输出的包围盒作为部件级提示,提供粗粒度引导,避免过拟合并增强部分可见部件的体积信息 [21][22][23] - 引入高维点级语义特征扰动机制,确保语义连贯性与结构一致性 [24] - 生成结果在PartObj-Tiny、PartObj-Tiny-WT和PartNetE数据集上超越竞品:Fscore-0.1达0.80(竞品最高0.68),Fscore-0.5达0.71(竞品最高0.57) [26][28][29] 性能评估与可视化效果 - 在8类物体(人类、动物、日用品等)分割任务中,P3-SAM全自动分割平均精度达59.88%,交互模式下达51.23%,显著优于Point-SAM的13.00% [29] - 生成效果可视化显示,X-Part在结构细节保真度、语义一致性及组件分离精度方面均优于开源与闭源竞品模型 [34][36][38] 资源开放与访问途径 - 代码与权重已开源:Git仓库(https://github.com/Tencent-Hunyuan/Hunyuan3D-Part)及Hugging Face平台(https://huggingface.co/tencent/Hunyuan3D-Part) [41] - 提供轻量版(Hugging Face Demo)与满血版(混元3D Studio)体验入口,技术论文同步发布于arXiv [42]