重大突破！斯坦福李飞飞推出空间智能模型Marble！单图&文本生成永久免费3D世界！

模型核心能力 - 基于单张图片或文本提示生成可永久存在、自由探索的3D世界，几何结构干净、风格丰富且支持场景拼接[4][5] - 核心技术包括场景几何结构解析与重建，能自主识别空间关系并还原隐藏区域，通过估算深度地图和识别几何边界确保物理空间逻辑合理[6] - 同步处理光照、材质、纹理等细节元素，通过训练学习图像特征与三维属性对应关系，实现全维度转化[6][7] - 生成的高斯点云格式相比传统网格模型大幅降低数据体积，支持跨设备适配，包括台式机、笔记本电脑、移动设备和VR头显[9] 技术优势对比 - 相比传统3D生成技术仅能提供简化场景，该模型可构建包含多层结构和复杂装饰的完整空间，避免加载中断或物体形变[9] - 与谷歌Genie相比，该模型以永久性场景生成为核心，无时间限制和探索范围约束，用户可自由切换视角并保存场景[10][12] - 谷歌Genie参数规模110亿，训练数据基于超20万小时二维游戏视频，但场景存在时效性且交互逻辑受限[14] 商业化应用潜力 - 在游戏开发中可将复杂场景搭建周期从数周至数月压缩至几分钟，仅需输入参考图即可生成基础3D框架[13][15] - 在VR内容创作领域直接适配VR头显，提供沉浸式探索体验，无需额外开发投入[16] - 在影视场景搭建中快速生成不同风格原型，帮助导演直观确认效果，降低后期修改成本[21] 当前技术局限 - 功能聚焦3D环境创建，暂不支持人物、动物等动态中心对象的生成，需借助其他工具手动导入[22] - 场景规模受限，仅能生成房间大小的3D空间，构建更大规模场景会出现加载延迟和细节丢失问题[24]