Workflow
三维感知
icon
搜索文档
前馈3D高斯泼溅新方法,浙大团队提出“体素对齐”,直接在三维空间融合多视角2D信息
量子位· 2025-09-29 04:57
核心观点 - VolSplat通过体素对齐策略突破像素对齐方法的局限性 显著提升三维重建的视觉质量与几何一致性 并展现出优异的工程化潜力与跨数据集泛化能力 [2][4][15] 技术突破 - 采用体素对齐框架替代像素对齐策略 在三维空间直接融合多视角特征 解决二维特征难以三维对齐及高斯基元数量受像素网格限制的问题 [2][6][7] - 通过三维体素网格实现多视角特征聚合与多尺度细化 天然消除视图间不一致性 并支持高斯基元根据场景复杂度动态分配 [7][9][13] - 在RealEstate10K数据集上PSNR达31.30(较最佳基线27.47提升13.9%) SSIM达0.941(较基线0.889提升5.8%) LPIPS降至0.075(较基线0.114改善34.2%) [5] - 在ScanNet室内数据集上PSNR达28.41(较基线27.45提升3.5%) SSIM达0.906(较基线0.829提升9.3%) LPIPS降至0.127(较基线0.222改善42.8%) [5] 工程化优势 - 模块化设计分为三阶段:2D特征与深度估计 像素到体素的反投影聚合 体素级特征细化与高斯回归 便于分步调试与系统优化 [9][11][12][14] - 支持与外部3D信号(深度图 点云)自然融合 无需复杂投影操作 提升系统扩展性 [13] - 使用稀疏3D U-Net进行多尺度几何上下文融合 以残差形式预测体素修正项 提升计算效率与稳健性 [14] 应用前景 - 在机器人及自动驾驶领域可提供更稳定的三维感知输入 [19] - 在AR/VR领域可实现更流畅真实的渲染体验 显著减少浮空伪影与几何畸变 [17][19] - 在三维视觉研究中为多模态数据融合提供新途径 具备跨数据集零样本泛化能力(ACID数据集PSNR达32.65dB) [15][19]
中国科研人员发明新型激光雷达 让三维感测更快更准
新浪财经· 2025-09-14 04:57
华中科技大学14日发布消息,该校联合清华大学、北京信息科技大学,研发一种全新的"双模态"激光雷 达系统,为自动驾驶汽车、机器人、无人机等设备的三维感知能力带来进一步提升。 相关成果于近日 发表于国际光学期刊《光:科学与应用》(Light:Science & Applications)。 ...
三维感测“眼睛”升级,我国科研人员发明新型“双模态”激光雷达
新京报· 2025-09-14 03:05
华中科技大学智能微系统团队介绍,该方案的核心在于一种名为"混合级联平动超表面"的器件,由两层经过特殊 设计的纳米镜片组成。通过改变入射激光的偏振态,系统可以在高精度扫描模式和闪光模式之间自由切换。在扫 描模式下,系统能够精确捕捉远处目标的细节;而在闪光模式下,则能一次性均匀照亮整个视野,瞬间完成三维 成像。 这种硬件方案使得该系统能够根据实际需求自动切换工作模式。它可以先用闪光模式快速获取环境信息,然后自 动判断哪些区域需要精细扫描,并切换到扫描模式进行重点探测。 新京报讯(记者张建林)记者从华中科技大学获悉,近日我国科学家成功研发出一种全新的"双模态"激光雷达系 统,提升了自动驾驶汽车、机器人、无人机等设备的三维感知能力。 这项成果由华中科技大学智能微系统团队联合清华大学、北京信息科技大学共同完成,并发表于国际顶级光学期 刊《Light: Science & Applications》上。 激光雷达作为各种新型智能无人设备的"眼睛",其性能至关重要。传统的激光雷达主要分为扫描式和闪光式两 种,前者精度高但速度慢,后者速度快但精度有限,如何兼顾二者优势,长期以来是研究难点。为了克服这一难 题,研究团队提出了" ...