康奈尔大学本次发布的数据集MegaDepth-X (MD-X),MegaDepth-X是由康奈尔大学和哈佛大学联合构建的大规模3D重建数据集,作为MegaDepth的升级版,其规模扩大7倍至1865个场景、44万张图像。该数据集通过互联网照片集合构建,经过严格的动态内容过滤、多视角立体匹配优化以及单目深度引导的深度图修复,最终生成高精度稠密深度信息。其创新性在于采用MASt3R-SfM框架解决视觉相似场景误匹配问题,并引入稀疏感知采样策略模拟长尾分布场景特性,旨在提升3D基础模型在稀疏、噪声图像条件下的重建鲁棒性,特别针对对称场景和重复结构等挑战性场景。





_1769672084863.jpg)