近年来,随着自动驾驶、低空无人机作业、城市数字孪生等场景的快速落地,视觉定位作为核心感知能力,其算法精度、复杂环境鲁棒性的标准化验证已经成为行业普遍面临的共性痛点。传统基于运动恢复结构(SfM)的评估方法在大规模城市场景下,普遍存在存储成本高、跨视角跨域适配性差、扩展性不足等问题,难以支撑复杂城市场景下多主体的定位算法测试需求。正是在这一行业背景下,2026年5月7日,由奥地利技术研究院联合布伦瑞克工业大学开发的城市场景视觉定位基准数据集egenioussBench正式首发于预印本平台arXiv,为行业提供了全新的标准化评估解决方案。
据公开信息显示,egenioussBench数据集配套了两类高精度地理空间参考数据,分别为高分辨率航空3D网格与CityGML LoD2模型,为定位验证提供了精准的三维空间坐标基准。数据集核心标注资源为2709张由智能手机拍摄的厘米级精度地面图像,所有图像均通过专业摄影测量束调整技术获取了独立于地图的真实坐标,在此基础上还划分出412张序列化验证图像与42张非共视测试图像,可覆盖连续行驶、视角无重叠等多种真实应用场景的测试需求。
该数据集的核心创新性在于首次实现了航空网格与简化城市模型的融合,可支持跨视角、跨域的定位算法验证,有效解决了传统SfM方法在大规模场景下的核心痛点。从典型应用场景来看,该数据集可作为标准化评估平台,为自动驾驶车辆城市道路定位算法测试、低空无人机城市作业导航精度验证、AR城市服务虚实匹配效果校准等多个方向提供数据支撑,降低相关技术研发的测试数据采集与标注成本,加速技术落地迭代。
作为数据要素市场中AI训练测试类数据的典型代表,高垂直场景适配性的基准数据集是人工智能技术迭代的核心基础设施。此次egenioussBench数据集的发布,填补了城市场景跨视角定位评估领域的供给空白,也为全球自主导航、计算机视觉领域的研发者提供了统一的评估标尺,对推动自动驾驶、低空经济等数字经济产业的技术成熟具有重要意义。





_1769672084863.jpg)