华盛顿大学本次发布的数据集CapNav,CapNav是由华盛顿大学团队构建的能力条件导航基准数据集,旨在评估视觉语言模型在复杂室内环境中考虑不同代理移动约束时的导航性能。该数据集包含45个真实3D扫描室内场景、473个导航任务和2365个问答对,总计5075条可遍历性标注。数据通过人工标注3D场景导航图和代理移动能力参数构建,涵盖五种典型人类和机器人代理配置。该数据集主要应用于具身智能和辅助机器人领域,解决现有导航系统忽视代理物理约束的关键问题,推动能力感知的智能导航技术发展。
README内容:
关于华盛顿大学,华盛顿大学(University of Washington)是一所位于美国华盛顿州西雅图的公立研究型大学,创建于1861年,是美国西岸最古老的大学之一。该校以医学、工程、计算机科学等领域的研究著称,拥有强大的科研实力和丰富的学术资源。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)