蒂宾根大学本次发布的数据集InHabitants,InHabitants是由蒂宾根大学人工智能中心等机构联合创建的大规模3D人-场景交互数据集,包含约78,000个样本,覆盖800个建筑级场景。该数据集通过创新的渲染-生成-提升流程自动生成,整合了3D场景几何、SMPL-X人体模型和RGB图像,实现了场景感知的多样化人体交互合成。数据来源于Habitat-Matterport3D数据集,经过视觉语言模型和图像编辑模型的联合处理,最终优化为物理合理的3D人体姿态。该数据集旨在解决3D场景理解中真实人-环境交互数据稀缺的问题,可广泛应用于机器人导航、虚拟现实和计算机视觉等领域。





_1769672084863.jpg)