德克萨斯大学达拉斯分校本次发布的数据集ActionGenome4D,ActionGenome4D是由德克萨斯大学达拉斯分校和印度理工学院德里分校联合构建的4D时空场景数据集,通过升级Action Genome视频数据形成。该数据集采用π3模型进行单目视频的3D重建,生成世界坐标系下的定向3D边界框,并包含遮挡或相机运动导致的暂时未观测对象的密集关系标注。数据集包含几何标注(GDINO检测+SAM2分割)和语义标注(基于VLM的关系伪标注),旨在支持世界场景图生成任务,解决传统帧中心方法在物体消失和时空一致性方面的局限性,适用于机器人交互和物理推理等需要长期场景理解的领域。
README内容:
关于德克萨斯大学达拉斯分校,德克萨斯大学达拉斯分校(University of Texas at Dallas)是美国德克萨斯大学系统下的一所公立研究型大学,成立于1969年。该校以计算机科学、工程、管理和自然科学等学科闻名,是美国近年来发展最快的研究型大学之一。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)