中国香港中文大学 本次发布的数据集 RAGNet, RAGNet 是一个面向抓取的大规模推理式交互分割基准数据集,由香港中文大学、中国科学院计算技术研究所、Dexmal、阿联酋人工智能大学和澳门大学的研究人员共同创建。数据集包含 273,000 张图像、180 个类别和 26,000 条推理指令。这些图像覆盖了各种具身数据领域,包括野外、机器人、自我中心室内和模拟数据。图像被仔细标注了交互分割图,而语言指令的难度则通过移除类别名称并只提供功能描述而大大增加。RAGNet 的创建旨在解决当前研究中缺乏推理式大规模交互预测数据的问题,从而提高开放世界的有效性。数据集的应用领域是机器人抓取,旨在通过人类指令在多样性的开放世界场景中进行准确的物体交互分割。该数据集的创建过程包括收集各种来源的数据、使用多种工具进行交互分割标注以及利用大型语言模型生成推理指令。
README 内容:
关于 中国香港中文大学 , 中国香港中文大学是一所位于中国香港的公立研究型大学,提供多个学科的本科及研究生课程,是香港的教育和研究机构之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)