中国科学院上海微系统与信息技术研究所 本次发布的数据集 Occluded Object Detection Dataset, 本研究构建了一个大规模的多模态链式思维数据集,包含超过110k个手持遮挡物体的图像-文本对。数据集基于ObMan数据集,引入了结构化的推理过程,包含描述阶段、自我反思阶段和最终决策阶段,以逐步提高对遮挡物体的识别能力。数据集旨在解决视觉语言模型中遮挡对象理解的问题,适用于多模态任务,如物体识别、场景理解等。
查看Occluded Object Detection Dataset
关于 中国科学院上海微系统与信息技术研究所 , 中国科学院上海微系统与信息技术研究所是中国科学院直属的研究机构,主要研究领域包括微电子学、微系统技术、信息技术等。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)