清华大学 本次发布的数据集 MIRAGE, MIRAGE是一个多模态基准数据集,旨在评估模型在计数(对象属性识别)、关系(空间关系推理)和计数与关系组合任务上的能力。数据集由1710个问题组成,涵盖广泛的视觉多样性和推理挑战,包括各种颜色、形状、大小和纹理的对象,以及从简单对到深层嵌套层次的空间关系。MIRAGE通过将计数和关系任务结合,测试模型在复杂场景中同时进行对象身份识别、数量统计和空间配置推理的能力。数据集的设计强调了视觉认知的组合性质,并针对表面级识别和关系理解之间的差距。
关于 清华大学 , 清华大学是中华人民共和国教育部直属的全国重点大学,是中国的顶尖学府之一,位于北京市海淀区,有着很高的学术声誉和国际影响力。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)