five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

清华大学 发布 MIRAGE 数据集, 应用在 图像识别、视觉推理 领域

五号数据雷达开源数据市场2025-05-20 16:3373
MIRAGE 是 清华大学 发布的数据集,于 2025-05-16 首发在 arXiv 应用于 图像识别、视觉推理 领域

清华大学 本次发布的数据集 MIRAGE, MIRAGE是一个多模态基准数据集,旨在评估模型在计数(对象属性识别)、关系(空间关系推理)和计数与关系组合任务上的能力。数据集由1710个问题组成,涵盖广泛的视觉多样性和推理挑战,包括各种颜色、形状、大小和纹理的对象,以及从简单对到深层嵌套层次的空间关系。MIRAGE通过将计数和关系任务结合,测试模型在复杂场景中同时进行对象身份识别、数量统计和空间配置推理的能力。数据集的设计强调了视觉认知的组合性质,并针对表面级识别和关系理解之间的差距。

查看MIRAGE

关于 清华大学 , 清华大学是中华人民共和国教育部直属的全国重点大学,是中国的顶尖学府之一,位于北京市海淀区,有着很高的学术声誉和国际影响力。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们