威斯康星大学麦迪逊分校 本次发布的数据集 relsim, 该数据集由Adobe研究院等机构联合构建,专注于捕捉图像间的抽象关系相似性,而非传统表面特征相似性。数据集包含114,881组图像-匿名描述对,数据源自LAION-2B图像库的精选子集,通过人工标注和VLM模型生成描述,将具体对象替换为占位符以突出关系逻辑。创建过程包括关系图像筛选、人工分组标注和自动化描述生成三个关键步骤,旨在解决计算机视觉中关系推理能力缺失的问题,可应用于图像检索、类比生成等需要深层语义理解的场景。
关于 威斯康星大学麦迪逊分校 , 威斯康星大学麦迪逊分校(University of Wisconsin-Madison)是美国威斯康星州的一所公立研究型大学,成立于1848年,是威斯康星大学系统的旗舰校区。该校在多个学科领域具有较高的学术声誉,尤其在工程、农业、生命科学和社会科学方面表现突出。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)