谷歌瑞士 本次发布的数据集 实体图像数据集 (Entity Image Dataset, EI) 和混合模式图像检索数据集 (Mixed-Modal Image Retrieval Dataset, MMIR), 实体图像数据集 (EI) 和混合模式图像检索数据集 (MMIR) 是两个新的数据集,旨在促进对图像检索的深度跨模态上下文理解。EI 数据集提供了维基百科实体的规范图像,而 MMIR 数据集则源自 WIT 数据集,包含两种具有挑战性的查询类型:单实体图像查询和多实体图像查询。这些数据集为混合模式检索提供了一个具有挑战性和上下文丰富的评估平台,有望推动更复杂和有效的模型的发展。MMIR 数据集覆盖了超过 100 种语言,是目前最大的多语言混合模式检索数据集之一。
查看实体图像数据集 (Entity Image Dataset, EI) 和混合模式图像检索数据集 (Mixed-Modal Image Retrieval Dataset, MMIR)
README 内容:
关于 谷歌瑞士 , 谷歌瑞士是谷歌公司在瑞士的分支机构,负责在该地区的业务运营和技术开发,是谷歌全球网络的重要组成部分。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)