伊朗Sharif大学 本次发布的数据集 SimCO 和 CompCO, SimCO 数据集包含17种基本几何形状,用于在受控条件下测试模型处理简单形状和配置的能力;CompCO 数据集则从 COCO 数据集中派生而来,包含72种常见且复杂的物体,用于评估模型在更接近现实世界场景下的性能。这两个数据集都包含了2到5个物体的图像以及准确描述这些物体的字幕,以确保高可控性和最小化混杂因素,为评估 CLIP 模型提供了一个强大的平台。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)