Research Paper Authors 本次发布的数据集 FineCapEval, 该数据集名为FineCapEval,是一个用于评估字幕的全新数据集,其特点在于采用了细粒度的评估标准,包括整体、背景、物体和关系等四个方面。该数据集由1,000张图片组成,总共包含5,000个跨越这四个标准的注释。在构建此数据集时,研究人员收集了图片,并让人类标注员编写包含背景、物体、关系以及一个综合描述的详细字幕。规模上,数据集包含了1,000张图片和5,000个注释,其任务是进行图像字幕评估。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)