本次发布的数据集 wikiHow-image, 该数据集旨在通过将WikiHow文章分解为步骤级摘要、文档以及相应的图片,为多模态摘要中事实性的主观评估构建而成。它不仅支持未来研究在步骤级和文章级摘要任务上进行实验,而且其规模包括6000篇随机选出的文章,用于验证集和测试集,其中验证集和测试集分别包含52个和193个步骤级示例。该数据集的任务是多模态摘要评估。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)