厦门大学 本次发布的数据集 HAUR-5, HAUR-5数据集由厦门大学的研究团队创建,旨在解决多模态模型在理解文本密集图像中人类注释时的局限性。该数据集包含37,702张图像,涵盖了五种常见的人类注释类型,包括高亮、下划线、波浪线、矩形框和段落标记。数据集的创建过程包括从无版权的经典小说中提取文本块,并对其进行注释,最终将注释后的文本转换为图像。该数据集的应用领域主要集中在视觉问答任务,旨在帮助模型更准确地理解和回答与人类注释相关的问题,提升多模态模型在实际场景中的应用效果。
关于 厦门大学 , 厦门大学是中国福建省的一所综合性研究型大学,成立于1921年,是中国最早设立的高等学府之一,以其在海洋科学、经济学和化学等领域的研究而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。




_1769672084863.jpg)