巴塞罗那自治大学 本次发布的数据集 Fetch-A-Set (FAS), Fetch-A-Set (FAS) 是一个专为立法历史文档分析系统设计的大型基准,旨在解决大规模历史文档检索的挑战。该数据集包含从17世纪至今的文档,总计约40万样本,来源于西班牙的立法文档,覆盖三个世纪。FAS数据集的创建过程涉及使用Mask-RCNN模型识别文档区域,并通过sentencebert编码匹配查询与OCR文本。该数据集主要应用于历史文档分析领域,特别是在文本到图像的检索任务中,旨在通过视觉洞察力提升历史文档分析的效率和准确性。
关于 巴塞罗那自治大学 , 巴塞罗那自治大学(Universitat Autònoma de Barcelona,简称UAB)是位于西班牙加泰罗尼亚地区的一所公立研究型大学。该大学成立于1968年,以其高质量的教育和研究活动而闻名,特别是在社会科学、自然科学和人文科学领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)