国际信息技术研究所 本次发布的数据集 IIIT-AR-13K, IIIT-AR-13K数据集是由国际信息技术研究所视觉信息中心创建,专注于商业文档中的图形对象检测,特别是年度报告。该数据集包含13000个手动标注的页面,涵盖五种不同类别的图形对象:表格、图表、自然图像、标志和签名。数据集的创建涉及从多个公司和多种语言的公开年度报告中随机选择文档,并手动标注图形对象的边界框。IIIT-AR-13K数据集的应用领域包括商业文档和科技文章中的图形对象检测,旨在提高自动处理商业文档的效率和准确性。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)