智能数据处理实验室(IDPL) 本次发布的数据集 IDPL-PFOD2, IDPL-PFOD2是由智能数据处理实验室开发的针对印刷体波斯语光学字符识别的大型数据集,包含2,003,541张图像,涵盖多种字体、风格和大小。该数据集是对先前IDPL-PFOD数据集的扩展,显著增加了数据量和多样性。IDPL-PFOD2旨在解决波斯语印刷文本识别的挑战,特别是由于波斯语独特的书写特征和深度学习架构对大量训练样本的需求。数据集通过CRNN和Vision Transformer架构的有效性评估,展示了其在波斯语OCR研究中的应用潜力,为波斯语社区提供更好的可访问性、信息检索和语言处理能力。
README 内容:
关于 智能数据处理实验室(IDPL) , -
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)