five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

智能数据处理实验室(IDPL) 发布 IDPL-PFOD2 数据集, 应用在 光学字符识别、波斯语 领域

五号数据雷达开源数据市场2024-10-13 19:1999
IDPL-PFOD2 是 智能数据处理实验室(IDPL) 发布的数据集,于 2023-12-03 首发在 arXiv 应用于 光学字符识别、波斯语 领域

智能数据处理实验室(IDPL) 本次发布的数据集 IDPL-PFOD2, IDPL-PFOD2是由智能数据处理实验室开发的针对印刷体波斯语光学字符识别的大型数据集,包含2,003,541张图像,涵盖多种字体、风格和大小。该数据集是对先前IDPL-PFOD数据集的扩展,显著增加了数据量和多样性。IDPL-PFOD2旨在解决波斯语印刷文本识别的挑战,特别是由于波斯语独特的书写特征和深度学习架构对大量训练样本的需求。数据集通过CRNN和Vision Transformer架构的有效性评估,展示了其在波斯语OCR研究中的应用潜力,为波斯语社区提供更好的可访问性、信息检索和语言处理能力。

查看IDPL-PFOD2

README 内容: 

 

关于 智能数据处理实验室(IDPL) , -

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们