德国维尔茨堡大学 本次发布的数据集 CROHME+ 和 MathWriting+, CROHME+ 和 MathWriting+ 数据集是为在线手写数学表达式识别(HMER)任务而创建的,它们提供了丰富的结构化注释,包括符号分割、分类和空间关系,这些数据集的创建旨在促进可解释的HMER研究。数据集包含374,000个数学表达式,为HMER任务提供了详尽的跟踪级别细节。这些数据集通过使用一个神经网络来自动地将LaTeX方程映射到原始跟踪,从而自动生成符号分割、分类和空间关系的注释。我们的结构识别系统生成一个完整的图结构,直接将手写跟踪链接到预测符号,从而实现透明的错误分析和可解释的输出。我们的结果挑战了结构方法过时的观念,证明了它们在高质量注释数据的支持下是可行的。
关于 德国维尔茨堡大学 , -_simple
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)