里斯本大学 本次发布的数据集 NLI-PT, NLI-PT是由里斯本大学的语言学中心-CLUL创建的葡萄牙语原生语言识别数据集,包含1,868篇由学习欧洲葡萄牙语的学生撰写的文章,涵盖15种不同的第一语言(L1)。数据集不仅包含原始学生文本,还包括四种不同类型的标注:POS、细粒度POS、成分解析和依赖解析。NLI-PT不仅适用于原生语言识别(NLI),还适用于第二语言习得和教育NLP领域的多项研究。数据集的创建过程涉及从多个学习者语料库中收集数据,并使用NLP工具进行统一格式化和多级语言标注。NLI-PT的应用领域广泛,包括计算机辅助语言学习、语法错误检测与纠正、拼写检查以及第一语言干扰研究,旨在解决第二语言学习中的特定问题。
关于 里斯本大学 , 里斯本大学是葡萄牙的一所著名公立研究型大学,成立于1911年,位于葡萄牙首都里斯本。该校在多个学科领域具有较高的研究水平和国际声誉,尤其在人文科学、社会科学和自然科学方面表现突出。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)