five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

里斯本大学 发布 NLI-PT 数据集, 应用在 原生语言识别、第二语言习得 领域

五号数据雷达开源数据市场2024-10-13 16:4831
NLI-PT 是 里斯本大学 发布的数据集,于 2018-05-01 首发在 arXiv 应用于 原生语言识别、第二语言习得 领域

里斯本大学 本次发布的数据集 NLI-PT, NLI-PT是由里斯本大学的语言学中心-CLUL创建的葡萄牙语原生语言识别数据集,包含1,868篇由学习欧洲葡萄牙语的学生撰写的文章,涵盖15种不同的第一语言(L1)。数据集不仅包含原始学生文本,还包括四种不同类型的标注:POS、细粒度POS、成分解析和依赖解析。NLI-PT不仅适用于原生语言识别(NLI),还适用于第二语言习得和教育NLP领域的多项研究。数据集的创建过程涉及从多个学习者语料库中收集数据,并使用NLP工具进行统一格式化和多级语言标注。NLI-PT的应用领域广泛,包括计算机辅助语言学习、语法错误检测与纠正、拼写检查以及第一语言干扰研究,旨在解决第二语言学习中的特定问题。

查看NLI-PT

关于 里斯本大学 , 里斯本大学是葡萄牙的一所著名公立研究型大学,成立于1911年,位于葡萄牙首都里斯本。该校在多个学科领域具有较高的研究水平和国际声誉,尤其在人文科学、社会科学和自然科学方面表现突出。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们