ellamind本次发布的数据集german-language-proficiency,该数据集是一个针对德语语言错误的专项数据集,包含多个子配置,每个子配置对应一种特定类型的德语语法错误或流畅性问题。数据集按错误类型分为不同的文件,包括形容词结尾错误、冠词格错误、大小写错误、标点符号错误等共计22种错误类别。所有数据文件均以Parquet格式存储,且仅包含训练集数据。该数据集适用于德语语法错误检测、文本校对、语言学习辅助系统等自然语言处理任务。
关于ellamind,ellamind是一家专注于人工智能技术研发与应用的公司,致力于推动AI在教育、医疗、金融等多个领域的创新发展和实践应用。
关于HuggingFace,全球最大的开源机器学习模型和数据集社区平台。





_1769672084863.jpg)