本次发布的数据集AQMAR-NER-Collapsed-Labels,该数据集是一个**基准就绪**版本的AQMAR阿拉伯语命名实体识别(NER)语料库,其中细粒度的杂项标签被合并为单一的`MISC`类别。它源自卡内基梅隆大学(CMU)阿拉伯NLP小组发布的原始AQMAR语料库。数据集保留了原始句子边界和文件级别的训练/开发/测试分割(20/4/4文件),分割方式与完整版本相同。标签集包括PER(人名)、LOC(地点)、ORG(组织)、MISC(杂项)和O(其他,使用BIO编码:B-*、I-*标签)。数据集适合用于微F1、宏F1(不包括O)和跨度级别评估,推荐用于训练和评估阿拉伯语NER模型、基准比较和可重复实验。
Dataset card内容:
Files and versions内容:
关于,国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)