five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

发布AQMAR-NER-Collapsed-Labels数据集,应用在命名实体识别、阿拉伯语NLP领域

五号数据雷达开源数据市场2026-01-16 07:5733
AQMAR-NER-Collapsed-Labels是发布的数据集,于2026-01-15首发在HuggingFace应用于命名实体识别、阿拉伯语NLP领域

本次发布的数据集AQMAR-NER-Collapsed-Labels,该数据集是一个**基准就绪**版本的AQMAR阿拉伯语命名实体识别(NER)语料库,其中细粒度的杂项标签被合并为单一的`MISC`类别。它源自卡内基梅隆大学(CMU)阿拉伯NLP小组发布的原始AQMAR语料库。数据集保留了原始句子边界和文件级别的训练/开发/测试分割(20/4/4文件),分割方式与完整版本相同。标签集包括PER(人名)、LOC(地点)、ORG(组织)、MISC(杂项)和O(其他,使用BIO编码:B-*、I-*标签)。数据集适合用于微F1、宏F1(不包括O)和跨度级别评估,推荐用于训练和评估阿拉伯语NER模型、基准比较和可重复实验。

查看AQMAR-NER-Collapsed-Labels

Dataset card内容:

 

Files and versions内容:

 

关于,国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。

关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们