首页 / 开源数据市场 / 正文

卡塔尔哈马德·本·哈利法大学发布 An Annotated Corpus of Arabic Tweets for Hate Speech Analysis 数据集, 应用在仇恨言论检测、文本分析领域

五号数据雷达开源数据市场2025-05-21 14:1333

An Annotated Corpus of Arabic Tweets for Hate Speech Analysis 是卡塔尔哈马德·本·哈利法大学发布的数据集,于 2025-05-17 首发在 arXiv 应用于仇恨言论检测、文本分析领域

卡塔尔哈马德·本·哈利法大学本次发布的数据集 An Annotated Corpus of Arabic Tweets for Hate Speech Analysis, 本研究介绍了一个阿拉伯语多标签仇恨言论数据集。该数据集包含10000条阿拉伯语推文，并对每条推文进行了标注，标注内容包括是否包含攻击性内容，以及如果包含，则进一步分类为不同的仇恨言论目标，如宗教、性别、政治、种族、起源等。数据集由多个标注员参与标注，并计算了标注员之间的互信度，攻击性内容的互信度为0.86，多标签仇恨言论目标的互信度为0.71。数据集可用于训练和评估阿拉伯语社交媒体内容中的仇恨言论检测模型。

查看An Annotated Corpus of Arabic Tweets for Hate Speech Analysis

关于卡塔尔哈马德·本·哈利法大学 , -

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

社区讨论

近期热门

卡塔尔哈马德·本·哈利法大学 发布 An Annotated Corpus of Arabic Tweets for Hate Speech Analysis 数据集, 应用在 仇恨言论检测、文本分析 领域

社区讨论

卡塔尔哈马德·本·哈利法大学发布 An Annotated Corpus of Arabic Tweets for Hate Speech Analysis 数据集, 应用在仇恨言论检测、文本分析领域