CrowdFlower 本次发布的数据集 Davidson et al. (Twitter tweets), 该数据集包含了从8500万条推文中筛选出的2.5万条包含Hatebase词汇的推文。其中,CrowdFlower的工作人员手动将这2.5万条推文中的24,802条划分为三个类别:仇恨言论、具有攻击性但非仇恨言论,以及既不攻击性也不属于仇恨言论。该任务的目的是进行仇恨言论分类。
查看Davidson et al. (Twitter tweets)
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)