阿维尼翁大学 本次发布的数据集 Wikipedia Abusive Conversations (WAC), Wikipedia Abusive Conversations (WAC) 数据集是由阿维尼翁大学信息实验室创建,包含超过38万条来自英文维基百科讨论页的注释消息。该数据集不仅包含孤立消息,还重建了完整的对话结构,特别适用于基于上下文和线程的滥用内容检测方法。数据集分为三个子集,分别针对个人攻击、攻击性和毒性进行注释。创建过程中,研究人员通过比较现有语料库,开发了一个管道来创建这个大规模的公开可用对话语料库。WAC数据集的应用领域主要集中在自动化在线内容滥用检测,旨在通过对话结构和动态信息提高自动检测的准确性。
查看Wikipedia Abusive Conversations (WAC)
README 内容:
关于 阿维尼翁大学 , 阿维尼翁大学是法国的一所公立大学,位于普罗旺斯地区的阿维尼翁市。该大学提供多种学科的教育和研究,包括人文科学、社会科学、自然科学和工程学等。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)