five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

阿维尼翁大学 发布 Wikipedia Abusive Conversations (WAC) 数据集, 应用在 在线社区滥用检测、对话分析 领域

五号数据雷达开源数据市场2024-10-13 10:0260
Wikipedia Abusive Conversations (WAC) 是 阿维尼翁大学 发布的数据集,于 2020-03-13 首发在 arXiv 应用于 在线社区滥用检测、对话分析 领域

阿维尼翁大学 本次发布的数据集 Wikipedia Abusive Conversations (WAC), Wikipedia Abusive Conversations (WAC) 数据集是由阿维尼翁大学信息实验室创建,包含超过38万条来自英文维基百科讨论页的注释消息。该数据集不仅包含孤立消息,还重建了完整的对话结构,特别适用于基于上下文和线程的滥用内容检测方法。数据集分为三个子集,分别针对个人攻击、攻击性和毒性进行注释。创建过程中,研究人员通过比较现有语料库,开发了一个管道来创建这个大规模的公开可用对话语料库。WAC数据集的应用领域主要集中在自动化在线内容滥用检测,旨在通过对话结构和动态信息提高自动检测的准确性。

查看Wikipedia Abusive Conversations (WAC)

README 内容: 

 

关于 阿维尼翁大学 , 阿维尼翁大学是法国的一所公立大学,位于普罗旺斯地区的阿维尼翁市。该大学提供多种学科的教育和研究,包括人文科学、社会科学、自然科学和工程学等。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们