five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

佛罗里达大学 发布 PANDA – Paired Anti-hate Narratives Dataset from Asia 数据集, 应用在 反仇恨言论、自然语言处理 领域

五号数据雷达开源数据市场2025-01-08 12:3651
PANDA – Paired Anti-hate Narratives Dataset from Asia 是 佛罗里达大学 发布的数据集,于 2025-01-05 首发在 arXiv 应用于 反仇恨言论、自然语言处理 领域

佛罗里达大学 本次发布的数据集 PANDA – Paired Anti-hate Narratives Dataset from Asia, PANDA数据集是首个专注于中文反仇恨言论的语料库,由佛罗里达大学和Lingua的研究团队创建。该数据集包含2974条仇恨言论与反仇恨言论的配对数据,旨在解决中文社交媒体中仇恨言论的对抗问题。数据来源包括多个开源中文仇恨言论数据集,如COLD、SWSR和CHSD。通过使用LLM-as-a-Judge和模拟退火算法生成反仇恨言论,并经过人工验证,确保数据的质量和上下文相关性。该数据集为中文反仇恨言论的生成和评估提供了重要资源,适用于自然语言处理领域的研究和应用。

查看PANDA – Paired Anti-hate Narratives Dataset from Asia

README 内容: 

 

关于 佛罗里达大学 , 佛罗里达大学(University of Florida)是美国佛罗里达州的一所公立研究型大学,成立于1853年。它是美国大学协会的成员之一,以其在工程、法律、医学和商学等领域的研究和教学而闻名。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们