five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

加州大学尔湾分校自然语言处理实验室 发布 UnStereoEval (USE) 数据集, 应用在 性别偏见、语言模型公平性 领域

五号数据雷达开源数据市场2025-10-04 15:1625
UnStereoEval (USE) 是 加州大学尔湾分校自然语言处理实验室 发布的数据集,于 2025-10-04 首发在 arXiv 应用于 性别偏见、语言模型公平性 领域

加州大学尔湾分校自然语言处理实验室 本次发布的数据集 UnStereoEval (USE), 该数据集采用了一种新颖的框架,专门用于在无刻板印象的场景中研究性别偏见问题。该框架利用基于预训练数据统计的句子级评分。此外,数据集还包括三个基准测试:USE-5、USE-10和USE-20,这些基准测试是通过使用5、10和20个单词长度的句子生成的。该研究涵盖了28个测试模型,旨在评估语言模型在无刻板印象场景中的公平性。

查看UnStereoEval (USE)

关于 加州大学尔湾分校自然语言处理实验室 , 加州大学尔湾分校(University of California, Irvine,简称UCI)是一所位于美国加州尔湾的公立研究型大学,其自然语言处理实验室(NLP)专注于自然语言处理领域的研究,包括语言模型、文本挖掘、语义理解等。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们