首页 / 开源数据市场 / 正文

加州大学尔湾分校自然语言处理实验室发布 UnStereoEval (USE) 数据集, 应用在性别偏见、语言模型公平性领域

五号数据雷达开源数据市场2025-10-04 15:1625

UnStereoEval (USE) 是加州大学尔湾分校自然语言处理实验室发布的数据集,于 2025-10-04 首发在 arXiv 应用于性别偏见、语言模型公平性领域

加州大学尔湾分校自然语言处理实验室本次发布的数据集 UnStereoEval (USE), 该数据集采用了一种新颖的框架，专门用于在无刻板印象的场景中研究性别偏见问题。该框架利用基于预训练数据统计的句子级评分。此外，数据集还包括三个基准测试：USE-5、USE-10和USE-20，这些基准测试是通过使用5、10和20个单词长度的句子生成的。该研究涵盖了28个测试模型，旨在评估语言模型在无刻板印象场景中的公平性。

查看UnStereoEval (USE)

关于加州大学尔湾分校自然语言处理实验室 , 加州大学尔湾分校（University of California, Irvine，简称UCI）是一所位于美国加州尔湾的公立研究型大学，其自然语言处理实验室（NLP）专注于自然语言处理领域的研究，包括语言模型、文本挖掘、语义理解等。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

社区讨论

近期热门

加州大学尔湾分校自然语言处理实验室 发布 UnStereoEval (USE) 数据集, 应用在 性别偏见、语言模型公平性 领域

社区讨论

加州大学尔湾分校自然语言处理实验室发布 UnStereoEval (USE) 数据集, 应用在性别偏见、语言模型公平性领域