加州大学尔湾分校自然语言处理实验室 本次发布的数据集 UnStereoEval (USE), 该数据集采用了一种新颖的框架,专门用于在无刻板印象的场景中研究性别偏见问题。该框架利用基于预训练数据统计的句子级评分。此外,数据集还包括三个基准测试:USE-5、USE-10和USE-20,这些基准测试是通过使用5、10和20个单词长度的句子生成的。该研究涵盖了28个测试模型,旨在评估语言模型在无刻板印象场景中的公平性。
关于 加州大学尔湾分校自然语言处理实验室 , 加州大学尔湾分校(University of California, Irvine,简称UCI)是一所位于美国加州尔湾的公立研究型大学,其自然语言处理实验室(NLP)专注于自然语言处理领域的研究,包括语言模型、文本挖掘、语义理解等。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)