巴塞罗那超级计算中心(BSC-CNS) 本次发布的数据集 ESBBQ和CABBQ, ESBBQ和CABBQ是针对西班牙语和加泰罗尼亚语设计的问答任务的社会偏见基准数据集。这两个并行数据集基于原始的BBQ数据集,旨在使用多选题问答设置评估10个类别的社会偏见,现已适应西班牙语和加泰罗尼亚语以及西班牙的社会环境。数据集包含27,320个实例,涵盖了年龄、残疾状况、性别、LGBTQIA、国籍、外貌、种族/民族、宗教、社会经济状况(SES)和西班牙地区等10个社会类别。数据集的结构包括模板、上下文、问题、答案和占位符,每个模板都经过手动编写,并注有相关的刻板印象和社会群体。数据集的构建过程包括对原始BBQ模板的文化适应性调整,以及通过公众调查收集西班牙社会中流行的刻板印象,以确保数据集能够准确反映西班牙的社会偏见情况。
Dataset card 内容:
Files and versions 内容:
关于 巴塞罗那超级计算中心(BSC-CNS) , 巴塞罗那超级计算中心(BSC-CNS)是西班牙国家研究和卓越中心之一,致力于在超级计算、大数据和人工智能领域进行科学研究和技术开发。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)