KAIST 发布 Bias Benchmark for Generation (BBG) 数据集, 应用在自然语言处理、偏见评估领域

首页 / 开源数据市场 / 正文

五号数据雷达开源数据市场2025-03-13 12:4466

Bias Benchmark for Generation (BBG) 是 KAIST 发布的数据集,于 2025-03-10 首发在 arXiv 应用于自然语言处理、偏见评估领域

KAIST 本次发布的数据集 Bias Benchmark for Generation (BBG), Bias Benchmark for Generation (BBG)是一个用于评估大型语言模型（LLM）在社会偏见方面的基准数据集，由KAIST的研究人员构建。该数据集基于英语和韩语的BBQ（Bias Benchmark for QA）数据集，通过替换故事情境中的人物描述为中性的占位符，来评估LLM在长篇故事生成中的偏见。BBG包含9个类别的232个模板和12个类别的286个模板，分别对应英语和韩语版本，共计120508个故事和问题对。该数据集旨在解决LLM在长篇生成中的社会偏见评估问题，推动公平的自然语言处理系统的发展。

查看Bias Benchmark for Generation (BBG)

关于 KAIST , KAIST，即韩国科学技术院，是韩国首尔附近的一所顶尖研究型大学，成立于1971年。KAIST以其在科学、工程和技术领域的卓越研究而闻名，尤其在人工智能、计算机科学和纳米技术方面具有领先地位。该校培养了大量科技领域的顶尖人才，对韩国的科技发展起到了重要推动作用。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

近期热门