新加坡政府科技局 本次发布的数据集 MinorBench, MinorBench是一个开源的基准数据集,由新加坡政府科技局创建,旨在评估大型语言模型在拒绝儿童提出的不安全或不适当的查询方面的能力。该数据集的具体内容、大小等详细信息未在文中明确描述,但提及了它包含了儿童可能会向聊天机器人提出的问题,这些问题涉及危险行为、性内容、脏话、仇恨言论、自残和物质使用等风险类别。
Dataset card 内容:
Files and versions 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)