Google Research 本次发布的数据集 DICES-350, 该数据集是一个经过精心挑选的8K多轮对话语料库样本,这些对话是由人类代理与一个生成式AI聊天机器人互动产生的,重点在于那些旨在引发不安全回应的对抗性对话。所有对话都根据16项安全标准由所有评分者进行了安全标注,该数据集使得可以对评分者多样性和观点进行深入分析。规模上,共有350个对话被123位独特的评分者进行了标注,任务是对聊天机器人对话进行安全标注。
关于 Google Research , 谷歌研究是谷歌公司的研发部门,致力于计算机科学的基础研究和应用研究,推动技术和科学的进步。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)