德克萨斯大学奥斯汀分校 本次发布的数据集 Safe-Child-LLM, Safe-Child-LLM是一个全面的数据集,用于系统地评估大型语言模型(LLM)在儿童和青少年使用场景中的安全性。该数据集包含200个对抗性提示,这些提示是从公开可访问的有害提示数据集中收集和修改的,经过精心筛选和改写,以代表两个特定年龄群体的真实场景:7-12岁的儿童和13-17岁的青少年。数据集中的提示涵盖了从看似无害但可能存在风险的问题(例如,如何捉弄同学)到涉及自残、暴力或访问不适当材料的更严重情况。Safe-Child-LLM旨在弥合现有评估框架的差距,这些框架主要针对成人用户,而忽略了儿童和青少年使用LLM时的独特风险。该数据集为研究人员提供了一个专门的基准,用于系统地评估LLM在与儿童或青少年相关的提示下的行为,并促进了对儿童安全标准的遵守。
关于 德克萨斯大学奥斯汀分校 , 德克萨斯大学奥斯汀分校是美国德克萨斯州奥斯汀市的一所公立研究型大学,是德克萨斯大学系统中的旗舰校区,以其科学、工程、商业、法律和教育专业的卓越教育质量而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)