新加坡科技设计大学 本次发布的数据集 RABAKBENCH 2, RABAKBENCH 2是一个多语言安全基准数据集,专为新加坡独特的语言环境定制,涵盖Singlish、中文、马来语和泰米尔语。数据集通过三个阶段的可扩展管道构建:生成对抗性示例、半自动多标签安全标注和跨语言的高保真翻译。最终数据集包含超过5,000个安全标注示例,涵盖四种语言和六个细粒度安全类别。该数据集旨在解决低资源语言中大型语言模型及其安全分类器性能不佳的问题,并为构建本地化安全数据集提供一个可复制的框架。
Dataset card 内容:
Files and versions 内容:
关于 新加坡科技设计大学 , 新加坡科技设计大学(SUTD)成立于2009年,是新加坡的第四所公立大学,专注于科技与设计的交叉学科教育与研究。该校与麻省理工学院(MIT)有紧密的合作关系,致力于培养具有创新精神和跨学科能力的未来领导者。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)