ETRI 本次发布的数据集 HoliSafe, HoliSafe是一个全面的安全调整数据集和基准,它系统地涵盖了所有五种安全/不安全的图像-文本组合,提供了更坚固的训练和评估基础。数据集包含15,114个精心策划的图像-指令-响应三元组,通过综合覆盖所有可能的安全和不安全图像-文本输入的组合,显著减少了先前工作中的盲点。此外,数据集的一部分被分割成一个新的全面安全基准HoliSafe-Bench,它更具挑战性,为视觉语言模型(VLM)的安全性能提供了更深入的见解。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)