美国中佛罗里达大学 本次发布的数据集 Safe-LLaVA, Safe-LLaVA是一个隐私保护的多模态大型语言模型训练数据集,由系统地清理LLaVA数据集而来,旨在去除显式和隐式的生物识别信息。该数据集的创建旨在解决多模态大型语言模型在视觉语言任务中泄露敏感生物识别属性的问题,如种族、性别、年龄、体重和眼色等。Safe-LLaVA数据集的创建过程涉及使用GPT-4自动重写和清理样本,并进行人工验证,以确保生物识别信息被彻底去除。Safe-LLaVA数据集的发布为多模态大型语言模型的隐私保护训练提供了一个新的标准。
Dataset card 内容:
Files and versions 内容:
关于 美国中佛罗里达大学 , 美国中佛罗里达大学(University of Central Florida,简称UCF)是一所位于美国佛罗里达州奥兰多的公立研究型大学,成立于1963年。它是佛罗里达州最大的大学,以其在光学、工程学、计算机科学等领域的优秀研究和教育项目而闻名。_simple
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)