five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

美国中佛罗里达大学 发布 Safe-LLaVA 数据集, 应用在 隐私保护、语言模型训练 领域

五号数据雷达开源数据市场2025-09-05 07:5073
Safe-LLaVA 是 美国中佛罗里达大学 发布的数据集,于 2025-08-30 首发在 arXiv 应用于 隐私保护、语言模型训练 领域

美国中佛罗里达大学 本次发布的数据集 Safe-LLaVA, Safe-LLaVA是一个隐私保护的多模态大型语言模型训练数据集,由系统地清理LLaVA数据集而来,旨在去除显式和隐式的生物识别信息。该数据集的创建旨在解决多模态大型语言模型在视觉语言任务中泄露敏感生物识别属性的问题,如种族、性别、年龄、体重和眼色等。Safe-LLaVA数据集的创建过程涉及使用GPT-4自动重写和清理样本,并进行人工验证,以确保生物识别信息被彻底去除。Safe-LLaVA数据集的发布为多模态大型语言模型的隐私保护训练提供了一个新的标准。

查看Safe-LLaVA

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 美国中佛罗里达大学 , 美国中佛罗里达大学(University of Central Florida,简称UCF)是一所位于美国佛罗里达州奥兰多的公立研究型大学,成立于1963年。它是佛罗里达州最大的大学,以其在光学、工程学、计算机科学等领域的优秀研究和教育项目而闻名。_simple

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们