five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

重庆邮电大学 发布 FaceCaption-15M 数据集, 应用在 面部识别、文本-图像检索 领域

五号数据雷达开源数据市场2024-10-13 12:4375
FaceCaption-15M 是 重庆邮电大学 发布的数据集,于 2024-07-11 首发在 arXiv 应用于 面部识别、文本-图像检索 领域

重庆邮电大学 本次发布的数据集 FaceCaption-15M, FaceCaption-15M是由重庆邮电大学计算机科学与技术学院创建的大型面部图像-文本数据集,包含超过1500万对面部图像及其自然语言描述。数据集通过高质量的图像和丰富的文本描述,确保了图像与文本之间的高度相关性。创建过程中,首先从LAION-Face数据集中筛选面部图像,然后使用自动标注方法和大型语言模型生成描述文本。该数据集主要应用于面部属性识别、文本-图像检索等任务,旨在推动面部相关任务的研究和应用。

查看FaceCaption-15M

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 重庆邮电大学 , 重庆邮电大学是一所以信息科学技术为特色,工、理、管、文等多学科协调发展的全日制普通高等学校,位于中国重庆市。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们