five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

发布 laion2b-45ish-1120px 数据集, 应用在 图像识别、AI生成内容 领域

五号数据雷达开源数据市场2025-03-03 07:5319
laion2b-45ish-1120px 是 发布的数据集,于 2025-03-02 首发在 HuggingFace 应用于 图像识别、AI生成内容 领域

本次发布的数据集 laion2b-45ish-1120px, 这是一个从LAION2B-en-aesthetic数据集中选取的子集,基于长宽比进行了筛选,并且具有更好的标题注释。这是一个通用型数据集,其中大约只有30%的图片包含人类。所有非现实风格的图片都被过滤掉了,旨在创建一个“现实世界”的数据集。这个数据集大约有80,000张图片,磁盘占用大约为45G。这个数据集没有经过人工单独筛选,只是批量剔除。图片的长宽比为4:5的肖像画风格,或者稍微宽一些(因为稍微太宽的图片可以被安全地裁剪得更窄)。作者对于选择1120像素的最低高度可能有所偏差,建议可能需要选择1152像素(因为64的倍数)。数据集中包含了两种自动生成的标题风格:“moondream”和“wd14”,并使用这些风格来过滤掉带水印的图片。使用“moondream”模型为每张图片添加了AI生成的标题,并使用该模型过滤掉带水印的图片。

查看laion2b-45ish-1120px

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们