本次发布的数据集 Stable_Diffusion_3_Recaption, 该数据集由ImageNet数据集和CC12M数据集组成,是稳定扩散3论文中指定的数据集。ImageNet 2012的训练/验证数据被按照论文中的描述进行了标注,即“a photo of a 〈class name〉”。CC12M是一个包含1200万张图片的数据集,但由于Google提供的下载器存在许多损坏的链接,下载过程非常耗时。社区中有人公开了这个数据集,最大的一个包含约1000万张图片的仓库被用于此数据集。为了提高图像生成的质量,该数据集的标注与另一个具有更好标注的数据集进行了合并。数据集包含id、image和caption三个列,其中id是CC12M图像的id或ImageNet的999,999,999,image是表示全分辨率图像的字节数据,caption是图像的llavanext标注。
查看Stable_Diffusion_3_Recaption
Dataset card 内容:
Files and versions 内容:
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)