TediGAN research team 本次发布的数据集 Multi-Modal CelebA-HQ, 该数据集是一个大规模的人脸图像集合,包含了30,000张高分辨率的人脸图片,每张图片都配备了高质量的分割遮罩、素描以及描述性文本。此外,该数据集支持文本引导的多模态合成,并广泛用于评估图像的质量、多样性、准确性和真实性。这一数据集的规模属于大型,其任务重点在于文本引导的图像生成与操作。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)