香港中文大学 本次发布的数据集 FLUX-Reason-6M, FLUX-Reason-6M是一个包含600万张高质量图像和2000万条双语描述(英文和中文)的大规模数据集,旨在教授复杂的推理能力。图像按照六个关键特征组织:想象力、实体、文本渲染、风格、情感和构图,并设计了明确的生成思维链(GCoT)来提供图像生成步骤的详细分解。该数据集的创建过程耗资巨大,耗时15000个A100 GPU天,为社区提供了之前只有大型工业实验室才能获得的资源。数据集的创建、评估代码和基准测试已公开发布,以促进推理导向的文本到图像生成研究。
关于 香港中文大学 , 香港中文大学是一所位于中国香港的公立研究型大学,成立于1963年,是香港的第二所大学。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)