香港科技大学(广州) 本次发布的数据集 Text-Render-2M, HQ-Poster-100K, Poster-Preference-100K, Poster-Reflect-120K, PosterCraft是一个用于高质量美学海报生成的统一框架,它通过一系列精心设计的流程优化海报生成。该框架包括四个关键阶段:大规模文本渲染优化、高质量海报微调、美学文本强化学习和视觉语言反馈精炼。为了支持这一流程,我们构建了一套专门的数据集,每个阶段都有自动化的数据构建管道。Text-Render-2M用于文本渲染优化,HQ-Poster-100K包含超过10万张高质量的海报,Poster-Preference-100K生成6000对高质量偏好,Poster-Reflect-120K构建了6.4万对反馈对。这些数据集克服了资源的限制,支持更强大、可迁移的训练,使得训练的模型能够生成高质量的、完整渲染的海报。
查看Text-Render-2M, HQ-Poster-100K, Poster-Preference-100K, Poster-Reflect-120K
关于 香港科技大学(广州) , 香港科技大学(广州)是位于中国广东省广州市的一所研究型大学,是香港科技大学的分校,致力于培养高水平的创新人才,并进行前沿的科学和技术研究。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)