北京大学 本次发布的数据集 ImgEdit, ImgEdit是一个大规模、高质量的图像编辑数据集,包含120万个精心策划的编辑对,包含新颖和复杂的单次编辑以及具有挑战性的多轮任务。为确保数据质量,我们采用了一个多阶段的数据生成流程,整合了最先进的视觉语言模型、检测模型、分割模型,以及特定任务的修复流程和严格的后期处理。ImgEdit在任务新颖性和数据质量方面都超越了现有数据集。使用ImgEdit,我们训练了ImgEdit-E1,这是一个使用视觉语言模型处理参考图像和编辑提示的编辑模型,在多个任务上优于现有的开源模型,突出了ImgEdit和模型设计的重要性。为了全面评估,我们引入了ImgEdit-Bench,这是一个旨在评估图像编辑性能的基准,包括基本测试套件、具有挑战性的单次编辑套件和专门的多轮编辑套件。我们评估了开源和专有模型,以及ImgEdit-E1,为当前图像编辑模型的行为提供了深入分析和可操作的见解。
README 内容:
关于 北京大学 , 北京大学是中国著名的高等学府,成立于1898年,位于中国首都北京,是中国最早的国立综合性大学,也是国家重点支持的顶尖大学之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)