five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

北京大学 发布 ImgEdit 数据集, 应用在 图像编辑、模型评估 领域

五号数据雷达开源数据市场2025-05-29 07:29136
ImgEdit 是 北京大学 发布的数据集,于 2025-05-27 首发在 arXiv 应用于 图像编辑、模型评估 领域

北京大学 本次发布的数据集 ImgEdit, ImgEdit是一个大规模、高质量的图像编辑数据集,包含120万个精心策划的编辑对,包含新颖和复杂的单次编辑以及具有挑战性的多轮任务。为确保数据质量,我们采用了一个多阶段的数据生成流程,整合了最先进的视觉语言模型、检测模型、分割模型,以及特定任务的修复流程和严格的后期处理。ImgEdit在任务新颖性和数据质量方面都超越了现有数据集。使用ImgEdit,我们训练了ImgEdit-E1,这是一个使用视觉语言模型处理参考图像和编辑提示的编辑模型,在多个任务上优于现有的开源模型,突出了ImgEdit和模型设计的重要性。为了全面评估,我们引入了ImgEdit-Bench,这是一个旨在评估图像编辑性能的基准,包括基本测试套件、具有挑战性的单次编辑套件和专门的多轮编辑套件。我们评估了开源和专有模型,以及ImgEdit-E1,为当前图像编辑模型的行为提供了深入分析和可操作的见解。

查看ImgEdit

README 内容: 

 

关于 北京大学 , 北京大学是中国著名的高等学府,成立于1898年,位于中国首都北京,是中国最早的国立综合性大学,也是国家重点支持的顶尖大学之一。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们