Adobe Research 本次发布的数据集 MonetGPT, MonetGPT是一个图像操作感知的多模态大型语言模型(MLLM),用于提供图像修饰的自动建议。该模型通过训练解决专门设计的视觉谜题来获取图像处理操作知识,进而能够规划并提出图像修饰序列。为了训练,研究人员合成了一组推理数据集,通过对专家修饰的图片进行程序性操作,并在视觉调整的基础上对预训练的语言模型进行微调。该数据集旨在解决图像修饰任务中的挑战,包括如何选择和调整修饰操作。数据集的应用领域包括但不限于图像修饰、图像增强和图像编辑,旨在帮助用户更有效地修饰图像,同时保持图像的原始身份和细节。
关于 Adobe Research , Adobe Research 是 Adobe 公司的研究部门,专注于计算机科学领域的研究,包括图形学、多媒体、用户界面设计等方面,致力于开发创新技术和产品。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)