波士顿大学 本次发布的数据集 Object State Bench, Object State Bench数据集由波士顿大学的研究团队创建,旨在解决当前文本到图像生成模型在准确表现物体状态(如“一张没有瓶子的桌子”)方面的挑战。该数据集包含200个针对常见物体在多种物理状态下的描述提示,如“一个没有书籍的书架”、“一个没有瓶子的桌子”等。这些提示旨在帮助模型更好地理解并生成物体在不同状态下的图像。数据集的创建过程包括使用大型语言模型生成描述物体状态的提示,利用文本到图像生成模型生成图像,并使用视觉语言模型过滤出不符合物体状态描述的图像。该数据集主要应用于文本到图像生成模型的评估和微调,旨在提高模型在表现物体状态方面的准确性和泛化能力。
关于 波士顿大学 , 波士顿大学是一所位于美国马萨诸塞州波士顿的私立研究型大学,以其卓越的学术研究和国际声誉著称。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)