新加坡科技设计大学 本次发布的数据集 PDS-DPO, PDS-DPO数据集是由新加坡科技设计大学团队创建的,专门用于多模态大语言模型(MLLMs)的直接偏好优化(DPO)训练。该数据集包含9000条图像-文本对,通过生成模型和奖励模型生成的合成数据构建,旨在减少对人工标注数据的依赖,同时增强模型的对齐能力。数据集的创建过程包括图像生成、排名和响应生成,最终通过奖励模型筛选出高质量的正负样本对。该数据集主要应用于视觉语言任务和幻觉检测,旨在提高MLLMs的可靠性和推理能力。
关于 新加坡科技设计大学 , 新加坡科技设计大学(SUTD)成立于2009年,是新加坡的第四所公立大学,专注于科技与设计的交叉学科教育与研究。该校与麻省理工学院(MIT)有紧密的合作关系,致力于培养具有创新精神和跨学科能力的未来领导者。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)