five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

新加坡科技设计大学 发布 PDS-DPO 数据集, 应用在 多模态学习、模型优化 领域

五号数据雷达开源数据市场2024-12-25 08:2718
PDS-DPO 是 新加坡科技设计大学 发布的数据集,于 2024-12-23 首发在 arXiv 应用于 多模态学习、模型优化 领域

新加坡科技设计大学 本次发布的数据集 PDS-DPO, PDS-DPO数据集是由新加坡科技设计大学团队创建的,专门用于多模态大语言模型(MLLMs)的直接偏好优化(DPO)训练。该数据集包含9000条图像-文本对,通过生成模型和奖励模型生成的合成数据构建,旨在减少对人工标注数据的依赖,同时增强模型的对齐能力。数据集的创建过程包括图像生成、排名和响应生成,最终通过奖励模型筛选出高质量的正负样本对。该数据集主要应用于视觉语言任务和幻觉检测,旨在提高MLLMs的可靠性和推理能力。

查看PDS-DPO

关于 新加坡科技设计大学 , 新加坡科技设计大学(SUTD)成立于2009年,是新加坡的第四所公立大学,专注于科技与设计的交叉学科教育与研究。该校与麻省理工学院(MIT)有紧密的合作关系,致力于培养具有创新精神和跨学科能力的未来领导者。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们