中国人民大学 本次发布的数据集 PhD, PhD数据集是由中国人民大学DEKE重点实验室和腾讯机器学习平台部联合开发的,专注于评估大型视觉-语言模型(LVLMs)中的内在视觉-语言幻觉(IVL-Hallu)问题。该数据集包含超过7000张图像和53976个问题,涵盖四种IVL-Hallu类型:物体幻觉、属性幻觉、多模态冲突幻觉和反常识幻觉。数据集通过自动化流程生成,确保数据的高质量和多样性,旨在帮助研究人员更好地理解和解决LVLMs中的幻觉问题,推动未来在IVL-Hallu和LVLMs领域的研究。
关于 中国人民大学 , 中国人民大学是中国的一所著名综合性大学,位于北京市,以社会科学、人文科学和经济学等学科著称。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)