中国科学院大学 本次发布的数据集 HAVEN, HAVEN数据集是由中国科学院大学等机构创建的,用于评估大型多模态模型在视频理解任务中产生虚构信息的问题。该数据集基于三个维度构建,包括虚构信息产生的原因、虚构信息的方面和问题格式,共包含6497个问题。数据来源于公共视频数据集和手动收集的YouTube视频。该数据集旨在解决视频理解中的虚构信息问题,为大型多模态模型的评估提供了基准。
README 内容:
关于 中国科学院大学 , 中国科学院大学(简称国科大)是中国科学院直属的高等教育机构,前身为中国科学院研究生院,成立于1978年。学校以培养高层次科技人才为主要任务,拥有丰富的科研资源和强大的师资力量,致力于推动科技创新和科学研究。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)