本次发布的数据集 LongerVideos, 该数据集是一个全面性的基准测试,包含了超过二十个视频集,分为三大类:讲座视频、纪录片视频和娱乐视频。它旨在评估针对长视频内容的检索增强生成框架。每个视频集总时长平均超过4小时,包含1到20多个独立视频,并且还包括从视频字幕生成的高质量查询。该数据集规模宏大,包含超过160个视频,生成了600多个多样化的查询,为视频为基础的问答任务提供了一个健壮的评估集合。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)