国防科技大学计算机科学与技术学院, 湖南大学设计学院 本次发布的数据集 ALLVB, ALLVB是一个全面的一体化长视频理解基准,由国防科技大学计算机科学与技术学院和湖南大学设计学院创建。该数据集包含1376部平均时长接近2小时的视频,涵盖16个类别,共有252k个问答对,是迄今为止最大的长视频理解基准。数据集整合了9项主要视频理解任务,转换为视频问答格式,全面评估多模态大型语言模型在理解长视频方面的能力。
Dataset card 内容:
Files and versions 内容:
关于 国防科技大学计算机科学与技术学院, 湖南大学设计学院 , -
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)