QVHighlights dataset 本次发布的数据集 BIDS, 该数据集是一个BIDS数据集,包含8130个视频,每个视频都配有相应的视觉模态(VM)和文本模态(TM)摘要,以及每2秒剪辑的显著性得分注释,这些得分反映了每个剪辑的重要性。此外,该数据集以(视频、TM摘要、VM摘要)的三元组格式构建,确保TM摘要准确捕捉视频的主要内容,而VM摘要则保留显著的视觉内容。这是一个大规模的数据集,包含8130个视频,其任务是进行视频的双模态语义摘要(Bissv)。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)