希腊塞萨洛尼基CERTH-ITI研究中心 本次发布的数据集 SD-MVSum, SD-MVSum是一个用于脚本驱动的多模态视频摘要的数据集,它扩展了现有的S-VideoXum和MrHiSum数据集,使其适合于训练和评估脚本驱动的多模态视频摘要方法。该数据集包含了视频、文本(摘要脚本)和语音转写,并提供了真实的视频摘要和摘要描述。
关于 希腊塞萨洛尼基CERTH-ITI研究中心 , -
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)