昆士兰大学 本次发布的数据集 SynTVA, SynTVA 是一个由昆士兰大学创建的合成视频-文本数据集,旨在评估合成视频在文本到视频检索(TVR)任务中的效用。该数据集基于从 MSRVTT 训练分割中提取的 800 个多样化的用户查询,使用先进的 T2V 模型生成了 2400 个视频,并沿四个关键语义对齐维度(对象和场景、动作、属性和提示保真度)对每个视频-文本对进行了标注。SynTVA 数据集通过评估框架将一般视频质量评估(VQA)指标与这些对齐分数相关联,并检验它们对下游 TVR 性能的预测能力。此外,该数据集还开发了一个自动评估器来估计现有指标的对齐质量。SynTVA 数据集适用于数据增强,并能够选择高实用性的合成样本,从而显著提高 TVR 的结果。
关于 昆士兰大学 , 昆士兰大学是位于澳大利亚昆士兰州首府布里斯班的一所综合性大学,是世界著名的研究型大学之一,以其高质量的教育和研究水平享有盛誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)