中国科学院计算技术研究所 本次发布的数据集 AI-generated video dataset, 该数据集是由中国科学院计算技术研究所构建的,包含由两种最先进的开源视频生成模型生成的13000个视频,旨在评估AI生成内容对视频检索模型的影响。数据集包括9000个训练视频和四个各含1000个视频的测试集。这些视频是基于MSR-VTT数据集生成的,并且通过多种策略确保生成的视频在语义上与原始视频相同。该数据集用于研究AI生成视频在检索模型中的排名偏置问题。
README 内容:
关于 中国科学院计算技术研究所 , 中国科学院计算技术研究所(ICT)成立于1956年,是中国最早从事计算机科学技术综合性研究的学术机构。该所致力于计算机科学理论、高性能计算、人工智能、网络与信息安全等领域的研究,培养了大批计算机领域的专家和学者,为中国计算机科学技术的发展做出了重要贡献。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)