西安电子科技大学 本次发布的数据集 Multiple Sentences with Shots Dataset (MSSD), Multiple Sentences with Shots Dataset (MSSD) 是由快手科技和西安电子科技大学联合创建的一个大规模文本-视频对齐数据集,专门用于视频时刻蒙太奇任务。该数据集包含多句脚本和相应的视频片段标注,旨在通过文本描述精确匹配视频片段,并生成与文本描述一致的短视频。MSSD的创建过程包括从多个视频源中提取帧和镜头,并通过精细的标注确保文本与视频片段之间的高精度对齐。该数据集主要应用于短视频编辑领域,旨在解决基于文本描述自动生成高质量短视频的问题。
查看Multiple Sentences with Shots Dataset (MSSD)
关于 西安电子科技大学 , 西安电子科技大学是中国的一所以信息与电子学科为主,工、理、管、文多学科协调发展的全国重点大学,位于陕西省西安市。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)