中国科学院自动化研究所 本次发布的数据集 VidCapBench, VidCapBench是一个针对可控文本到视频(T2V)生成的视频字幕评估方案,由中国科学院自动化研究所等机构创建。该数据集包含643个经过丰富标注的视频片段,这些视频片段与关键信息相关,如视频美学、内容、动作和物理定律。VidCapBench将关键信息属性分为可自动评估和手动评估的子集,以满足敏捷开发和彻底验证的需求。数据集适用于T2V模型训练的评估。
README 内容:
关于 中国科学院自动化研究所 , 中国科学院自动化研究所是中国科学院下属的研究机构,专注于自动化、人工智能、模式识别等领域的研究。其在人工智能和自动化技术方面取得了多项重要成果,为国家的科技发展做出了重要贡献。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)