StepFun 本次发布的数据集 Step-Video-TI2V-Eval, Step-Video-TI2V-Eval是一个针对文本驱动的图像到视频生成任务的新基准数据集,由StepFun创建。该数据集包含178个现实世界和120个动画风格的提示-图像对,旨在覆盖多样化的用户场景。数据集根据类别特定的属性进行精细分类,包括动态艺术元素、运动学元素等,以实现全面的表征。该数据集支持对生成的视频在指令遵循、主体和背景一致性以及物理定律遵守等方面的评估,为相关研究提供了基础。
README 内容:
关于 StepFun , StepFun是一家专注于软件开发和计算机技术服务的公司,致力于为全球客户提供高质量的创新解决方案。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)