京东探索学院 本次发布的数据集 HOIGen-1M, HOIGen-1M是一个大规模的高质量人类对象交互视频生成数据集,由京东探索学院等机构构建。该数据集包含超过一百万段经过人工验证的、涵盖多种人类对象交互场景的高质量视频。这些视频选自80百万段原始视频,经过严格的筛选和处理流程,包括元数据过滤、光学字符识别去除、美学评分筛选、动作评分筛选、语言模型评估和人工审核。数据集的视频分辨率至少为720p,包含三种细粒度交互类型,旨在为文本到视频的生成任务提供支持。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)