Multimedia Computing Group-Nanjing University本次发布的数据集SportsGrounding,SportsGrounding数据集基于MultiSports数据集的篮球子集,专注于篮球相关场景。它包含大量复杂的人与人之间以及人与物体之间的交互场景,实例数量较多。数据集基于MultiSports的视频和注释数据进行了修改,移除了六个动作过于重复且无法通过自然语言区分的视频,最终包含520个视频。它遵循MultiSports的训练/验证集划分,训练集包含374个视频,验证集包含146个视频。与其他STVG数据集不同,SportsGrounding中的每个视频包含多个描述不同目标人物的字幕。数据集的关键统计信息包括:4243个视频-文本对,平均视频时长19.70秒,平均目标时长1.49秒,平均描述长度16.89个单词。与其他数据集相比,SportsGrounding具有一些独特特点,如部分实例持续时间非常短,视频中出现的人数较多,以及更复杂的人际交互。数据格式以JSON文件提供,包含视频的边界框、帧率、起始和结束帧、描述字幕等信息。
Dataset card内容:
Files and versions内容:
关于Multimedia Computing Group-Nanjing University,Multimedia Computing Group-Nanjing University是南京大学的一个研究组织,专注于多媒体计算技术的研究与应用,致力于推动多媒体技术的发展和创新。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)