中国科学院本次发布的数据集Soccer-GMR,Soccer-GMR是由中国科学院自动化研究所等机构构建的大规模足球视频时序检索基准数据集,包含139场多样化比赛的5.5K视频片段和22.1K查询-时刻对。数据集通过半自动化流程生成,覆盖空集拒绝、单时刻检索和多时刻检索三种场景,具有时长可调的滑动窗口设计和平衡采样策略。其创新性体现在真实场景中的自然负样本构建和细粒度事件标注,适用于视频语言理解、多模态检索等研究领域,旨在解决传统视频时刻检索任务中单时刻假设与真实场景不匹配的核心问题。


中国科学院本次发布的数据集Soccer-GMR,Soccer-GMR是由中国科学院自动化研究所等机构构建的大规模足球视频时序检索基准数据集,包含139场多样化比赛的5.5K视频片段和22.1K查询-时刻对。数据集通过半自动化流程生成,覆盖空集拒绝、单时刻检索和多时刻检索三种场景,具有时长可调的滑动窗口设计和平衡采样策略。其创新性体现在真实场景中的自然负样本构建和细粒度事件标注,适用于视频语言理解、多模态检索等研究领域,旨在解决传统视频时刻检索任务中单时刻假设与真实场景不匹配的核心问题。
