本次发布的数据集 AVSBench-Object, 该数据集名为AVSBench-Object,分为两个子集,分别针对音频视觉分割的S4和MS3子任务,提供了视频中对声音源像素级的二进制标签。此外,数据集还为V2子集额外提供了语义标签,涵盖了71个类别,包括人类、乐器、动物和工具等。在规模上,S4子集包含4,932个视频(其中3,452个用于训练,740个用于验证,740个用于测试),而MS3子集包含424个视频(其中286个用于训练,64个用于验证,64个用于测试)。该数据集的任务是进行音频视觉分割。
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)