武汉大学 本次发布的数据集 AVE-PM, AVE-PM是一个专门为 portrait 模式短视频设计的音频事件定位数据集,包含25335个10秒视频剪辑,涵盖86个细粒度类别,具有帧级注释。该数据集由抖音平台上的用户生成内容构成,反映了不受约束的用户生成内容的真实情况。数据集的构建过程包括从抖音平台收集原始视频,通过众包方式进行注释,并最终切分成10秒的剪辑。该数据集旨在推动移动-centric视频内容时代的音频事件定位研究。
关于 武汉大学 , 武汉大学是中国的一所著名综合性大学,位于湖北省武汉市,以其深厚的历史底蕴和卓越的学术成就而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)