上海交通大学本次发布的数据集FineLAP-100k,FineLAP-100k是由上海交通大学与香港中文大学联合构建的大规模合成声音事件检测数据集,旨在解决时序标注数据稀缺的瓶颈问题。该数据集包含10万条合成音频样本,通过从FSD50K精选19,775个单事件音频片段,与1,765段环境背景音进行随机混合生成,每段音频时长10秒并包含1-5个重叠事件。数据集采用自动化流水线构建,首先通过能量阈值检测提取纯净事件片段,再结合随机信号噪比控制实现逼真合成,主要应用于开放词汇声音事件检测、音频-文本对齐等细粒度音频理解任务。
关于上海交通大学,上海交通大学是中国历史最悠久、享誉海内外的著名高等学府之一,是教育部直属并与上海市共建的全国重点大学。学校创建于1896年,涵盖理、工、医、经、管、文、法等学科门类,在国内外多个大学排名中位居前列。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)