韩国成均馆大学 本次发布的数据集 OASD-20K 和 OSVAR-160, 本文介绍的两个数据集OASD-20K和OSVAR-160,分别用于音频分离和视频音频恢复。OASD-20K包含20000个混合了背景音乐和原始音轨的音频剪辑,用于训练和评估混合音乐分离模型。OSVAR-160包含160个视频和混合音频对,用于评估整个管道在去除任意背景音乐和恢复原始音轨完整性方面的性能。这些数据集填补了短视频应用中音频分离研究的空白,并为解决版权合规和内容完整性问题提供了有价值的工具。
关于 韩国成均馆大学 , 成均馆大学是韩国的一所著名综合性大学,成立于1398年,是韩国历史最悠久的大学之一。该校位于首尔特别市,提供多样的本科及研究生课程,以其高质量的教育和研究在国内外享有盛誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)