香港中文大学(深圳) 本次发布的数据集 SingNet, SingNet是一个大规模、多样化且在野的歌唱声音数据集,旨在解决歌唱声音合成(SVS)和歌唱声音转换(SVC)等领域中大规模和多样化数据集的缺乏问题。该数据集包含来自互联网上的歌曲和样本包中的3000小时歌唱声音,涉及多种语言和风格。为了促进使用和展示SingNet的有效性,研究者在Wav2vec2、BigVGAN和NSF-HiFiGAN等模型上进行了预训练,并在自动歌词转录(ALT)、神经声码器和歌唱声音转换(SVC)等领域进行了基准实验。该数据集的创建过程涉及从歌曲和样本包中提取干燥的歌唱声音,并使用最先进的深度学习方法、数字信号处理(DSP)算法和虚拟工作室技术(VST)插件进行处理。SingNet的数据集描述信息,包括数据集名称、创建机构、简要描述等;数据集的内容,例如数据集大小、数据量、Tokens数、数据来源等;数据集创建过程;数据集的应用领域,旨在解决歌唱声音合成和转换等问题。
关于 香港中文大学(深圳) , 香港中文大学(深圳)是一所位于中国广东省深圳市的综合性研究型大学,是香港中文大学在深圳设立的分校区。该校致力于培养具有国际视野和专业能力的优秀人才,并在数据科学等领域进行学术研究和科研创新。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)