芬兰东部大学 本次发布的数据集 MCL-MLAAD, MCL-MLAAD数据集是一个多语言语音深度伪造源追踪数据集,包含38种语言的合成语音数据,由91种TTS模型产生。该数据集用于评估多语言源追踪模型在单语言和跨语言场景下的性能,以及评估模型对未见语言和说话人的泛化能力。数据集包含420.7小时的合成语音数据,覆盖了德语、罗曼语和斯拉夫语三大语系,并包含了四种流行的TTS架构。数据集还包括四种类型的噪声扰动,以模拟多样化的声学环境。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)