Mohamed Bin Zayed University of Artificial Intelligence, UAE 本次发布的数据集 ArVoice, ArVoice是一个包含多种发音的现代标准阿拉伯语(MSA)语音语料库,包含带变音符号的转录文本,主要用于多发音人语音合成,也可用于语音基转换、声音转换和深度伪造检测等任务。该数据集包括:1)六位声音人才的新专业录音集,具有多样化的人口统计数据;2)阿拉伯语音语料库的修改子集;3)来自两个商业系统的优质合成语音。整个语料库共有83.52小时的语音,涵盖11个声音,其中约10小时由7位说话者的真人声音组成。我们训练了三个开源的文本到语音(TTS)和两个声音转换系统,以展示数据集的使用案例。语料库可供研究使用。
Dataset card 内容:
Files and versions 内容:
关于 Mohamed Bin Zayed University of Artificial Intelligence, UAE , -
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)