five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Mohamed Bin Zayed University of Artificial Intelligence, UAE 发布 ArVoice 数据集, 应用在 语音合成、阿拉伯语处理 领域

五号数据雷达开源数据市场2025-05-29 07:2931
ArVoice 是 Mohamed Bin Zayed University of Artificial Intelligence, UAE 发布的数据集,于 2025-05-27 首发在 arXiv 应用于 语音合成、阿拉伯语处理 领域

Mohamed Bin Zayed University of Artificial Intelligence, UAE 本次发布的数据集 ArVoice, ArVoice是一个包含多种发音的现代标准阿拉伯语(MSA)语音语料库,包含带变音符号的转录文本,主要用于多发音人语音合成,也可用于语音基转换、声音转换和深度伪造检测等任务。该数据集包括:1)六位声音人才的新专业录音集,具有多样化的人口统计数据;2)阿拉伯语音语料库的修改子集;3)来自两个商业系统的优质合成语音。整个语料库共有83.52小时的语音,涵盖11个声音,其中约10小时由7位说话者的真人声音组成。我们训练了三个开源的文本到语音(TTS)和两个声音转换系统,以展示数据集的使用案例。语料库可供研究使用。

查看ArVoice

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 Mohamed Bin Zayed University of Artificial Intelligence, UAE , -

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们