联邦大学戈亚斯分校 本次发布的数据集 CML-TTS, CML-TTS是一个多语言文本到语音合成数据集,由联邦大学戈亚斯分校的人工智能卓越中心开发。该数据集基于Multilingual LibriSpeech,包含七种语言的音频书籍,旨在为多语言模型提供新的研究可能性。数据集总时长为3,233.43小时,包含613位说话者,采样率为24kHz,适用于训练TTS模型。创建过程中,数据集通过下载原始音频、文本规范化、音频分割和文本验证等步骤处理,确保数据质量。CML-TTS的应用领域主要集中在多语言TTS模型的研究和开发,以解决不同语言环境下语音合成的需求。
关于 联邦大学戈亚斯分校 , 联邦大学戈亚斯分校(Universidade Federal de Goiás, UFG)是巴西的一所公立大学,位于戈亚斯州。该大学提供广泛的本科、研究生和博士课程,涵盖科学、技术、人文和社会科学等多个领域。UFG在巴西国内享有较高的学术声誉,并在多个学科领域有着显著的研究成果。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)