爱丁堡大学 本次发布的数据集 Text to Speech Distribution Score 2 (TTSDS2), TTSDS2是一个用于评估文本到语音系统质量的资源,它通过比较合成语音与真实语音的分布相似度来评估系统。该数据集包含来自YouTube和LibriVox等多个来源的数据,涉及14种语言。TTSDS2使用多种感知因素,如说话人身份、清晰度和韵律,通过比较这些因素的分布来评估合成语音的质量。此外,该数据集还提供了一个不断更新的基准,用于14种语言的文本到语音系统。
查看Text to Speech Distribution Score 2 (TTSDS2)
关于 爱丁堡大学 , 爱丁堡大学是一所位于英国苏格兰首府爱丁堡的世界顶尖公立研究型大学,是罗素集团、科英布拉集团和欧洲研究型大学联盟成员。学校创建于1583年,历史悠久,以其卓越的教学和研究质量享誉全球。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)