萨尔兰大学本次发布的数据集Saar-Voice,Saar-Voice是由萨尔兰大学团队构建的德国萨尔布吕肯方言多说话人语音语料库,包含9名说话人录制的6小时方言语音数据。数据集通过数字化印刷书籍(66.6%)、本地社区文本(32.4%)及MASSIVE数据集本地化翻译(1%)三重来源构建,涵盖诗歌、散文、民间故事等文体,共8,772个句子75,280词。该语料库采用专业录音设备在隔音室采集,包含对齐的文本-音频表征,旨在解决德语方言文本转语音(TTS)任务中低资源方言数据缺失问题,为零样本和少样本模型适配提供研究基础。
关于萨尔兰大学,萨尔兰大学(Saarland University)是德国萨尔州的一所公立研究型大学,成立于1948年,位于萨尔布吕肯市。该校以计算机科学、人工智能、语言技术和纳米科学等领域的研究著称,拥有多个跨学科研究中心,并与马克斯·普朗克研究所等机构保持密切合作。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)