five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

萨尔兰大学发布Saar-Voice数据集,应用在方言语音、文本转语音领域

五号数据雷达开源数据市场2026-04-15 05:2312
Saar-Voice是萨尔兰大学发布的数据集,于2026-04-14首发在arXiv应用于方言语音、文本转语音领域

萨尔兰大学本次发布的数据集Saar-Voice,Saar-Voice是由萨尔兰大学团队构建的德国萨尔布吕肯方言多说话人语音语料库,包含9名说话人录制的6小时方言语音数据。数据集通过数字化印刷书籍(66.6%)、本地社区文本(32.4%)及MASSIVE数据集本地化翻译(1%)三重来源构建,涵盖诗歌、散文、民间故事等文体,共8,772个句子75,280词。该语料库采用专业录音设备在隔音室采集,包含对齐的文本-音频表征,旨在解决德语方言文本转语音(TTS)任务中低资源方言数据缺失问题,为零样本和少样本模型适配提供研究基础。

查看Saar-Voice

关于萨尔兰大学,萨尔兰大学(Saarland University)是德国萨尔州的一所公立研究型大学,成立于1948年,位于萨尔布吕肯市。该校以计算机科学、人工智能、语言技术和纳米科学等领域的研究著称,拥有多个跨学科研究中心,并与马克斯·普朗克研究所等机构保持密切合作。

关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们