谷歌研究院本次发布的数据集WAXAL,WAXAL是由谷歌研究院联合非洲多所高校及社区组织构建的大规模多语言非洲语音语料库,涵盖24种撒哈拉以南非洲语言。该数据集包含两部分:ASR数据集含1,250小时自然语音转录数据,来自多样化说话者;TTS数据集含235小时高质量单说话者录音,采用音素平衡脚本。数据通过图像提示法和专业录音室采集,经本地语言专家转录与质量控制。该资源旨在突破非洲语言在语音技术中的资源瓶颈,支持自动语音识别、文本转语音系统的开发,促进语言数字保存与技术包容性发展。
关于谷歌研究院,谷歌研究院是谷歌公司的研究部门,专注于计算机科学及相关领域的前沿研究,包括人工智能、机器学习、自然语言处理等。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)