five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

谷歌研究院发布WAXAL数据集,应用在语音识别、文本转语音领域

五号数据雷达开源数据市场2026-03-04 05:2224
WAXAL是谷歌研究院发布的数据集,于2026-03-03首发在arXiv应用于语音识别、文本转语音领域

谷歌研究院本次发布的数据集WAXAL,WAXAL是由谷歌研究院联合非洲多所高校及社区组织构建的大规模多语言非洲语音语料库,涵盖24种撒哈拉以南非洲语言。该数据集包含两部分:ASR数据集含1,250小时自然语音转录数据,来自多样化说话者;TTS数据集含235小时高质量单说话者录音,采用音素平衡脚本。数据通过图像提示法和专业录音室采集,经本地语言专家转录与质量控制。该资源旨在突破非洲语言在语音技术中的资源瓶颈,支持自动语音识别、文本转语音系统的开发,促进语言数字保存与技术包容性发展。

查看WAXAL

关于谷歌研究院,谷歌研究院是谷歌公司的研究部门,专注于计算机科学及相关领域的前沿研究,包括人工智能、机器学习、自然语言处理等。

关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们