Wollo University 本次发布的数据集 Mozilla Common Voice, FLEURS, BDU-speech dataset, 本文介绍了用于自动语音识别的低资源语言Amharic的三个数据集:Mozilla Common Voice、FLEURS和BDU-speech dataset。Mozilla Common Voice是一个包含多种语言的语音语料库,FLEURS是一个针对低资源语言的语音数据集,BDU-speech dataset则是包含Amharic语言的噪声语音数据集。这些数据集为改善Amharic自动语音识别模型的性能提供了基础数据。
查看Mozilla Common Voice, FLEURS, BDU-speech dataset
Dataset card 内容:
Files and versions 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)