本次发布的数据集epadb,EpaDB是一个用于发音评分研究的语音数据库,包含50名阿根廷西班牙语使用者(25名男性和25名女性)朗读英语短语的录音,总计约3.5小时的语音数据。每个说话者录制了64个短句,这些短句包含对该人群来说难以发音的音素。数据集支持发音评估、音素识别、音素级错误检测和对齐分析等任务。数据集的每个条目都是一个JSON格式的语音片段描述,包含音素序列、音素级标签、时间戳、全局评分、说话者元数据、音频元数据和参考文本转录等信息。数据集分为训练集和测试集,分别包含1,903和1,263个例子。数据集的许可为CC BY-NC 4.0,允许非商业用途并需署名。
Dataset card内容:
Files and versions内容:
关于,国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)