five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

发布epadb数据集,应用在语音发音、音素识别领域

五号数据雷达开源数据市场2026-01-14 08:1638
epadb是发布的数据集,于2026-01-13首发在HuggingFace应用于语音发音、音素识别领域

本次发布的数据集epadb,EpaDB是一个用于发音评分研究的语音数据库,包含50名阿根廷西班牙语使用者(25名男性和25名女性)朗读英语短语的录音,总计约3.5小时的语音数据。每个说话者录制了64个短句,这些短句包含对该人群来说难以发音的音素。数据集支持发音评估、音素识别、音素级错误检测和对齐分析等任务。数据集的每个条目都是一个JSON格式的语音片段描述,包含音素序列、音素级标签、时间戳、全局评分、说话者元数据、音频元数据和参考文本转录等信息。数据集分为训练集和测试集,分别包含1,903和1,263个例子。数据集的许可为CC BY-NC 4.0,允许非商业用途并需署名。

查看epadb

Dataset card内容:

 

Files and versions内容:

 

关于,国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。

关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们