西蒙弗雷泽大学 本次发布的数据集 B(asic) E(motion) R(andom phrase) S(hou)t(s) (BERSt) 数据集, BERSt数据集是一个包含距离远、情感丰富和喊叫的语音数据集,由98位演员在不同的家庭环境中使用智能手机录制而成。数据集包含约4小时的英语语音,涵盖了不同的地区和非本地口音。数据集包含7种不同的情感提示,以及口语和喊叫的表述。智能手机被放置在19个不同的位置,包括有遮挡物和与演员在不同房间的位置。该数据集公开可用,可用于评估各种语音识别任务,包括自动语音识别、喊叫检测和语音情感识别。数据集的创建旨在帮助微调语音识别任务,并为距离远、高唤醒度的语音提供可靠的语音识别。该数据集对于自动语音识别和语音情感识别任务都具有挑战性,需要继续努力提高此类系统的鲁棒性,以实现更准确的真实世界应用。
查看B(asic) E(motion) R(andom phrase) S(hou)t(s) (BERSt) 数据集
Dataset card 内容:
Files and versions 内容:
关于 西蒙弗雷泽大学 , 西蒙弗雷泽大学(Simon Fraser University, SFU)成立于1965年,位于加拿大不列颠哥伦比亚省,是一所以研究和教育著称的综合性大学。大学设有多个学院,提供包括计算机科学在内的多种学科的研究与教学项目。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)