阿尔托大学 本次发布的数据集 Finnish Parliament ASR corpus, Finnish Parliament ASR corpus是由阿尔托大学创建的,目前最大的公开可用芬兰语自动语音识别(ASR)数据集,包含超过3000小时的手动转录语音数据和449位发言者的丰富人口统计元数据。该数据集基于早期的初步工作,自然地分为两个训练子集,分别来自两个不同的时间段,并提供了两个官方的修正测试集,覆盖不同的时间段,设置了具有纵向分布变化特性的ASR任务。此外,还提供了一个官方开发集。数据集的应用领域包括ASR系统的训练和评估,以及解决语音识别中的性别、年龄和教育水平偏差问题。
查看Finnish Parliament ASR corpus
关于 阿尔托大学 , 阿尔托大学是一所位于芬兰的著名综合性研究型大学,以创新科研和艺术设计闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)