西北工业大学 本次发布的数据集 WenetSpeech-Yue, WenetSpeech-Yue是一个大规模的粤语语音语料库,包含多维度标注,适用于语音理解和生成任务。该数据集由西北工业大学音频、语音和语言处理小组创建,包含21800小时的语音数据,涵盖了10个不同的领域。数据集的标注包括ASR转录、文本置信度、说话者身份、年龄、性别、语音质量评分等。WenetSpeech-Yue是目前最大的开源粤语语音语料库,为粤语语音理解和生成提供了宝贵的资源。
README 内容:
关于 西北工业大学 , 西北工业大学是中国著名的理工科大学,位于陕西省西安市,是国家“双一流”、“211工程”和“985工程”重点建设高校。学校以航空、航天、航海工程教育和科学研究为特色,培养了大批高素质人才。_simple
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)