西北工业大学 本次发布的数据集 WenetSpeech-Yue, WenetSpeech-Yue是一个大规模的粤语语音语料库,包含了21,800小时的语音数据,跨越了10个不同的领域,并带有丰富的多维度标注,包括ASR转写、文本置信度、说话者身份、年龄、性别、语音质量评分等。该数据集的创建旨在解决现有粤语语音数据集规模小、风格和标签多样性不足的问题,为语音理解和生成任务提供了高质量的资源。数据集的创建过程采用了WenetSpeech-Pipe这一集成流程,该流程包括音频采集、说话者属性标注、语音质量标注、自动语音识别、文本后处理和识别器输出投票等六个模块,以确保语料库的多样性和高质量标注。WenetSpeech-Yue数据集的发布,为粤语语音理解和生成领域的研究和应用提供了重要的数据支持。
README 内容:
关于 西北工业大学 , 西北工业大学是中国著名的理工科大学,位于陕西省西安市,是国家“双一流”、“211工程”和“985工程”重点建设高校。学校以航空、航天、航海工程教育和科学研究为特色,培养了大批高素质人才。_simple
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)