东北大学 本次发布的数据集 术语增强语音识别与翻译数据集, 该数据集旨在支持语音识别和翻译任务中的术语干预研究,通过重新利用实体识别(NER)数据集中的实体作为术语,并使用MegaTTS生成相应的语音数据,以及从LibriSpeech和Aishell-2数据集中提取特定词汇或短语作为术语,从而构建了一个用于术语增强语音识别与翻译任务的专用数据集。该数据集包含中文和英文数据,并通过ComMT术语翻译测试集进行评估。
README 内容:
关于 东北大学 , 东北大学是中国的一所综合性大学,位于辽宁省沈阳市。学校成立于1923年,是教育部直属的全国重点大学,也是国家“211工程”和“985工程”的首批重点建设高校之一。_simple
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)