英国萨里大学 本次发布的数据集 Human Annotated Dataset for Quality Assessment of Emotion Translation (HADQAET), HADQAET数据集是由英国萨里大学的研究团队创建的,用于评估情感翻译质量的标注数据集。该数据集来源于微博情感分类技术评测数据集,包含34768条中文推文样本文本,每条文本都被标注了六种情绪之一。数据集经过筛选,保留了5538条包含网络俚语的文本,并使用谷歌翻译进行了英译。此外,数据集还包含了质量评估数据、错误单词和相关参考翻译。
查看Human Annotated Dataset for Quality Assessment of Emotion Translation (HADQAET)
README 内容:
关于 英国萨里大学 , 英国萨里大学(University of Surrey)位于英国Guildford,是一所著名的公立研究型大学。成立于1966年,萨里大学以其在科学、工程、技术和商业等领域的高质量教育和研究闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)