five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

英国萨里大学 发布 Human Annotated Dataset for Quality Assessment of Emotion Translation (HADQAET) 数据集, 应用在 机器翻译、情感分析 领域

五号数据雷达开源数据市场2025-03-22 06:5331
Human Annotated Dataset for Quality Assessment of Emotion Translation (HADQAET) 是 英国萨里大学 发布的数据集,于 2025-03-20 首发在 arXiv 应用于 机器翻译、情感分析 领域

英国萨里大学 本次发布的数据集 Human Annotated Dataset for Quality Assessment of Emotion Translation (HADQAET), HADQAET数据集是由英国萨里大学的研究团队创建的,用于评估情感翻译质量的标注数据集。该数据集来源于微博情感分类技术评测数据集,包含34768条中文推文样本文本,每条文本都被标注了六种情绪之一。数据集经过筛选,保留了5538条包含网络俚语的文本,并使用谷歌翻译进行了英译。此外,数据集还包含了质量评估数据、错误单词和相关参考翻译。

查看Human Annotated Dataset for Quality Assessment of Emotion Translation (HADQAET)

README 内容: 

 

关于 英国萨里大学 , 英国萨里大学(University of Surrey)位于英国Guildford,是一所著名的公立研究型大学。成立于1966年,萨里大学以其在科学、工程、技术和商业等领域的高质量教育和研究闻名。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们