five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

澳门大学 发布 3AM 数据集, 应用在 多模态机器翻译、自然语言处理 领域

五号数据雷达开源数据市场2024-10-13 04:3860
3AM 是 澳门大学 发布的数据集,于 2024-04-29 首发在 arXiv 应用于 多模态机器翻译、自然语言处理 领域

澳门大学 本次发布的数据集 3AM, 3AM是一个包含26,000对英汉平行句子和相应图像的多模态机器翻译数据集,由澳门大学计算机与信息科学系NLP2CT实验室创建。该数据集设计用于包含更多的歧义和更广泛的标题与图像种类,通过使用词义消歧模型从视觉与语言数据集中选择歧义数据,形成更具挑战性的数据集。3AM旨在通过提供丰富的视觉信息,帮助模型更好地理解视觉内容,从而提高翻译质量。该数据集适用于多模态学习和机器翻译领域的研究,特别是解决视觉信息在翻译中的有效利用问题。

查看3AM

README 内容: 

 

关于 澳门大学 , 澳门大学是澳门特别行政区唯一的公立综合性大学,提供广泛的学术课程和研究机会,涵盖人文、社会科学、自然科学、工程、医学等多个领域。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们