five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

萨里大学 发布 英语-俄语时尚语料库 数据集, 应用在 时尚、多语言翻译 领域

五号数据雷达开源数据市场2024-12-06 18:0532
英语-俄语时尚语料库 是 萨里大学 发布的数据集,于 2024-12-04 首发在 arXiv 应用于 时尚、多语言翻译 领域

萨里大学 本次发布的数据集 英语-俄语时尚语料库, 英语-俄语时尚语料库是由萨里大学翻译研究中心创建的,用于评估ChatGPT在术语提取和定义生成方面的准确性。该数据集包含24本时尚杂志和52个时尚网站的内容,涵盖英语和俄语两种语言,总词汇量超过180万。数据集的创建过程包括从网络收集、下载、格式转换和文本清理等多个步骤,旨在为翻译和术语提取提供高质量的语料支持。该数据集主要应用于时尚领域的术语提取和定义生成,旨在解决多语言环境下专业术语的准确性和一致性问题。

查看英语-俄语时尚语料库

关于 萨里大学 , 萨里大学是英国的一所著名公立研究型大学,位于英格兰萨里郡的吉尔福德。该校在工程、科学、社会科学和健康科学等领域享有盛誉。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们