萨里大学 本次发布的数据集 英语-俄语时尚语料库, 英语-俄语时尚语料库是由萨里大学翻译研究中心创建的,用于评估ChatGPT在术语提取和定义生成方面的准确性。该数据集包含24本时尚杂志和52个时尚网站的内容,涵盖英语和俄语两种语言,总词汇量超过180万。数据集的创建过程包括从网络收集、下载、格式转换和文本清理等多个步骤,旨在为翻译和术语提取提供高质量的语料支持。该数据集主要应用于时尚领域的术语提取和定义生成,旨在解决多语言环境下专业术语的准确性和一致性问题。
关于 萨里大学 , 萨里大学是英国的一所著名公立研究型大学,位于英格兰萨里郡的吉尔福德。该校在工程、科学、社会科学和健康科学等领域享有盛誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)