CL Research Group in Nagoya, Japan 本次发布的数据集 Simplifyingmt, SimplifyingMT数据集是一个用于简化翻译的基准数据集,特别关注儿童的翻译需求。该数据集通过在Simple English Wikipedia上使用回译方法创建,旨在替换翻译中具有高年龄获取(AoA)的词汇,使其更适合用户的语言水平。数据集包含训练、开发和测试三个部分,涵盖英语和日语两种语言。
Dataset card 内容:
Files and versions 内容:
关于 CL Research Group in Nagoya, Japan , CL Research Group是位于日本名古屋的一个研究机构,专注于计算机科学领域的前沿技术研究与创新。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)