本次发布的数据集 VNJPTranslate, Vietnamese-Japanese Parallel Corpus是一个旨在为越南语和日语之间的翻译任务设计的双语数据集。它包含3.3M行平行文本,适用于开发和评估机器翻译系统和自然语言处理(NLP)应用。该数据集涵盖了法律和金融领域的文本,为翻译模型的改进、针对法律和金融环境的NLP应用程序的增强以及低资源语言对的研究提供了高质量的特定领域训练数据。
Dataset card 内容:
Files and versions 内容:
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)