本次发布的数据集 NuminaMath-Enhanced-CoT-JA-50K, NuminaMath Enhanced CoT Dataset (Japanese 50k Subset) 是一个从NuminaMath CoT数据集派生出来的日语数学数据集,旨在通过让大型语言模型反复思考其步骤来加强日语中的推理过程。该数据集包含50,000个样本,每个样本的英文数学问题和解决方案被翻译成日语,并通过模型生成四个日语解决方案。数据集的结构包括原始问题的索引、来源、英文问题和解决方案、日文翻译问题和解决方案、生成的解决方案以及所有四个生成的解决方案。数据集的生成过程涉及使用google/gemma-2-27b-it模型进行多次推理尝试,并通过精确匹配检查来确定最佳解决方案。数据集的使用受到Apache License 2.0和Gemma使用条款的限制。
查看NuminaMath-Enhanced-CoT-JA-50K
Dataset card 内容:
Files and versions 内容:
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)