HKUST NLP Group 本次发布的数据集 gsm8k-fix, GSM8K (Fixed) 数据集是原始 GSM8K 数据集的修正版本,包含多个特征如 id, query, query4test, query_src_agent, query_src_method, domain, stage, gt_ans, query_metadata, resp, resp_src_agent, resp_src_method, ans, ans_correct, ration_type, proc_correct_prob, 和 resp_metadata。该数据集用于文本生成任务,并标记为 mathematics。数据集包含一个训练分割,有 8792 个示例。README 文件还提到,错误标签是通过检查强大的 DeepSeekMath-7B-RL 模型的不合理低通过率来修正的。目前仅训练集已被修正。
Dataset card 内容:
Files and versions 内容:
关于 HKUST NLP Group , HKUST NLP Group是香港科技大学的一个自然语言处理研究团队,专注于语言技术、机器翻译及人工智能相关领域的前沿研究和应用开发。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)