five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

HKUST NLP Group 发布 gsm8k-fix 数据集, 应用在 数学问题解决、文本生成 领域

五号数据雷达开源数据市场2024-12-13 01:4534
gsm8k-fix 是 HKUST NLP Group 发布的数据集,于 2024-07-24 首发在 HuggingFace 应用于 数学问题解决、文本生成 领域

HKUST NLP Group 本次发布的数据集 gsm8k-fix, GSM8K (Fixed) 数据集是原始 GSM8K 数据集的修正版本,包含多个特征如 id, query, query4test, query_src_agent, query_src_method, domain, stage, gt_ans, query_metadata, resp, resp_src_agent, resp_src_method, ans, ans_correct, ration_type, proc_correct_prob, 和 resp_metadata。该数据集用于文本生成任务,并标记为 mathematics。数据集包含一个训练分割,有 8792 个示例。README 文件还提到,错误标签是通过检查强大的 DeepSeekMath-7B-RL 模型的不合理低通过率来修正的。目前仅训练集已被修正。

查看gsm8k-fix

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 HKUST NLP Group , HKUST NLP Group是香港科技大学的一个自然语言处理研究团队,专注于语言技术、机器翻译及人工智能相关领域的前沿研究和应用开发。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们