HKUST NLP Group 本次发布的数据集 vrt-baseline, VRT-Baseline数据集是一个用于训练数学问题解决基准模型的合成数据集。它包含0.59百万个示例,通过DeepSeekMath-7B-RL的普通拒绝采样生成。数据集包含查询和响应两个特征,均为字符串类型。它分为一个训练集,包含590,601个示例,并采用MIT许可证。该数据集属于文本生成任务,标记为合成和数学相关。主要语言为英语,大小类别为100K 关于 HKUST NLP Group , HKUST NLP Group是香港科技大学的一个自然语言处理研究团队,专注于语言技术、机器翻译及人工智能相关领域的前沿研究和应用开发。 关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。Dataset card 内容:
Files and versions 内容:
首页 / 开源数据市场 / 正文
HKUST NLP Group 发布 vrt-baseline 数据集, 应用在 数学问题解决、文本生成 领域
五号数据雷达开源数据市场2024-12-13 01:4624
vrt-baseline 是 HKUST NLP Group 发布的数据集,于 2024-08-02 首发在 HuggingFace 应用于 数学问题解决、文本生成 领域

社区讨论
近期热门




_1769672084863.jpg)