five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】Orca-Math-200K - 小学数学题目数据集

五号雷达开源数据市场2024-03-06 16:4334
该数据集旨在提升语言模型的数学能力,以期为语言模型在数学问题解决方面提供坚实的基础。

Orca-Math-200K是微软创建的一个高质量的合成数据集,包含约 20 万小学数学题目,此数据集中的所有答案都是使用 Azure GPT4-Turbo 生成的。研究者创建了多个Agent,辅助数据集的构建,创建过程中涉及种子集合构建、Agent - Ask Me Anything生成问题、Agent-建议者-编辑者合作生成、DMath数据集导入、数据集增强和迭代学习过程。该数据集旨在提升语言模型的数学能力,以期为语言模型在数学问题解决方面提供坚实的基础。

数据集地址: https://huggingface.co/datasets/microsoft/orca-math-word-problems-200k
数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们