five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

浙江大学 发布 ScaleQM+ 数据集, 应用在 数学推理、模型训练 领域

五号数据雷达开源数据市场2025-05-22 07:3320
ScaleQM+ 是 浙江大学 发布的数据集,于 2025-05-21 首发在 arXiv 应用于 数学推理、模型训练 领域

浙江大学 本次发布的数据集 ScaleQM+, ScaleQM+是一个专门用于CoT推理跳跃桥接任务的训练数据集,基于结构化的ScaleQuestMath数据集构建,旨在自动检测推理跳跃并生成缺失的中间推理步骤,以恢复CoT的完整性和连贯性。该数据集包含从ScaleQuestMath数据集中系统地移除中间步骤的不完整推理链,以及相应的完整推理链作为参考。通过在数学推理基准上进行实验,证明在ScaleQM+上微调的模型在性能上显著优于在原始数据集上训练的模型。数据集的应用领域是数学推理,旨在解决现有数学CoT数据集中存在的推理跳跃问题,提高模型的学习和泛化能力。

查看ScaleQM+

关于 浙江大学 , 浙江大学是中国的一所综合性全国重点大学,位于浙江省杭州市,是中国著名的高等学府之一,有着悠久的历史和良好的学术声誉。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们