浙江大学 本次发布的数据集 ScaleQM+, ScaleQM+是一个专门用于CoT推理跳跃桥接任务的训练数据集,基于结构化的ScaleQuestMath数据集构建,旨在自动检测推理跳跃并生成缺失的中间推理步骤,以恢复CoT的完整性和连贯性。该数据集包含从ScaleQuestMath数据集中系统地移除中间步骤的不完整推理链,以及相应的完整推理链作为参考。通过在数学推理基准上进行实验,证明在ScaleQM+上微调的模型在性能上显著优于在原始数据集上训练的模型。数据集的应用领域是数学推理,旨在解决现有数学CoT数据集中存在的推理跳跃问题,提高模型的学习和泛化能力。
关于 浙江大学 , 浙江大学是中国的一所综合性全国重点大学,位于浙江省杭州市,是中国著名的高等学府之一,有着悠久的历史和良好的学术声誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)