卡内基梅隆大学本次发布的数据集FineProofs-SFT; FineProofs-RL,FineProofs数据集由LM Provers团队构建,包含约5000条经过严格筛选的奥林匹克数学证明问题,涵盖几何、数论、代数等领域。数据源自Art of Problem Solving论坛及国际数学竞赛官方题解,通过多阶段过滤去除噪声问题并标注难度等级。该数据集采用分级评分机制,为强化学习提供细粒度反馈,支持小模型在数学定理证明领域的性能突破,应用于开放数学推理研究。
查看FineProofs-SFT; FineProofs-RL
关于卡内基梅隆大学,卡内基梅隆大学(Carnegie Mellon University)是一所位于美国宾夕法尼亚州匹兹堡的私立研究型大学,以计算机科学、人工智能、工程学、商业和艺术等领域的卓越教育和研究而闻名。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)