Trishul lab 本次发布的数据集 PutnamBench, 该数据集名为PutnamBench,包含了1692个手工构建的形式化证明,这些证明源自北美顶级本科数学竞赛——威廉·洛厄尔·普特南数学竞赛中的640个定理。这些形式化证明以Lean 4、Isabelle以及部分以Coq语言编写,为当前的定理证明方法带来了重大挑战。该数据集的规模为1692个形式化证明,覆盖了640个定理。其任务旨在评估神经定理证明器解决竞赛数学问题的能力。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)