南京农业大学 本次发布的数据集 Guji_MATH, Guji_MATH数据集是基于《算经十书》构建的,用于评估经典文本的基准。数据集包含了538个数学问题,这些问题从8部经典文本中提取出来,形成了一个以“问题-答案-解决方案”框架为中心的结构化数据集,并补充了问题类型和难度级别。该数据集旨在评估主流推理模型在古典中文的独特语言限制下的数学问题解决能力。数据集采用机器辅助注释和人工验证的方式,对数学问题进行提取和标注,为从古代文本中挖掘数学知识并传播传统文化提供了方法论支持,同时为评估推理模型的跨语言和跨文化能力提供了新的视角。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)