香港中文大学 本次发布的数据集 ReliableMath, ReliableMath数据集是一个用于评估大型语言模型在数学推理任务中可靠性的数据集。它包含可解决和不可解决的数学问题。可解决的问题是来自开源数据集,如AIME,而不可解决的问题是通过一个三阶段的数据构建流程合成的,包括问题重写、模型验证和人工检查。数据集旨在帮助研究和提高大型语言模型在推理任务中的可靠性。
Dataset card 内容:
Files and versions 内容:
关于 香港中文大学 , 香港中文大学是一所位于香港的著名综合性研究型大学,以其优秀的教学质量和科研实力享誉国际。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)