四川大学 本次发布的数据集 CRITIC-math, CRITIC-math数据集由四川大学、北京人工智能研究院、新加坡国立大学数据科学研究所的研究人员创建,旨在评估大型推理模型在面对信息不完整的问题时的提问能力。该数据集包含两类信息不完整的问题:缺少目标和缺少前提。通过重写开源数据集中的问题,并对重写的问题进行人工验证,CRITIC-math生成了1.3K个测试数据和5.3K个训练数据。数据集的特点是包含两种类型的不完整性、更具挑战性和多样化的数学问题、现实任务形式(即自由形式的问题)以及一个允许我们检查微调如何影响提问能力的训练集。
Dataset card 内容:
Files and versions 内容:
关于 四川大学 , 四川大学是中国西南地区的一所综合性大学,拥有广泛的学科领域,包括自然科学、工程、医学、文学、法学等,是中国重点高等教育机构之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)