中国科学院自动化研究所 本次发布的数据集 Epic50k, Epic50k是一个包含50000个标注中间步骤的高质量过程监督训练数据集,由中国科学院自动化研究所的研究人员创建。该数据集通过多个大型语言模型(LLM)生成完整的思维链(CoT),并利用自适应二分搜索算法对每个中间步骤的贡献进行量化标注,从而提高数据标注的精确性和效率。数据集旨在用于数学推理过程中过程监督奖励模型(PRM)的训练,以增强大型语言模型的数学推理能力。
README 内容:
关于 中国科学院自动化研究所 , 中国科学院自动化研究所是中国科学院下属的研究机构,专注于自动化、人工智能、模式识别等领域的研究。其在人工智能和自动化技术方面取得了多项重要成果,为国家的科技发展做出了重要贡献。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)