上海人工智能实验室 本次发布的数据集 MM-K12, MM-K12是一个包含10,000个多模态数学问题的数据集,这些问题均来自K-12教育领域,并具有可验证的答案。该数据集用于训练MM-PRM模型,该模型是一个过程奖励模型,旨在通过细粒度的监督来提高多模态数学推理的能力。MM-K12数据集是通过收集和整理高质量的数学问题构建的,并使用蒙特卡洛树搜索算法自动生成了超过700,000个步骤级别的标注,无需人工标注。该数据集为多模态数学推理领域提供了一个强大的数据基础,有助于训练和评估过程奖励模型,从而提高模型的推理质量和鲁棒性。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。




_1769672084863.jpg)