five

五号数据雷达

资产融资
资源入表
产品交易
知识产权
首页 / 开源数据市场 / 正文
上海人工智能实验室 发布 MM-K12 数据集, 应用在 数学教育、多模态推理 领域
五号数据雷达开源数据市场2025-05-21 07:4329
MM-K12 是 上海人工智能实验室 发布的数据集,于 2025-05-20 首发在 arXiv 应用于 数学教育、多模态推理 领域

上海人工智能实验室 本次发布的数据集 MM-K12, MM-K12是一个包含10,000个多模态数学问题的数据集,这些问题均来自K-12教育领域,并具有可验证的答案。该数据集用于训练MM-PRM模型,该模型是一个过程奖励模型,旨在通过细粒度的监督来提高多模态数学推理的能力。MM-K12数据集是通过收集和整理高质量的数学问题构建的,并使用蒙特卡洛树搜索算法自动生成了超过700,000个步骤级别的标注,无需人工标注。该数据集为多模态数学推理领域提供了一个强大的数据基础,有助于训练和评估过程奖励模型,从而提高模型的推理质量和鲁棒性。

查看MM-K12

README 内容: 

 

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们