北京邮电大学 本次发布的数据集 MathBook-Standard & MathBook-Pro, MathBook是一个包含数学知识的系统,由五级层次结构组成,包括491个知识点和1819个基本原理。在此基础上,我们开发了MathBook-Standard数据集,它具有广泛的覆盖范围和灵活性,并通过双重扩展确保了概念上的平衡。此外,我们还定义了一个三维难度空间,并为每个问题生成了7个渐进的变体,以构建MathBook-Pro,这是一个具有挑战性的数据集,用于稳健的训练。MathBook-Standard和MathBook-Pro数据集结合了全面的逐级注释、双重扩展的概念灵活性和原则性的三维难度建模框架,为MLLMs的结构化、渐进式学习奠定了坚实的基础。
查看MathBook-Standard & MathBook-Pro
关于 北京邮电大学 , 北京邮电大学是中国一所以信息技术为特色,工学、理学、管理学、经济学、文学、法学、教育学等多学科协调发展的全国重点大学,是中国“211工程”和“双一流”建设高校之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)