香港中文大学 本次发布的数据集 MINT-CoT, MINT-CoT数据集由香港中文大学多媒体实验室构建,包含54,000个数学问题,每个问题都与其推理步骤在token级别上与视觉区域对齐,并伴随一个严格的数据生成流程。该数据集旨在解决现有方法在解决数学问题时所面临的三个主要限制:依赖于粗粒度的框状图像区域、视觉编码器对数学内容的感知有限以及依赖于外部能力进行视觉修改。MINT-CoT数据集通过在推理步骤中自适应地交织相关视觉token,为训练多模态数学推理模型提供了基础。
README 内容:
关于 香港中文大学 , 香港中文大学是一所位于中国香港的公立研究型大学,成立于1963年,是香港的第二所大学。中大以书院制模式办学,并提供广泛的本科及研究生课程。多媒体实验室(MMLab)是该大学下属的研究实验室,专注于多媒体技术的研究与开发。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)