five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

香港中文大学 发布 MINT-CoT 数据集, 应用在 数学推理、多模态数据处理 领域

五号数据雷达开源数据市场2025-06-07 07:0374
MINT-CoT 是 香港中文大学 发布的数据集,于 2025-06-06 首发在 arXiv 应用于 数学推理、多模态数据处理 领域

香港中文大学 本次发布的数据集 MINT-CoT, MINT-CoT数据集由香港中文大学多媒体实验室构建,包含54,000个数学问题,每个问题都与其推理步骤在token级别上与视觉区域对齐,并伴随一个严格的数据生成流程。该数据集旨在解决现有方法在解决数学问题时所面临的三个主要限制:依赖于粗粒度的框状图像区域、视觉编码器对数学内容的感知有限以及依赖于外部能力进行视觉修改。MINT-CoT数据集通过在推理步骤中自适应地交织相关视觉token,为训练多模态数学推理模型提供了基础。

查看MINT-CoT

README 内容: 

 

关于 香港中文大学 , 香港中文大学是一所位于中国香港的公立研究型大学,成立于1963年,是香港的第二所大学。中大以书院制模式办学,并提供广泛的本科及研究生课程。多媒体实验室(MMLab)是该大学下属的研究实验室,专注于多媒体技术的研究与开发。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们