香港中文大学 本次发布的数据集 ImgCode-8.6M, ImgCode-8.6M 是目前最大的图像-代码数据集,由香港中文大学多媒体实验室(MMLab)的研究团队开发。该数据集通过图像到代码的模型 FigCodifier 生成,能够将数学相关的图像转换为详细的代码,进而渲染新的图像。ImgCode-8.6M 包含了 860 万个图像-代码对,这些数据对通过迭代训练的方式生成,确保了数据的准确性和多样性,为大型多模态模型的数学推理能力提供了强有力的支持。
README 内容:
关于 香港中文大学 , 香港中文大学,简称中大,是一所位于中国香港的公立研究型大学,成立于1963年,以“结合传统与现代,融会东方与西方”为教育理念,是香港八大院校之一,提供多个学科的本科及研究生课程。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)