澳大利亚国立大学 本次发布的数据集 Effective Chart Dataset (ECD), ECD 是一个高质量的图表数据集,旨在提高 MLLM 的图表理解能力。它由超过 10,000 张图表图像和 300,000 多个 QA 对组成,涵盖 29 种图表类型和超过 250 种不同的图表类型组合。ECD 的数据合成流程包括五个关键步骤:单个图表生成、组合子图生成、图表图像多样化、低质量图表过滤以及 QA 对的合成和过滤。ECD 在各种真实世界和合成测试集上始终如一地提高了各种 MLLM 的性能。
查看Effective Chart Dataset (ECD)
Dataset card 内容:
Files and versions 内容:
关于 澳大利亚国立大学 , 澳大利亚国立大学是一所享誉世界的公立研究型大学,位于澳大利亚首都堪培拉,是澳大利亚顶尖的研究和教学机构之一,以其在科学、技术、人文和社会科学领域的卓越成就而著名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)