新加坡国立大学 本次发布的数据集 MMDocBench, MMDocBench是由新加坡国立大学创建的一个综合性数据集,旨在评估大型视觉语言模型在细粒度视觉文档理解中的能力。该数据集包含4338个QA对和11353个支持区域,涵盖了研究论文、收据、财务报告、维基百科表格、图表和信息图等多种文档类型。数据集的创建过程包括从21个文档理解数据集中选择文档图像,并生成QA对和相应的支持区域。MMDocBench主要应用于评估模型在文档图像中的细粒度视觉感知和推理能力,旨在解决模型在理解复杂文档内容时的不足。
关于 新加坡国立大学 , 新加坡国立大学是一所位于新加坡的公立研究型大学,以其卓越的学术研究和教育质量在国际上享有盛誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)