电子科技大学 本次发布的数据集 EMMA (Enhanced MultiModal reAsoning), EMMA(增强多模态推理)数据集由电子科技大学、中山大学、华盛顿大学、微软和香港中文大学的研究团队共同创建,旨在评估多模态大语言模型在数学、物理、化学和编程领域的多模态推理能力。该数据集包含2788个问题,其中1796个是新构建的,问题类型涵盖选择题和开放式问题,涉及图像和文本的多模态推理任务。数据集的构建过程包括从现有基准中筛选问题,并通过与领域专家合作手动创建新问题。EMMA的应用领域主要集中在多模态推理能力的评估,旨在解决当前MLLMs在处理复杂多模态和多步推理任务时的局限性。
查看EMMA (Enhanced MultiModal reAsoning)
关于 电子科技大学 , 电子科技大学位于中国四川省成都市,是一所以电子信息科学技术为核心,以工为主,理工渗透,理、工、管、文协调发展的多科性研究型全国重点大学。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)