东北大学 本次发布的数据集 Multi-Modal Retrieval-Augmented Generation (M2RAG), M2RAG是一个包含四个任务的基准:图像字幕、多模态问答、多模态事实验证和图像重排。该数据集由WebQA和Factify两个数据集构建而成,共3000个实例,用于训练和评估。M2RAG基准的任务设计在开放域环境中进行,要求MLLMs从多模态文档集合中检索知识,并利用这些知识回答问题。
查看Multi-Modal Retrieval-Augmented Generation (M2RAG)
README 内容:
关于 东北大学 , 东北大学位于辽宁省沈阳市,是一所以工为主,工学、理学、管理学、文学、法学、经济学、艺术学等多学科协调发展的全国重点大学。学校拥有多个学院和研究机构,在国内外具有较高的学术地位。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)