five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

东北大学 发布 Multi-Modal Retrieval-Augmented Generation (M2RAG) 数据集, 应用在 多模态数据处理、机器学习 领域

五号数据雷达开源数据市场2025-02-26 19:3334
Multi-Modal Retrieval-Augmented Generation (M2RAG) 是 东北大学 发布的数据集,于 2025-02-25 首发在 arXiv 应用于 多模态数据处理、机器学习 领域

东北大学 本次发布的数据集 Multi-Modal Retrieval-Augmented Generation (M2RAG), M2RAG是一个包含四个任务的基准:图像字幕、多模态问答、多模态事实验证和图像重排。该数据集由WebQA和Factify两个数据集构建而成,共3000个实例,用于训练和评估。M2RAG基准的任务设计在开放域环境中进行,要求MLLMs从多模态文档集合中检索知识,并利用这些知识回答问题。

查看Multi-Modal Retrieval-Augmented Generation (M2RAG)

README 内容: 

 

关于 东北大学 , 东北大学位于辽宁省沈阳市,是一所以工为主,工学、理学、管理学、文学、法学、经济学、艺术学等多学科协调发展的全国重点大学。学校拥有多个学院和研究机构,在国内外具有较高的学术地位。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们