five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

IBM Research Israel 发布 REAL-MM-RAG 数据集, 应用在 多模态检索、文档分析 领域

五号数据雷达开源数据市场2025-02-27 11:4989
REAL-MM-RAG 是 IBM Research Israel 发布的数据集,于 2025-02-18 首发在 arXiv 应用于 多模态检索、文档分析 领域

IBM Research Israel 本次发布的数据集 REAL-MM-RAG, REAL-MM-RAG数据集是由IBM Research Israel和Weizmann Institute of Science创建的多模态检索基准。该数据集包含8000页文档,涵盖四个子领域,旨在满足真实世界检索的四个关键特性:多模态文档、增强难度、真实RAG查询和准确标注。数据集包括文本、图表、表格和图像等,要求系统处理组合的文本和视觉数据。数据集通过自动化管道进行查询生成、过滤、重写和错误验证,以提供可靠的评估和多级别的查询重写鲁棒性评估。

查看REAL-MM-RAG

关于 IBM Research Israel , IBM Research Israel是IBM公司在以色列的研究机构,致力于科学研究和新技术开发,是全球最大的工业研究机构之一。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们