IBM Research Israel 本次发布的数据集 REAL-MM-RAG, REAL-MM-RAG数据集是由IBM Research Israel和Weizmann Institute of Science创建的多模态检索基准。该数据集包含8000页文档,涵盖四个子领域,旨在满足真实世界检索的四个关键特性:多模态文档、增强难度、真实RAG查询和准确标注。数据集包括文本、图表、表格和图像等,要求系统处理组合的文本和视觉数据。数据集通过自动化管道进行查询生成、过滤、重写和错误验证,以提供可靠的评估和多级别的查询重写鲁棒性评估。
关于 IBM Research Israel , IBM Research Israel是IBM公司在以色列的研究机构,致力于科学研究和新技术开发,是全球最大的工业研究机构之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)