OpenBMB 本次发布的数据集 VisRAG-Ret-Test-ArxivQA, 这是一个基于从arXiv出版物中提取的图表的视觉问答(VQA)数据集,源自ArXiVQA数据集。数据集包含三个配置:corpus、qrels和queries。corpus配置包含图像数据,qrels配置包含查询与文档的相关性评分,queries配置包含查询、答案和选项等信息。每个配置都有训练集,且提供了数据文件的路径。数据集的加载可以通过HuggingFace的datasets库进行。
Dataset card 内容:
Files and versions 内容:
关于 OpenBMB , OpenBMB是一个专注于大规模预训练语言模型研发与应用的开源社区。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)