Yale NLP Lab 本次发布的数据集 M3SciQA, M3SciQA是一个多模态多文档科学问答基准,旨在更全面地评估基础模型。该数据集包含1,452个专家注释的问题,涵盖70个自然语言处理(NLP)论文集群,每个集群代表一篇主要论文及其所有引用的文档。数据集的特征包括问题、答案、图像、arXiv ID、模态类型、推理类型等。数据集分为测试集和验证集,分别包含1000个和452个样本。
Dataset card 内容:
Files and versions 内容:
关于 Yale NLP Lab , Yale NLP Lab是耶鲁大学的一个自然语言处理实验室,专注于研究和发展自然语言处理技术,致力于推动该领域的前沿研究与应用。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)