OpenGVLab 本次发布的数据集 MMPR, MMPR数据集是一个大规模且高质量的多模态推理偏好数据集,包含约300万个样本。该数据集主要用于视觉问答任务,其特征包括图像、问题、被选答案和被拒绝答案。数据集通过微调InternVL2-8B模型并应用MPO(Mix-Preference Optimization)方法,显著提升了模型在多模态推理任务中的表现,特别是在MathVista和MathVision基准测试中取得了优异的成绩。
Dataset card 内容:
Files and versions 内容:
关于 OpenGVLab , OpenGVLab是一个专注于计算机视觉和机器学习研究的组织。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)