本次发布的数据集MarineEval,MarineEval是第一个专门设计用于评估视觉语言模型(VLMs)在海洋理解能力方面的大规模基准测试。该数据集包含2000个专家验证的基于图像的问答对,涵盖7个任务维度和20个特定领域的能力维度,强调专业的海洋知识、视觉推理和现实世界的复杂性。通过对17种最先进的VLMs进行全面基准测试,研究发现现有的通用模型在海洋任务上表现不佳,特别是在空间推理、物种识别和生态理解方面,这凸显了领域感知训练和评估的必要性。该资源旨在促进领域专家VLMs的进步,以推动海洋科学的研究和保护。
Dataset card内容:
Files and versions内容:
关于,国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)