Multimodal Vision Research Laboratory @ WashU 本次发布的数据集 iSatNat, TaxaBench-8k是一个多模态数据集,包含六种模态——图像、文本、卫星图像、音频、地理位置和环境特征,用于评估大型生态模型。
Dataset card 内容:
Files and versions 内容:
关于 Multimodal Vision Research Laboratory @ WashU , Multimodal Vision Research Laboratory @ WashU是华盛顿大学(Washington University,简称WashU)内专注于多模态视觉技术研究的实验室,致力于通过融合不同感知模态来提升机器视觉系统的性能。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)