Metarch 本次发布的数据集 MultiNet, MultiNet是一个全面的开放源代码基准测试软件套件,旨在促进通用智能模型的开发和评估。它包含一个大规模的通用数据集,汇集了来自多个领域(视觉、语言、控制)的大量数据,包括图像字幕、视觉问答、常识推理、机器人控制、数字游戏玩法、模拟移动/操作等多种任务。此外,MultiNet还提供了一个开源的数据管理SDK,用于方便地下载和使用数据集。它还引入了一套系统化的评估工具和指标,用于评估最先进的视觉语言模型和视觉语言行动模型的泛化能力。通过开源这些工具和资源,MultiNet旨在促进社区对通用智能系统的开发和研究。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)