中国科学院自动化研究所 本次发布的数据集 Multimodal Agricultural Agent Dataset, 本研究构建了一个多模态农业智能体数据集,包含五大任务:分类、检测、视觉问题回答(VQA)、工具选择和智能体评估。数据集涵盖了18种不同的甘蔗病害类别,分类任务有大约10万张注释图像,检测任务有6万多张标签样本。此外,还构建了一个包含超过16万样本的双语(中文和英文)视觉问题回答数据集。该数据集为训练和评估农业视觉语言模型提供了宝贵的资源,并展示了自动生成大规模领域特定VQA数据的有效性。
查看Multimodal Agricultural Agent Dataset
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)