加利福尼亚大学伯克利分校 本次发布的数据集 Robo2VLM-1, Robo2VLM-1是一个大规模的视觉问答(VQA)数据集,包含684,710个问题,涵盖463个独特的场景和3,396个机器人操作任务,来自176,000个真实机器人轨迹。该数据集旨在通过丰富的、真实的、多模态的机器人轨迹数据来增强和评估视觉语言模型(VLMs)的能力。Robo2VLM框架从人类远程操作的机器人轨迹中导出地面实况,并生成代表性的VQA查询,以评估和提高VLM在空间和交互推理方面的能力。
Dataset card 内容:
Files and versions 内容:
关于 加利福尼亚大学伯克利分校 , 加利福尼亚大学伯克利分校(University of California, Berkeley),简称UC Berkeley或Cal,是一所位于美国加利福尼亚州伯克利市公立研究型大学,是加州大学系统十个校区之一,也是世界著名的顶尖公立研究型大学。该校是1849年成立的,是美国最古老、最著名的研究型大学之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)