亚利桑那州立大学 本次发布的数据集 PAC Bench, PAC Bench是一个全面的数据集,旨在评估视觉-语言模型(VLMs)在执行操纵策略时的基本属性、可利用性和约束条件(PAC)的理解。数据集包含超过30,000个注释,包括673张真实世界图像(115个对象类别、15种属性类型、每个类别1-3个定义的可利用性),100个真实世界的拟人视角场景和120个独特的模拟约束场景,跨越四个任务。PAC Bench的数据采集和整理过程采用了多方面的方法,结合了来自现实世界和模拟的图像数据,确保了视觉的多样性和真实性。该数据集的创建是为了填补现有基准在评估VLMs对执行操纵行动的基本前提的理解方面的空白,并为构建更可靠和物理地面的机器人操纵模型提供指导。
关于 亚利桑那州立大学 , 亚利桑那州立大学是美国的一所公立研究型大学,位于亚利桑那州的首府凤凰城。该校是亚利桑那州大学系统中最大的学校,以其创新的教学和研究项目而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)