华盛顿大学 本次发布的数据集 PointArena, PointArena是一个全面的多模态指点点评价平台,由华盛顿大学、艾伦人工智能研究所和安德森学院职业技术学院的研究团队开发。该平台包含三个部分:Point-Bench,一个包含约1000个指点点任务的定制数据集,分为五个推理类别;Point-Battle,一个交互式、基于网络的竞技场,用于模型之间的匿名、成对比较,已经收集了超过4500个匿名投票;Point-Act,一个现实世界的机器人操作系统,允许用户直接评估多模态模型在现实场景中的指点点能力。PointArena旨在通过语言指导的多模态指点点任务,评估多模态模型的空间定位精度,并支持下游应用,如机器人技术、增强现实和人机交互。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)