华盛顿大学 本次发布的数据集 ActionAtlas v1.0, ActionAtlas v1.0是由华盛顿大学和艾伦人工智能研究所创建的一个多选视频问答基准,专注于体育领域的专业动作识别。该数据集包含934个视频,展示了56种体育中的580个独特动作,总共有1896个动作选项。数据集的视频平均时长为6.07秒,帧率为32.18帧每秒。创建过程中,研究团队利用GPT4的广泛领域知识编译动作列表,并通过YouTube爬取相关视频,结合自动过滤工具和多轮人工筛选确保数据质量。该数据集旨在测试多模态基础模型在识别复杂运动和细微差别方面的能力,适用于体育分析和动作识别等实际应用领域。
关于 华盛顿大学 , 华盛顿大学(University of Washington)是一所位于美国华盛顿州西雅图的公立研究型大学,成立于1861年。该校在多个学科领域享有盛誉,尤其在医学、工程和计算机科学等领域具有很高的研究水平。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)