加州大学默塞德分校 本次发布的数据集 VideoMathQA, VideoMathQA是一个用于评估模型在视频中执行跨模态推理能力的基准数据集,涵盖了10个不同的数学领域,视频时长从10秒到1小时不等。数据集包含超过920人小时的专家注释,旨在解决现实世界场景中的数学推理问题,包括直接解决问题、概念转移和深度理解。每个问题都包含多步推理注释,以实现对模型能力的精细诊断。数据集旨在解决现有方法在处理视频中的数学推理时的局限性,并为评估模型在处理跨时态和模态丰富的数学问题设置时的推理能力提供了一个系统的评估框架。
关于 加州大学默塞德分校 , 加州大学默塞德分校是美国加州大学系统中的一所研究型大学,位于加利福尼亚州的默塞德。该校成立于2005年,是加州大学系统中最年轻的分校之一,致力于提供高质量的教育和研究环境。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)