威斯康星大学麦迪逊分校 本次发布的数据集 Video MindPalace Benchmark (VMB), Video MindPalace Benchmark (VMB) 是一个用于评估模型在真实环境中进行空间、时间和布局关系推理能力的新型基准测试。该数据集由威斯康星大学麦迪逊分校、Meta和伊利诺伊大学厄巴纳-香槟分校的研究团队创建,旨在通过第一人称视角视频捕捉人类日常活动,并生成与3D世界紧密相关的数据。VMB包含三类问题:增强空间定位、上下文时间推理和布局感知推理,要求模型提供类似于人类理解的上下文响应。该数据集的应用领域主要集中在长视频理解和大规模视觉语言模型的推理能力提升上,旨在解决长视频分析中的时空一致性和人类对齐推理问题。
查看Video MindPalace Benchmark (VMB)
关于 威斯康星大学麦迪逊分校 , 威斯康星大学麦迪逊分校(University of Wisconsin-Madison)是美国一所著名的公立研究型大学,成立于1848年。该校是美国大学协会的创始成员之一,以其在科研、教育和公共服务方面的卓越表现而闻名。威斯康星大学麦迪逊分校在多个学科领域都有显著的研究成果,尤其在生物科学、工程学和社会科学方面享有盛誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)