five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

威斯康星大学麦迪逊分校 发布 Video MindPalace Benchmark (VMB) 数据集, 应用在 视频理解、视觉语言模型 领域

五号数据雷达开源数据市场2025-01-14 17:0122
Video MindPalace Benchmark (VMB) 是 威斯康星大学麦迪逊分校 发布的数据集,于 2025-01-08 首发在 arXiv 应用于 视频理解、视觉语言模型 领域

威斯康星大学麦迪逊分校 本次发布的数据集 Video MindPalace Benchmark (VMB), Video MindPalace Benchmark (VMB) 是一个用于评估模型在真实环境中进行空间、时间和布局关系推理能力的新型基准测试。该数据集由威斯康星大学麦迪逊分校、Meta和伊利诺伊大学厄巴纳-香槟分校的研究团队创建,旨在通过第一人称视角视频捕捉人类日常活动,并生成与3D世界紧密相关的数据。VMB包含三类问题:增强空间定位、上下文时间推理和布局感知推理,要求模型提供类似于人类理解的上下文响应。该数据集的应用领域主要集中在长视频理解和大规模视觉语言模型的推理能力提升上,旨在解决长视频分析中的时空一致性和人类对齐推理问题。

查看Video MindPalace Benchmark (VMB)

关于 威斯康星大学麦迪逊分校 , 威斯康星大学麦迪逊分校(University of Wisconsin-Madison)是美国一所著名的公立研究型大学,成立于1848年。该校是美国大学协会的创始成员之一,以其在科研、教育和公共服务方面的卓越表现而闻名。威斯康星大学麦迪逊分校在多个学科领域都有显著的研究成果,尤其在生物科学、工程学和社会科学方面享有盛誉。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们