five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

罗切斯特大学 发布 MMPerspective 数据集, 应用在 多模态语言模型、视觉空间理解 领域

五号数据雷达开源数据市场2025-05-29 06:2318
MMPerspective 是 罗切斯特大学 发布的数据集,于 2025-05-27 首发在 arXiv 应用于 多模态语言模型、视觉空间理解 领域

罗切斯特大学 本次发布的数据集 MMPerspective, MMPerspective是一个专为评估多模态大型语言模型(MLLMs)对透视理解能力而设计的基准数据集。该数据集由2711个真实世界和合成图像实例组成,包含5083个问题-答案对,旨在探索关键能力,如灭点感知和计数、透视类型推理、三维空间中的线关系理解等。通过全面评估43个最先进的MLLMs,揭示了模型在表面感知任务上的能力,以及在组合推理和保持空间一致性方面的局限性。MMPerspective为诊断和推进视觉语言系统中的空间理解提供了一个宝贵的测试平台。

查看MMPerspective

关于 罗切斯特大学 , 罗切斯特大学位于美国纽约州罗切斯特市,是一所著名的私立研究型大学,提供广泛的学术课程和研究机会,尤其在计算机科学、工程和医学领域享有盛誉。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们