five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

罗切斯特大学 发布 VERIFY 数据集, 应用在 视觉推理、模型评估 领域

五号数据雷达开源数据市场2025-03-18 10:4834
VERIFY 是 罗切斯特大学 发布的数据集,于 2025-03-15 首发在 arXiv 应用于 视觉推理、模型评估 领域

罗切斯特大学 本次发布的数据集 VERIFY, VERIFY数据集是由罗切斯特大学和中佛罗里达大学的研究人员创建的,旨在评估最先进的 多模态大型语言模型(MLLMs)的视觉推理能力。该数据集包含多样化的视觉推理任务,要求模型主要依赖视觉信息进行推理,减少了文本上下文的依赖,以降低领域特定知识和语言偏见的影响。每个问题都伴有由人类标注的推理路径,这有助于深入评估模型的决策过程。VERIFY覆盖了从逻辑运算到3D几何和数学的各种模式,为视觉推理的细粒度评估提供了一个透明且可解释的框架。

查看VERIFY

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们