five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

香港大学 发布 TUBench 数据集, 应用在 视觉语言模型、模型评估 领域

五号数据雷达开源数据市场2024-10-09 07:1747
TUBench 是 香港大学 发布的数据集,于 2024-10-05 首发在 arXiv 应用于 视觉语言模型、模型评估 领域

香港大学 本次发布的数据集 TUBench, TUBench是由香港大学等机构创建的一个用于评估大型视觉语言模型(LVLMs)在不可回答问题上的可靠性的基准数据集。该数据集包含2354个问题,分为1203个可回答和1151个不可回答问题,涵盖代码推理、常识推理、几何推理和数学推理等多个领域。数据集的创建过程包括使用十种不同的策略精心设计不可回答问题,并基于四种不同类型的图像(代码截图、自然图像、几何图表和统计表格截图)进行构建。TUBench旨在通过不可回答问题来评估LVLMs的信任度和幻觉问题,为模型的改进提供新的视角。

查看TUBench

README 内容: 

 

关于 香港大学 , 香港大学(The University of Hong Kong,简称HKU)是香港最古老的高等教育机构,成立于1911年。它是一所全球知名的研究型大学,提供广泛的学科领域,包括人文、社会科学、自然科学、工程和医学等。香港大学在全球大学排名中名列前茅,致力于培养具有国际视野和创新能力的人才。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们