香港大学 本次发布的数据集 TUBench, TUBench是由香港大学等机构创建的一个用于评估大型视觉语言模型(LVLMs)在不可回答问题上的可靠性的基准数据集。该数据集包含2354个问题,分为1203个可回答和1151个不可回答问题,涵盖代码推理、常识推理、几何推理和数学推理等多个领域。数据集的创建过程包括使用十种不同的策略精心设计不可回答问题,并基于四种不同类型的图像(代码截图、自然图像、几何图表和统计表格截图)进行构建。TUBench旨在通过不可回答问题来评估LVLMs的信任度和幻觉问题,为模型的改进提供新的视角。
README 内容:
关于 香港大学 , 香港大学(The University of Hong Kong,简称HKU)是香港最古老的高等教育机构,成立于1911年。它是一所全球知名的研究型大学,提供广泛的学科领域,包括人文、社会科学、自然科学、工程和医学等。香港大学在全球大学排名中名列前茅,致力于培养具有国际视野和创新能力的人才。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)