澳大利亚阿德莱德大学 本次发布的数据集 HEALMedVQA, HEALMedVQA是一个包含67,000个视觉问答对的数据集,由医生标注的解剖分割掩码和两种新的评估协议组成。该数据集旨在评估大型语言模型的定位能力和幻觉鲁棒性。它包括闭式问题和开放式问题,用于测试模型在不同场景下的表现。HEALMedVQA数据集为评估当前多模态语言模型在医学视觉问答任务中的幻觉和准确性提供了新的基准。
关于 澳大利亚阿德莱德大学 , 澳大利亚阿德莱德大学是一所位于澳大利亚阿德莱德市的公立研究型大学,成立于1874年,是澳大利亚第三古老大学。该大学在多个领域都有显著的研究成果,包括工程、计算机科学、医学和商务等。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)