华威大学 本次发布的数据集 MedHallBench, MedHallBench是由华威大学、克兰菲尔德大学和牛津大学的研究团队开发的一个基准数据集,专门用于评估医学大语言模型(MLLMs)中的幻觉问题。该数据集通过整合专家验证的医学案例场景和现有医学数据库构建,涵盖了广泛的医学知识和临床情境。数据集的内容包括详细的医学案例、医学文献和临床报告,确保了数据的多样性和深度。创建过程中,研究人员采用了自动标注方法,如强化学习与人类反馈(RLHF),以提高数据标注的效率和准确性。MedHallBench的应用领域主要集中在医疗保健领域,旨在解决MLLMs在生成医学信息时的幻觉问题,从而提高模型在临床环境中的可靠性和安全性。
关于 华威大学 , 华威大学(University of Warwick)是英国的一所世界顶尖的研究型大学,位于英格兰中部的考文垂市。成立于1965年,华威大学以其卓越的学术研究和教学质量而闻名,尤其在商科、工程、数学和计算机科学等领域具有很高的国际声誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)