法国南特大学医院 本次发布的数据集 MediQAl, MediQAl是一个法国医疗问答数据集,旨在评估语言模型在真实世界临床场景中的医学知识回忆和推理能力。该数据集包含来自法国医学考试的32,603个问题,涉及41个医学学科。数据集包括三个任务:单选题、多选题和开放式简答题。每个问题都被标记为理解或推理,以便对模型的认知能力进行详细分析。MediQAl数据集通过使用14个大型语言模型进行广泛评估,提供了一个全面的基准,用于评估语言模型在法语医学问答任务上的性能。
Dataset card 内容:
Files and versions 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)