Saama AI Research 本次发布的数据集 MedMCQA, MedMCQA是由印度Saama AI Research创建的大规模多学科多选题数据集,专为医学领域问答设计。该数据集包含超过19.4万个高质量的AIIMS和NEET PG入学考试多选题,覆盖2400个医疗保健主题和21个医学科目,平均令牌长度为12.77,具有高度的主题多样性。每个样本包含一个问题、正确答案和其他选项,需要模型具备深入的语言理解能力,测试模型在广泛医学科目和主题上的10多种推理能力。数据集旨在解决实际医学入学考试问题,适用于研究自动问答系统在医学领域的应用,旨在提高模型在复杂医学科目上的理解和推理能力。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)