上海人工智能实验室 本次发布的数据集 MedGPTEval, MedGPTEval是由上海人工智能实验室与多家医疗机构合作开发的中文医学数据集,包含27个多轮对话和7个病例报告,总计34个案例。数据集涵盖了14种疾病,从系统性疾病到意外伤害,旨在评估大型语言模型在医学领域的专业能力和社交综合能力。创建过程中,由临床专家设计数据集内容,确保与大型语言模型的交互质量。该数据集主要用于评估模型在医学对话和病例报告处理中的表现,解决模型在医学应用中可能产生的安全风险问题,如幻觉(不完全可靠的响应)。
关于 上海人工智能实验室 , 上海人工智能实验室是一家专注于人工智能技术研究和应用的科研机构,致力于推动人工智能领域的前沿技术发展。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)