中国科学院合肥物质科学研究院 本次发布的数据集 CMedINS, CMedINS数据集是由中国科学院合肥物质科学研究院智能机器研究所与专业医生合作构建的医疗指令数据集,包含22万条真实医疗记录。该数据集涵盖了多个医疗部门的真实数据,经过严格的去标识化处理以保护患者隐私。数据集的内容包括医疗对话、医疗指令和一般能力数据,旨在通过监督微调和直接偏好优化方法提升模型在医疗领域的表现。该数据集的应用领域主要集中在医疗对话、诊断支持和患者咨询等方面,旨在解决医疗语言模型在专业领域知识不足的问题。
关于 中国科学院合肥物质科学研究院 , 中国科学院合肥物质科学研究院是中国科学院下属的一个综合性科研机构,位于安徽省合肥市。该研究院主要从事物质科学、能源科学、环境科学等领域的基础研究和应用研究,拥有多个国家级重点实验室和研究中心。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)