美国国家医学图书馆本次发布的数据集HEALIX,HEALIX是由美国国家医学图书馆联合多机构开发的全球首个公开临床笔记健康素养标注数据集,包含来自MIMIC-III数据库的589条跨9种类型的临床笔记,通过社工笔记抽样、关键词过滤及大模型主动学习三重策略构建。数据集采用三级标注体系(低/正常/高健康素养),旨在解决传统健康素养筛查工具在电子健康记录中难以结构化记录的痛点,为自然语言处理模型开发提供基准资源,可应用于患者教育干预、住院再入院率预测等医疗决策支持场景。
README内容:
关于美国国家医学图书馆,美国国家医学图书馆是美国国立卫生研究院下属的专门从事医学及相关领域文献收集、整理和服务的机构,也是世界上最大的医学图书馆。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)