five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

美国国家医学图书馆发布HEALIX数据集,应用在健康素养、自然语言处理领域

五号数据雷达开源数据市场2026-03-21 14:2711
HEALIX是美国国家医学图书馆发布的数据集,于2026-03-20首发在arXiv应用于健康素养、自然语言处理领域

美国国家医学图书馆本次发布的数据集HEALIX,HEALIX是由美国国家医学图书馆联合多机构开发的全球首个公开临床笔记健康素养标注数据集,包含来自MIMIC-III数据库的589条跨9种类型的临床笔记,通过社工笔记抽样、关键词过滤及大模型主动学习三重策略构建。数据集采用三级标注体系(低/正常/高健康素养),旨在解决传统健康素养筛查工具在电子健康记录中难以结构化记录的痛点,为自然语言处理模型开发提供基准资源,可应用于患者教育干预、住院再入院率预测等医疗决策支持场景。

查看HEALIX

README内容:

 

关于美国国家医学图书馆,美国国家医学图书馆是美国国立卫生研究院下属的专门从事医学及相关领域文献收集、整理和服务的机构,也是世界上最大的医学图书馆。

关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们