five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 商业数据市场 / 正文

John Snow Labs 发布 Clinical DeIdentification 数据集, 应用在 医疗数据隐私、自然语言处理 领域

五号数据雷达商业数据市场2024-08-17 07:4362
Clinical DeIdentification 是 John Snow Labs 发布的数据集,于 2024-08-16 首发在 Snowflake 应用于 医疗数据隐私、自然语言处理 领域

John Snow Labs 本次发布的数据集 Clinical DeIdentification, 临床去标识化模型旨在识别并匿名化英文临床笔记中的个人健康信息(PHI)。该模型采用先进的自然语言处理技术,检测患者姓名、地址、病历号等敏感信息,并对其进行有效遮蔽或混淆,确保文本在保持信息完整性的同时安全可用。此模型符合HIPAA和其他医疗隐私法规,适用于研究、分析和培训,促进医疗数据的合法使用,同时保护患者隐私。支持的实体包括年龄、联系方式、日期、身份、位置、姓名等,提供多种遮蔽策略如默认遮蔽、混淆、固定长度字符遮蔽和字符遮蔽。

查看Clinical DeIdentification

数据集详情页内容: 

 

关于 John Snow Labs , John Snow Labs 是一家专注于数据科学和人工智能技术的公司,提供包括自然语言处理(NLP)、机器学习和数据分析在内的多种工具和服务。该公司以其高质量的数据集和先进的分析平台而闻名,支持企业和研究机构在医疗、金融和其他行业中应用AI技术。

关于 Snowflake , Snowflake是一家云数据平台,提供数据仓库即服务、数据湖、数据应用开发、数据共享等功能。用户可以在平台上存储、管理、分析数据,实现数据的高效利用和共享。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们