John Snow Labs 本次发布的数据集 Clinical DeIdentification, 临床去标识化模型旨在识别并匿名化英文临床笔记中的个人健康信息(PHI)。该模型采用先进的自然语言处理技术,检测患者姓名、地址、病历号等敏感信息,并对其进行有效遮蔽或混淆,确保文本在保持信息完整性的同时安全可用。此模型符合HIPAA和其他医疗隐私法规,适用于研究、分析和培训,促进医疗数据的合法使用,同时保护患者隐私。支持的实体包括年龄、联系方式、日期、身份、位置、姓名等,提供多种遮蔽策略如默认遮蔽、混淆、固定长度字符遮蔽和字符遮蔽。
数据集详情页内容:
关于 John Snow Labs , John Snow Labs 是一家专注于数据科学和人工智能技术的公司,提供包括自然语言处理(NLP)、机器学习和数据分析在内的多种工具和服务。该公司以其高质量的数据集和先进的分析平台而闻名,支持企业和研究机构在医疗、金融和其他行业中应用AI技术。
关于 Snowflake , Snowflake是一家云数据平台,提供数据仓库即服务、数据湖、数据应用开发、数据共享等功能。用户可以在平台上存储、管理、分析数据,实现数据的高效利用和共享。





_1769672084863.jpg)