天津健康医疗大数据有限公司 本次登记的数据知识产权 孕产妇保健数据集, 多维诊疗数据构建患者主索引:将患者数据特征向量定义为患者性别、住址、家族遗传病、过敏原等信息,使用DBSCAN算法,基于特征向量的密度,将密度相近的数据点划为同一个簇,将患者数据点进行聚类,每个聚类可以视为一个患者群体,作为主索引的标识。 电子病历质控分类模型:该模型通过自然语言处理技术对电子病历中的主诉、现病史、既往史等文本进行识别和分析,提取关键信息并进行分类。包含7个类别,每类250个样本。数据处理包括标签化、分词,并转换为TXT文件。用 BERT的分词器将病历文本转化为BERT所需的输入格式,质控标签转换为数值标签。训练集与测试集按9:1比例划分。使用 BertForSequenceClassification模型进行训练。模型评估通过 classification_report 方法进行。参数更新步骤包括将数据放入指定文件夹,运行训练和更新命令,确保模型、标签和标签名同步。
登记内容:
关于 天津健康医疗大数据有限公司 , 天津健康医疗大数据有限公司是一家专注于健康医疗领域的大数据服务提供商,致力于通过数据分析和应用,提升医疗服务质量和效率,推动医疗行业的数字化转型。
关于 天津市数据知识产权登记平台 , 天津市数据知识产权登记平台是一个在线平台,依据相关法律法规设立,旨在保护数据知识产权。该平台促进数据的创新利用和保护数据权益,其主要特点包括明确所有权、激励创新、释放价值、优化生态和系统治理。





_1769672084863.jpg)