天津健康医疗大数据有限公司 本次登记的数据知识产权 高血压专病数据集, 专病诊断名称分类模型:通过分析医学文献、临床数据和专家知识,建立一个诊断数据库。经过分词和打乱顺序的预处理后,使用 train_supervised 函数进行训练(迭代200次,学习率0.1,词N-grams长度为1,损失函数为"hs")。模型性能通过 classification_report 方法评估,表现良好。参数更新通过命令同步模型、标签和标签名,从而快速、准确地诊断专病类型。 电子病历质控分类模型:该模型通过自然语言处理技术对电子病历中的主诉、现病史、既往史等文本进行识别和分析,提取关键信息并进行分类。包含7个类别,每类250个样本。数据处理包括标签化、分词,并转换为TXT文件。用 BERT的分词器将病历文本转化为BERT所需的输入格式,质控标签转换为数值标签。训练集与测试集按9:1比例划分。使用 BertForSequenceClassification模型进行训练。模型评估通过 classification_report 方法进行。参数更新步骤包括将数据放入指定文件夹,运行训练和更新命令,确保模型、标签和标签名同步。
登记内容:
关于 天津健康医疗大数据有限公司 , 天津健康医疗大数据有限公司是一家专注于健康医疗领域的大数据服务提供商,致力于通过数据分析和技术创新,提升医疗服务质量和效率,推动健康医疗行业的数字化转型。
关于 天津市数据知识产权登记平台 , 天津市数据知识产权登记平台是一个在线平台,依据相关法律法规设立,旨在保护数据知识产权。该平台促进数据的创新利用和保护数据权益,其主要特点包括明确所有权、激励创新、释放价值、优化生态和系统治理。





_1769672084863.jpg)