five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

高血压专病数据集已成功在天津市数据知识产权登记平台进行登记,应用在医学诊断、自然语言处理领域

五号数据雷达数据知识产权登记2024-10-14 03:0628
2024-09-25 , 天津健康医疗大数据有限公司 旗下 高血压专病数据集 数据知识产权在 天津市数据知识产权登记平台 完成登记 , 应用于 医学诊断、自然语言处理 领域

天津健康医疗大数据有限公司 本次登记的数据知识产权 高血压专病数据集, 专病诊断名称分类模型:通过分析医学文献、临床数据和专家知识,建立一个诊断数据库。经过分词和打乱顺序的预处理后,使用 train_supervised 函数进行训练(迭代200次,学习率0.1,词N-grams长度为1,损失函数为"hs")。模型性能通过 classification_report 方法评估,表现良好。参数更新通过命令同步模型、标签和标签名,从而快速、准确地诊断专病类型。 电子病历质控分类模型:该模型通过自然语言处理技术对电子病历中的主诉、现病史、既往史等文本进行识别和分析,提取关键信息并进行分类。包含7个类别,每类250个样本。数据处理包括标签化、分词,并转换为TXT文件。用 BERT的分词器将病历文本转化为BERT所需的输入格式,质控标签转换为数值标签。训练集与测试集按9:1比例划分。使用 BertForSequenceClassification模型进行训练。模型评估通过 classification_report 方法进行。参数更新步骤包括将数据放入指定文件夹,运行训练和更新命令,确保模型、标签和标签名同步。

查看高血压专病数据集

登记内容:

 

关于 天津健康医疗大数据有限公司 , 天津健康医疗大数据有限公司是一家专注于健康医疗领域的大数据服务提供商,致力于通过数据分析和技术创新,提升医疗服务质量和效率,推动健康医疗行业的数字化转型。

关于 天津市数据知识产权登记平台 , 天津市数据知识产权登记平台是一个在线平台,依据相关法律法规设立,旨在保护数据知识产权。该平台促进数据的创新利用和保护数据权益,其主要特点包括明确所有权、激励创新、释放价值、优化生态和系统治理。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们