five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

孕产妇保健数据集已成功在天津市数据知识产权登记平台进行登记,应用在医疗数据分析、自然语言处理领域

五号数据雷达数据知识产权登记2024-10-30 03:4327
2024-10-16 , 天津健康医疗大数据有限公司 旗下 孕产妇保健数据集 数据知识产权在 天津市数据知识产权登记平台 完成登记 , 应用于 医疗数据分析、自然语言处理 领域

天津健康医疗大数据有限公司 本次登记的数据知识产权 孕产妇保健数据集, 多维诊疗数据构建患者主索引:将患者数据特征向量定义为患者性别、住址、家族遗传病、过敏原等信息,使用DBSCAN算法,基于特征向量的密度,将密度相近的数据点划为同一个簇,将患者数据点进行聚类,每个聚类可以视为一个患者群体,作为主索引的标识。 电子病历质控分类模型:该模型通过自然语言处理技术对电子病历中的主诉、现病史、既往史等文本进行识别和分析,提取关键信息并进行分类。包含7个类别,每类250个样本。数据处理包括标签化、分词,并转换为TXT文件。用 BERT的分词器将病历文本转化为BERT所需的输入格式,质控标签转换为数值标签。训练集与测试集按9:1比例划分。使用 BertForSequenceClassification模型进行训练。模型评估通过 classification_report 方法进行。参数更新步骤包括将数据放入指定文件夹,运行训练和更新命令,确保模型、标签和标签名同步。

查看孕产妇保健数据集

登记内容:

 

关于 天津健康医疗大数据有限公司 , 天津健康医疗大数据有限公司是一家专注于健康医疗领域的大数据服务提供商,致力于通过数据分析和应用,提升医疗服务质量和效率,推动医疗行业的数字化转型。

关于 天津市数据知识产权登记平台 , 天津市数据知识产权登记平台是一个在线平台,依据相关法律法规设立,旨在保护数据知识产权。该平台促进数据的创新利用和保护数据权益,其主要特点包括明确所有权、激励创新、释放价值、优化生态和系统治理。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们