温州市数据集团有限公司 本次登记的数据知识产权 基于疾病预测分析的医疗健康大模型训练数据(经中国(温州)数安港合规认证), 高质量公共数据训练集为生成式病历提供了基础支撑,从而推动生成式病历发展,实现自动生成结构化、标准化且遵循医学规范的病历文本,切实提高病历生成的效率与质量,有力推动医疗服务的优化升级,并为医学研究的深入发展提供关键助力。基于以上场景需求,整合相关医疗数据构建形成可供该场景训练使用的公共数据语料库。本项目所使用的数据来源于公共数据授权运营域,具体而言,是医院方上传至该授权域的相关数据内容。面对这些初始时可能较为分散和非结构化的原始数据,运用了先进的算法进行处理。核心方法是对病程内容的不同类型进行数据内容提取:首先,构建一批经过专业标注的提取数据集;然后,利用强大的Transformer模型架构,结合交叉熵损失函数,对这些数据进行微调,从而训练出能够精准识别并提取特定信息的模型。以手术记录为例,会先从文本中标注出关键的手术名称”,以此作为训练样本,微调出一个专门提取手术名称的模型,随后再用这个模型高效地批量处理大量手术记录,自动提取出所需的手术名称。经过这样的精细加工,原本复杂的数据会根据不同的病程类型(如手术记录、出院小结等)转化为结构清晰、格式统一的标准化数据。例如,处理后的手术记录将明确包含术前诊断、手术名称、术中及术后诊断、麻醉方式、手术经过及处理、手术小结等关键要素。这些标准化数据不仅为未来开发智能生成式病历应用提供了坚实的数据基础,支撑其自动生成高质量病历报告,同时也极具价值,可作为宝贵语料用于训练其他大模型。其核心在于,通过海量数据的深度学习,AI模型能够掌握语言规律、理解领域知识,从而显著提升其识别、分类、生成和推理能力。这些数据堪称AI模型的“燃料”,其质量直接决定了模型的性能表现和泛化能力。最终,本项目将输出经过充分训练和优化的AI模型权重文件,这些文件封装了模型学习到的所有能力,可直接应用于实际场景。
查看基于疾病预测分析的医疗健康大模型训练数据(经中国(温州)数安港合规认证)
登记内容:
关于 温州市数据集团有限公司 , 温州市数据集团有限公司是一家由温州市政府直属的国有企业,主要负责数据的收集、处理和应用推广,旨在推动大数据产业的发展和智慧城市的建设。该公司致力于提供高质量的数据服务,助力政府决策和企业发展。
关于 浙江省数据知识产权登记平台 , 浙江省数据知识产权登记平台是一个专门用于登记和管理数据知识产权的官方平台。该平台允许企业和个人申请登记其数据知识产权,包括专利分类数据、客户价值评估数据等。平台提供公告功能,展示已登记、放弃或撤销的数据知识产权信息,并提供详细的申请人、申请时间和更新信息。





_1769672084863.jpg)