five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据产品上架 / 正文

北数所上架两类高价值脱敏医疗数据集 赋能精神、脑血管疾病AI诊断落地

五号数据雷达数据产品上架2026-04-28 12:4112
数巨有谱数据集团有限公司于2026年4月28日在北京国际大数据交易所首发上架脱敏精神行为障碍及脑血管疾病高质量数据集,该产品已通过全流程合规校验,可用于医疗AI模型训练优化,填补了两类高发专科疾病的合规高质量数据供给缺口。

近年来,随着数字医疗产业快速发展,医疗AI在辅助诊断、疾病早筛、临床科研等场景的落地需求持续攀升,但合规、高质量的标注专科医疗数据供给不足,一直是制约医疗AI模型性能提升、临床落地的核心瓶颈。同时,医疗数据属于高敏感级别的数据要素,流通交易的合规性要求远高于其他类型数据,如何在严格保障用户隐私安全的前提下释放医疗数据价值,是当前我国数据要素市场建设的重点探索方向。

2026年4月28日,数巨有谱数据集团有限公司研发的脱敏精神行为障碍及脑血管疾病高质量数据集正式在北京国际大数据交易所首发上架。作为国内首批规范化开展数据流通交易的国家级试点平台,北京国际大数据交易所长期承担数据产品合规审核、登记确权、交易撮合、价值评估等核心职能,本次上架的数据集也已通过平台全流程合规校验,具备公开合规流通交易的资质。

据介绍,本次上架的数据集覆盖ICD-10国际疾病分类标准下两大核心病种类目:其一为Chapter V — F00–F99类目下的精神行为障碍相关数据,其二为I60–I69类目下的脑血管疾病相关数据,包含医学影像、住院病案首页两大核心维度字段。其中医学影像字段涵盖影像编号、检查日期、设备类型、检查部位、DICOM文件信息及影像所见等核心内容;住院病案首页字段则包含去隐私化pmid、性别、年龄区间、诊断信息、治疗信息、住院信息等临床维度数据,数据维度丰富、颗粒度满足医疗AI训练的专业要求。

为满足医疗数据流通的隐私保护刚性要求,本次上架数据集的所有字段均已通过严格的脱敏技术处理,彻底移除或泛化了所有可直接识别、间接推断特定自然人身份的个人信息要素。经技术验证与第三方合规审查,数据集不包含《中华人民共和国个人信息保护法》定义的个人信息,已实现完全匿名化,无法复原或关联至特定个人,全面符合国家数据安全、医疗数据管理及隐私保护相关法律法规要求,从源头规避了数据流通的合规风险。

作为针对性极强的专科医疗数据集,该产品可广泛应用于医疗AI模型的训练与精细化微调环节,为模型输入丰富、真实的医学特征、诊疗规律与临床决策依据。通过该类高质量数据的训练优化,AI模型在精神行为障碍筛查、脑血管疾病影像判读、发病风险预测、临床辅助诊断等场景下的准确性、灵敏度可得到显著提升,同时还能增强模型的泛化能力与鲁棒性,减少算法偏差,提升临床适用性。从潜在落地场景来看,这类优化后的AI工具未来可应用于基层医疗机构的专科疾病早筛、三甲医院的影像科辅助阅片、公共卫生领域的疾病风险监测、临床科研的大样本分析等多个方向,为医疗机构降低诊疗压力、提升服务效率、优化科研效率提供技术支撑。

查看脱敏精神行为障碍及脑血管疾病高质量数据集

上架内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们