作为国家大数据综合试验区,贵州近年来在数据要素市场化配置改革、数据知识产权确权登记领域走在全国前列,其搭建的贵州省数据知识产权登记平台是当地数据要素市场的核心基础设施,主要为合规数据资产提供权属存证、登记公示服务,为后续数据的授权使用、交易流通、权益维护提供官方依据,有效解决了数据资产“权属难认定、流通难溯源”的行业痛点。随着中医药数字化转型加速,海量中医古籍、临床医案等非结构化资料的标准化加工、资产化确权成为行业刚需,此次登记的数据集正是该领域的典型高价值资产。
2026年6月30日,由宋宇研发的中药性味归经、功效主治、禁忌人群结构化数据库正式在贵州省数据知识产权登记平台完成数据知识产权登记。本次登记的数据集核心能力覆盖四大技术模块:一是实体抽取算法,采用中文医学实体识别模型,从古籍文本、自由文本医案中自动抽取方剂、药材、证型、病症实体,实现非结构化文本向结构化数据自动转换,大幅降低中医资料数字化的人工成本;二是文本同义词映射算法,构建中医术语词向量模型,完成古今病名、中药别名自动归一匹配,解决了长期存在的古籍名词与现代临床术语不统一、数据难以打通的问题;三是方药-病证匹配优化模型,构建关联匹配算法,以证型为核心纽带,建立 “证候→疾病→方剂” 多条件匹配规则,基于临床病案频次统计计算方剂对不同病症、不同证型的适配度分值,输出最优适配组合,实现古方现代临床场景智能优化;四是数据分类分级算法,按照基础经典方、拓展改良方、专科定制方对全数据集自动分类,并对每一条匹配关系设置置信度评分,区分传统理论适配条目与真实临床验证条目,进一步提升了数据集的临床参考价值。
据了解,该数据集目前可直接应用于中医知识图谱构建、古方临床适配优化两大核心领域,除此之外还可支撑基层中医辅助诊疗系统知识库搭建、中药创新研发方药关联分析、中医标准化教育体系建设、跨境中医药服务术语统一等多个典型场景。此次登记不仅是中医领域数据资产确权的一次重要实践,也为垂直民生领域非结构化数据的加工、知识产权认定、资产化流通提供了可参考的路径,对于丰富我国数据要素市场的专业类数据供给、推动中医药数字化传承创新都具有积极意义。





_1769672084863.jpg)