随着我国数据要素市场化配置改革持续深化,医疗健康科研数据作为生物医药创新的核心生产要素,其知识产权确权、合规流通已经成为行业刚需。作为贵州省官方搭建的省级数据知识产权服务载体,贵州省数据知识产权登记平台承担着数据权属存证、流通备案、价值认定等公共服务职能,为各类市场主体的数据资产合规化提供公信力背书,也是国内省级层面探索数据要素制度落地的重要实践平台。2026年6月30日,由陈彬研发的《口腔肿瘤非编码RNA互作及靶点验证数据集》正式在该平台完成知识产权登记,为医疗科研类数据资产确权提供了全新样本。
本次登记的数据集经过了严苛的标准化处理流程,确保数据的高可信度与可复用性:在数据清洗环节,研发团队剔除了ncRNA或靶基因ID无法匹配miRBase/Ensembl注释、互作证据等级低于"实验验证"及关键字段缺失的记录,同时删除测序reads数过低或表达量TPM<1的弱信号条目,从源头过滤低质量数据;在标准化注释环节,团队将ncRNA及靶基因统一映射至miRBase v22和HGNC/Entrez Gene标准ID,对互作类型(结合/降解/翻译抑制)、验证方法(双荧光素酶/RIP/CLIP)按行业通用受控词表编码赋值,解决了不同科研团队产出数据标准不统一、无法交叉比对的行业痛点;最终构建的数据集按肿瘤亚型、ncRNA类别、验证实验类型分类建表,关联互作自由能、结合位点及文献来源,整合成支持CSV、关系型数据库两种格式的结构化数据集,并完成去标识化处理,符合医疗数据安全管理相关规范要求。
作为聚焦口腔肿瘤细分领域的高价值科研数据集,该成果可广泛应用于多个生物医药研发场景:在基础研究层面,科研人员可依托该数据集快速梳理不同口腔肿瘤亚型中ncRNA与靶基因的调控关系,大幅缩短分子机制研究的前期数据整理周期,降低重复验证成本;在药物研发层面,药企可基于经过实验验证的互作关系筛选潜在靶向药物靶点,提升早期靶点筛选效率与准确率;在临床转化层面,该数据集的高置信度标志物可支撑口腔肿瘤早期筛查、预后评估类伴随诊断产品的开发;此外,该数据集还可作为同领域科研成果的交叉验证基准,提升研究结论的可靠性。
本次数据集完成知识产权登记,也具备鲜明的行业示范意义:一方面,个人研发的科研类数据资产通过官方平台获得权属确认,为科研人员后续的数据权益维护、收益分配提供了合规依据,有望激发更多科研主体开放共享高价值数据的积极性;另一方面,医疗健康细分领域数据集的规范化确权,也为后续数据要素跨机构、跨区域合规流通奠定了基础,将进一步降低生物医药领域的重复研发投入,助力数字经济与生命健康产业的深度融合。





_1769672084863.jpg)