随着数据要素市场化配置改革持续推进,数据知识产权登记作为明确数据权属、保障数据合法流通、激活数据资产价值的核心基础性环节,已成为各行业探索数据价值变现的必要前提。作为全国大数据产业发展先行区,贵州省搭建的数据知识产权登记平台,面向全社会提供数据权属存证、流通溯源、权益保护等公共服务,为各类市场主体的数据资产合规化运营提供官方公信力支撑。本次银行类AI训练数据集的成功登记,也是当地丰富金融数据要素供给、完善数据要素品类的重要进展。
贵州珙玺科技有限公司本次登记的数据知识产权标的为银行机器学习电子档案分类管理数据,其底层基于文本分类、特征提取、NLP自然语言处理等主流机器学习算法构建智能处理模型,通过TF‑IDF、BERT等技术方案提取不同类型银行档案的关键词与语义特征,可按照银行通用档案分类规则完成自动归类、标引、排序操作,同时结合监督学习与增量训练机制持续迭代优化分类准确率,实现结构化与非结构化银行档案的统一智能处理,全程保障分类操作的规范性、高效性与稳定性。
登记内容:
从应用价值来看,本次登记的数据集目前可直接应用于金融文档智能分类、银行档案NLP处理两大核心场景,有效解决传统银行档案管理中人工分类效率低、错配率高、非结构化数据处理难度大等痛点。据行业公开统计,当前银行机构的非结构化电子档案占比已超过80%,涵盖信贷合同、客户凭证、监管报送材料、内部管理文件等多种类型,该类标准化数据集的落地,可将银行档案分类效率提升70%以上,同时大幅降低人为操作误差。除此之外,该数据集后续还可拓展至银行合规智能审核、监管报送材料自动归集、客户授信信息结构化提取、涉密档案智能识别管控等多个金融业务场景,为银行数字化转型中的档案治理环节提供标准化数据支撑。
从行业意义来看,本次登记首先明确了该数据集的知识产权归属,为后续该数据资产的授权使用、交易流转、权益分配提供了具备公信力的合规依据,也为科技企业的AI训练类数据资产确权提供了可参考的实践样本。其次,本次登记也丰富了贵州省数据要素市场的金融类数据资产供给,为金融数据要素的合规流通、价值释放探索了可行路径,对推动西部地区数字经济与实体经济深度融合、完善数据要素市场化配置体系具有正向示范作用。





_1769672084863.jpg)