随着全国数据要素市场化配置改革持续推进,数据知识产权登记作为数据确权、流通交易的核心前置环节,已成为各地数据要素市场建设的重点布局方向。贵州省作为国家数字经济发展创新区,其搭建的贵州省数据知识产权登记平台,承担着全省数据资源权属确认、合规审核、登记凭证发放等核心职能,是当地数据要素合规流通的重要基础设施。本次司法案例知识图谱数据集完成登记,是该平台在公共服务垂直领域的又一典型落地成果。
贵州中汇科技发展有限公司本次登记的司法案例知识图谱数据集,以“去重后的单个案件”为基本单元,先对原始数据按 text 进行规范化去重(统一全半角、空白符、换行、无效噪声后计算文本指纹,保留同一案件唯一记录),再将每个案件对应的14组问答对(qa_pair)按预设问题映射规则转换为固定结构化槽位,如案由/罪名、程序类型、裁判结果、争议焦点、适用法条、关键数额、核心说理、判决主文、是否终审等;对 answer 字段采用分层解析算法,兼容普通文本、JSON 字符串、数组、嵌套对象等多种格式,并进一步做实体标准化与值归一化,例如法条名称统一、金额转数值、布尔项转“是/否”、列表去重等;在此基础上生成“案件节点—要素节点—关系边”的图谱骨架,其中案件与案由、法条、焦点、金额、程序、结果等建立显式关系,同时依据案由一致、法条重合、焦点相近、程序相同、结果一致等规则计算案件间关联强度,补充“类案关联边”;所有节点与边均保留来源案件 ID、原始问题、原始答案及必要的原文证据片段,实现图谱数据的结构化、可扩展与可追溯。
作为经过标准化处理的司法知识类数据集,该产品可落地的应用场景覆盖司法机关、法律服务机构、公众服务等多个维度:在司法机关侧,可用于构建内部司法知识图谱,提升裁判文书检索、法律条文适配的效率,其中的类案关联能力还可以为法官审理案件提供同类型案例参考,辅助统一裁判尺度,降低“同案不同判”的风险;在法律服务机构侧,可基于该数据集开发智能法律咨询、诉讼结果预判、类案检索服务等To B/To C产品,提升法律服务的标准化水平;面向公众端,也可以衍生出法律知识科普、常见法律问题智能解答等普惠服务。
登记内容:
本次司法案例知识图谱数据集完成数据知识产权登记,是贵州省数据要素市场在垂直领域供给侧的重要突破。一方面,合规的登记凭证为该数据集后续的流通交易、商业化应用提供了明确的权属依据,降低了数据供需双方的合作信任成本;另一方面,也为法律、政务、医疗等其他专业领域的知识类数据集确权登记提供了可复用的实践参考,对丰富区域数据要素产品供给、加速数字经济与公共服务领域融合发展具有积极的示范意义。





_1769672084863.jpg)