five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

2000万条结构化案情判决训练数据集在贵州完成知识产权登记 赋能司法AI多场景落地

五号数据雷达数据知识产权登记2026-05-07 00:117
2026年5月6日,贵州中汇科技发展有限公司旗下案情判决训练数据集正式在贵州省数据知识产权登记平台完成确权登记,该数据集为符合司法治理规范的高质量AI监督学习样本,可广泛应用于法律判决预测、司法决策支持等领域,为司法数字化场景落地提供合规数据支撑。

随着我国数据要素市场建设加速推进,数据知识产权确权作为数据资产合规流通、价值释放的核心前提,正在向各垂直行业领域深化落地。作为全国首个大数据综合试验区,贵州近年来持续完善数据知识产权登记体系,当地官方搭建的贵州省数据知识产权登记平台,承担着数据知识产权申请受理、审核、公示、查询等核心职能,为市场主体的数据资产提供合规确权凭证,是当地数据要素流通体系的核心基础设施。

2026年5月6日,贵州中汇科技发展有限公司研发的案情判决训练数据集正式在该平台完成登记,是目前国内司法领域为数不多完成官方知识产权确权的AI训练类专业数据集。

据了解,本次登记的案情判决训练数据集定位为大语言模型微调专用的监督学习数据集,构建过程严格遵循司法数据治理规范:首先以去重后的单篇裁判文书为最小样本单元,通过文本指纹校验、案号匹配、版面噪声清洗、个人信息脱敏、文书类型分类等流程完成基础数据治理,形成合规可用的数据底座;再基于“事实描述—争议焦点—法律适用—裁判理由—判决结果”的标准司法逻辑链开展多维度要素分层抽取,将案件事实、主体关系、时间地点、行为过程、证据要点、争议焦点、适用法条、裁判观点、判决主文、刑期/赔偿/责任承担等核心司法要素映射为统一结构化字段,最终按照“输入案情、输出判决结论及理由”的指令模板生成约2000万条结构化微调样本,同时完整保留原文证据片段、字段来源位置和人工/规则双重校验结果,形成可训练、可追溯、可评测的高质量监督学习数据资源。

作为经过官方知识产权确权的司法类训练数据,该数据集的应用场景覆盖司法数字化全链条:在司法审判环节,可用于训练法律判决预测类AI模型,辅助法官开展类案检索、裁判偏移预警,助力实现“同案同判”,提升裁判效率与公平性;在司法管理层面,可支撑司法决策支持类系统开发,辅助法院开展案量预判、司法资源动态调配、裁判质效分析等管理工作;在法律服务市场,可作为底层数据支撑智能法律咨询、合同智能审查、法律风险预判等ToC、ToB类法律服务产品研发;此外还可为高校、科研机构开展司法制度实证研究、司法大数据分析提供合规数据来源。

业内人士指出,司法领域是对数据合规性、专业性要求最高的垂直领域之一,此前市场上司法类训练数据集普遍存在确权不清、治理不规范、隐私保护不到位等问题,本次案情判决训练数据集完成官方知识产权登记,不仅为贵州本地司法数字化建设提供了高质量数据资源,也为全国垂直领域专业训练数据的合规治理、知识产权确权、流通交易提供了可复制的实践样本,对完善数据要素确权体系、推动AI产业在垂直领域落地具有积极的示范意义。

查看案情判决训练数据集

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们