five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

火石创造质检计量产业链训练数据在浙完成知识产权登记 赋能多场景产业数字化应用

五号数据雷达数据知识产权登记2026-05-27 08:556
2026年5月26日,火石创造科技有限公司旗下质检计量产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成登记,该数据集为质检计量领域垂直AI模型训练提供合规、高质量的语料支撑,可广泛应用于检测服务分类、产业图谱构建等核心产业数字化场景。

当前,数据要素已成为数字经济时代的核心生产要素,数据知识产权登记作为数据资产确权、合规流通的核心前置环节,是保障数据持有方合法权益、破除数据流通壁垒的重要制度安排。浙江省数据知识产权登记平台作为国内率先落地的省级数据知识产权登记公共服务载体,承担着数据存证、权益确认、流通对接等核心职能,为省内合规数据资产的市场化流转提供了官方公信力背书。

2026年5月26日,火石创造科技有限公司旗下的质检计量产业链结构文本训练数据正式通过该平台审核完成登记,成为国内少有的完成官方知识产权确权的质检计量领域专用AI训练数据集。据了解,该数据集核心定位为质检计量产业链智能分析类AI模型的训练与开发语料,通过关联企业文本与检测服务标签,为质量技术监督、产业服务分析等场景提供核心数据支撑。

为满足数据安全与隐私保护要求,该数据集在加工前已完成全量严格的匿名化与去标识化处理:原始企业名称被统一替换为不可逆的规范标识符,所有个人及商业敏感信息被彻底移除,完全符合《数据安全法》《个人信息保护法》等相关法律法规要求,为后续模型训练提供了洁净、合规的输入基础。

在数据加工环节,项目团队严格遵循“体系先行、业务匹配、特征抽取”的核心原则,形成了全链路标准化处理流程:首先依据国家《国民经济行业分类》与检验检测行业标准,搭建了以“质检计量”为一级节点,向下拆分“检测服务”“计量服务”“检验检疫服务”“标准化服务”等二级节点,进一步细化为“机动车检测”“建筑工程检测”“环境检测”“食品检测”等10余类具体服务类型的三级树状分类体系,为数据标注提供了符合产业实际的专业逻辑框架。其次采用“自动化规则匹配+人工校验”的双重标注策略:依托Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的质检计量产业语义规则库自动推荐初步分类节点,再由具备检验检测行业专业背景的标注专家进行审核判定,有效保障了分类结果的专业准确性。最后在完成业务匹配的同时,同步从企业公开文本中抽取代表其核心产品、技术能力的关键术语,经去重、标准化处理后形成“正向词”特征串,作为分类标签的语义补充,进一步提升数据集的应用价值。

最终加工完成的数据集由结构化的“文本-标签”条目组成,每条数据均包含脱敏后的企业公开描述文本、经人工校验的三级分类标签、业务特征词与产业标签,全面覆盖质检计量领域全核心业务板块,是国内少见的分类体系完善、标注精度高、场景针对性强的质检计量领域专用训练数据集,可直接用于质检产业图谱构建、检测机构能力评估、合规供应商智能筛选等多类AI模型的训练与评估工作。

从应用价值来看,该数据集训练形成的AI模型可覆盖三类核心场景:一是服务政府监管与产业规划,可辅助市场监管、住建、环保等部门快速绘制区域内机动车检测、建筑工程检测、环境监测、食品检测等各类质检机构的分布地图与服务能力图谱,为资质审批、行业监管、检测资源布局优化提供数据决策依据,破解当前检验检测行业“小散弱”导致的监管效率低、资源供需错配等痛点;二是支撑供应链质量管理与合规寻源,可赋能生产制造企业、建筑开发商、公共采购平台精准筛选匹配特种设备检测、材料性能测试、环境评价等细分领域的合规第三方检测机构,降低供应链合规风险,提升寻源效率;三是支持投资研究与市场洞察,可为行业研究机构、投资方提供食品检测、无损检测、司法鉴定等细分检测领域的市场集中度、技术门槛、增长潜力等维度的分析支撑,辅助投资决策。

查看质检计量产业链结构文本训练数据

登记内容:

业内人士指出,本次质检计量领域专用训练数据完成知识产权登记,一方面填补了国内检验检测垂直领域高质量结构化训练语料的供给空白,为质检行业数字化转型、垂直领域大模型研发提供了合规数据基础;另一方面也为其他垂直产业的训练数据知识产权登记、合规流通提供了可参考的实践范本,对完善我国数据要素市场登记确权体系、推动产业类数据资产的市场化流转具有积极的示范意义。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们