当前,随着数据要素市场化配置改革持续推进,数据知识产权登记作为明确数据权属、保障数据主体权益、促进合规流通的核心环节,已成为各地方激活产业数据价值的重要抓手。作为浙江省推进数据要素市场化配置的核心基础设施,浙江省数据知识产权登记平台承担着数据存证、权属公示、流通背书等核心职能,为各类合规数据资产的市场化应用提供权威依据。 2026年5月29日,火石创造科技有限公司旗下的新材料产业产业链结构文本训练数据正式在该平台完成数据知识产权登记,标志着垂直产业领域的专用训练数据权益保护落地了新的实践成果。本数据集定位为新材料产业智能分析与图谱构建的专用训练语料,通过精准关联企业信息与产业标签,为多场景的产业数字化工作提供底层数据支撑,目前可应用的核心场景包括三大方向:一是产业规划环节,可辅助政府及园区快速掌握生物医用材料、3D打印材料、纳米材料等前沿新材料领域的区域分布与产业生态,为补链强链、招商引智等政策制定提供标准化参考;二是市场研判环节,可为投资机构、产业研究机构分析细分赛道竞争格局、筛选优质标的提供高效的数据依据,大幅降低人工调研的时间成本;三是产业协同环节,可赋能链主企业智能匹配上下游材料供应商与技术合作伙伴,助力创新链与供应链的深度融合。 一、加工前数据说明 本数据集旨在构建用于新材料产业链智能分析的人工智能模型训练语料。在加工前,数据已进行严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,简介中的具体地址、联系人等敏感信息已被移除,确保数据完全符合隐私保护与安全合规要求,为模型训练提供了洁净、可靠的输入基础。 二、数据处理规则 数据处理严格遵循 “体系先行、业务匹配、特征抽取” 的核心规则,形成了一套从分类框架构建到最终标签生成的完整流程:1.体系搭建:依据国家及地方新材料产业分类标准,预先定义了以“新材料产业”为根节点,下设“前沿新材料”等二级节点,并进一步细分为“生物医用材料制造”、“3D打印用材料制造”、“纳米材料制造”等具体材料门类(三级节点)的树状分类体系,该体系确保了新材料产业分类的逻辑性与专业性。2.业务匹配:将脱敏后的企业文本与上述分类体系进行多维度交叉匹配,结合工商经营范畴、产品公开信息等公开数据进行校验,确保分类结果的准确率,避免分类偏差。3.特征抽取:在分类的同时,从企业简介中系统性抽取体现其材料特性、工艺水平或应用领域的关键词(如:“医疗认证”、“定制化生产”、“高性能”、“专利”),组合成“正向词”特征串。该特征作为对分类标签的细粒度补充,刻画了企业的技术优势与产品特点。 三、加工后数据内容 加工后的数据集为一条条结构化的“文本-标签”数据。每条数据均包含脱敏后的企业描述文本,以及与之对应、经人工校验的完整产业链分类标签(一至三级节点)、细分的产业标签以及业务特征词(正向词)。数据内容覆盖了从医用金属、特种化工到先进塑胶、复合材料等新材料产业多个关键领域,形成了一个分类体系清晰、标注专业、特征明确的专用数据集,可直接用于新材料产业图谱构建、企业智能分类与产业链分析等模型的训练与评估。 业内人士指出,本次新材料产业专用训练数据完成知识产权登记,既为垂直产业类数据资产的权益保护提供了可参考的实践样本,也为AI技术在战略性新兴产业治理场景的落地提供了合规、高质量的生产要素支撑,对于加快数据要素与实体经济融合、推动新材料产业数字化转型具有积极的示范意义。





_1769672084863.jpg)