作为我国数据要素市场化配置改革的先行试点,浙江省近年来不断完善数据知识产权登记、流通、保护的全链条体系,浙江省数据知识产权登记平台作为省级官方基础设施,承担着数据权属确认、存证公示、权益保护等核心职能,为各类数据主体的资产化运作提供公信力背书,是国内数据要素治理领域的标杆性平台。
本次登记的落地,是工业领域垂直产业类训练数据资产化探索的重要实践。当前我国先进建筑材料产业正处于绿色化、数字化升级的关键节点,围绕新型防水材料、环保建材等细分领域的产业链分析、供需匹配、创新跟踪需求日益旺盛,但此前行业缺乏标准化标注、权属清晰的高质量训练数据集,极大限制了AI技术在建材产业治理场景的落地。
火石创造科技有限公司本次登记的先进建筑材料产业链结构文本训练数据,专门面向先进建筑材料产业链智能分类与产业图谱构建模型的训练开发设计,通过关联企业文本与产品类别标签,为建材产业全链路分析提供标准化数据工具。在数据加工前,所有原始数据已完成严格的匿名化与去标识化处理:原始企业名称被统一替换为不可逆规范标识符,所有个人及商业敏感信息被彻底移除,完全符合数据安全与隐私保护的相关法规要求,为后续模型训练提供了合规、可靠的输入基础。
本次数据处理严格遵循“体系先行、业务匹配、特征抽取”的核心规则,构建了全流程标准化加工体系:首先依据国家建材行业分类标准及新型建筑材料技术体系,搭建了覆盖“先进建筑材料-新型建筑防水材料-防水卷材/防水涂料/密封胶及粘结剂-具体材料类型”的四级树状分类框架,为数据标注提供专业的产业技术标准支撑;其次采用“自动化规则匹配+人工校验”的双层标注策略,依托Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的建材产业语义规则库自动推荐初步分类节点后,由具备建材行业专业背景的标注专家进行最终审核判定,确保分类结果的准确性;最后同步完成特征抽取,从企业简介文本中系统性提取核心产品、技术相关的关键术语,经去重、标准化后形成“正向词”特征串,作为分类标签的语义补充。
加工完成后的数据集为标准化“文本-标签”结构,每条数据均包含脱敏后的企业描述文本、经人工校验的四级分类标签、细粒度业务特征词与产业标签,全面覆盖防水卷材、防水涂料、密封胶及粘结剂等新型建筑防水材料核心细分领域,是国内少有的分类体系专业、标注精度高、可直接用于模型训练与评估的垂直产业专用数据集。
从应用价值来看,该数据集可支撑三大类典型场景落地:其一为产业链与市场分析,可辅助地方政府、产业研究机构绘制防水材料各细分领域的企业分布地图,精准识别区域产业优势与市场空白,为产业招商、政策制定提供数据支撑;其二为供应链寻源与采购,可赋能建筑企业、工程承包商、材料贸易平台快速匹配符合技术标准、环保要求的防水材料供应商,降低寻源成本,优化采购决策,适配当前绿色建筑采购的双碳目标要求;其三为技术研发动态跟踪,可支持投资机构、行业分析师快速洞察高分子防水材料、环保型密封胶等前沿技术的企业研发布局与创新趋势,精准挖掘优质标的。
本次数据知识产权登记的完成,不仅为该数据集的后续流通、应用提供了权属保障,也为工业领域垂直产业训练数据的资产化、合规化运作提供了可参考的实践样本,对推动数据要素与实体经济深度融合、加快建筑建材产业数字化转型具有积极意义。
首页 / 数据知识产权登记 / 正文
浙江省数据知识产权登记平台完成先进建材产业链训练数据登记 赋能产业链图谱构建等多场景应用
五号数据雷达数据知识产权登记2026-05-30 08:128
2026年5月29日,火石创造科技有限公司旗下先进建筑材料产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记,该合规标注数据集可直接用于建材产业智能分析模型训练,为产业链研究、供应链匹配、创新趋势洞察等场景提供高质量数据支撑。

社区讨论
近期热门




_1769672084863.jpg)