作为支撑新能源、半导体、高端制造等战略性领域发展的核心基础材料,硅基材料产业链细分品类多、技术迭代快、跨环节关联复杂,传统人工调研、分类的模式已难以适配产业数字化治理、企业智能化决策的需求。随着国内数据要素市场建设加速,具备明确知识产权的专业产业训练数据,成为AI驱动的产业分析工具落地的核心前提。作为国内率先落地的数据知识产权确权服务载体,浙江省数据知识产权登记平台为数据资产的权益保护、合规流通提供了官方权威凭证,已成为国内产业数据确权登记的重要标杆平台。
2026年5月30日,火石创造科技有限公司旗下硅基材料产业链结构文本训练数据正式在该平台完成数据知识产权登记。本数据集专门服务于硅基材料产业链智能分类与产业图谱构建模型的训练与开发,通过关联企业文本与材料技术标签,为新材料产业发展分析提供核心数据工具。
其潜在应用场景覆盖新材料产业发展的全链路需求:一是产业链全景分析与强链补链:可辅助政府及产业规划部门,绘制从上游石英矿、硅烷等基础原料,到有机硅、玻璃纤维等中间材料,再到硅橡胶制品、玻纤增强制品等下游应用的完整产业链地图,快速识别区域产业优势与短板,为产业招商、产能布局提供决策支撑;二是技术路线与投资价值研判:可赋能投资机构与行业研究团队,对有机硅、玻璃纤维、单晶硅等不同技术路线的企业分布、研发重点及市场竞争格局进行量化分析与动态跟踪,大幅降低行业调研成本,提升投资决策效率;三是供应链协同与客户开发:可支持下游电子、汽车、建筑等应用领域企业,精准寻找上游硅橡胶、硅油、玻纤增强材料等高性能原材料的供应商,优化供应链配置与协同效率,降低断供风险。
为保障数据合规性,本数据集在加工前已进行严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,并彻底移除所有的个人及商业敏感信息,完全符合隐私保护与数据安全合规要求,为后续模型训练提供了洁净、可靠的输入基础。
本次数据集的加工严格遵循 “体系先行、业务匹配、特征抽取” 的核心规则,形成了一套从分类框架构建到最终标签生成的完整流程:1. 分类体系搭建:首先依据新材料产业分类标准及硅基材料专业技术体系,预先定义了以“硅基材料”为一级节点,按产品类别与产业链环节划分为“有机硅”、“原材料”、“玻璃纤维及制品”、“单晶硅”等二级节点,并进一步细分为“硅橡胶”、“硅烷及其衍生物”、“石英矿”、“玻璃纤维”、“光伏级单晶硅”等具体产品类型(三级节点)的树状分类体系,为数据加工提供了专业、系统的框架。2. 业务匹配校验:采用“自动化规则匹配与人工校验相结合”的策略,首先依托Spark大数据处理框架,对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的硅基材料产业语义规则库自动计算并推荐初步分类节点,随后由具备新材料行业知识的标注专家进行审核与最终判定,确保企业被精准归入对应的产品与技术类别。3. 核心特征抽取:在完成业务匹配的同时,从同一段企业简介文本中,系统性地抽取代表其核心产品、关键技术及应用领域的关键术语与名词性短语,经过去重与标准化格式化,组合成“正向词”特征串,并归纳其所属的“产业标签”,共同作为对分类标签的精准语义补充。
加工后的数据集为一条条结构化的“文本-标签”数据,每条数据均包含经过脱敏处理的原始企业描述文本,以及与之对应、经人工校验的完整分类标签(一至三级节点)、高度细化的业务特征词(正向词)与产业标签。数据内容全面覆盖了有机硅材料、玻璃纤维、单晶硅、石英原料等硅基材料产业链的核心细分领域,形成了一个分类体系专业、业务特征鲜明、可直接用于硅基材料产业链分析、技术赛道识别与供应商智能分类等模型训练与评估的高质量专用数据集。
登记内容:
本次登记的完成,不仅为该数据集的知识产权权益提供了官方保障,也为专业产业训练数据的确权、流通提供了可参考的样本,对推动数据要素在新材料产业领域的合规应用、加速新材料产业数字化转型进程具有积极意义。





_1769672084863.jpg)