作为国家战略性新兴产业的核心赛道,新型显示产业横跨半导体、材料、装备、终端应用等多个领域,产业链条长、技术复杂度高,强链补链、国产化替代已成为当前行业发展的核心诉求。与此同时,随着全国数据要素市场化配置改革持续推进,数据知识产权登记作为明确数据权属、保障数据合规流通、激活数据资产价值的核心基础环节,正在成为产业数据释放价值的前置要件。浙江省作为全国数据要素市场化改革的先行试点省份,其搭建的数据知识产权登记平台具备官方公信力,是国内率先实现数据知识产权全流程合规登记的公共服务平台之一。
2026年5月26日,火石创造科技有限公司旗下的新型显示产业链结构文本训练数据正式在该平台完成登记,标志着该数据集的权属、合规性得到官方确认,后续可依法依规开展市场化授权、场景应用等相关运营动作。
据了解,本次登记的数据集是专门面向新型显示产业链智能分类、产业图谱构建类AI模型训练开发的专用标注数据集,核心通过关联企业公开文本与产业链环节标准化标签,为新型显示产业各参与方提供高效、精准的数据工具,其典型应用场景覆盖三大维度:
一是产业链全景分析与强链补链决策支撑。可辅助政府及产业规划部门,绘制显示面板、关键材料(光刻胶、靶材、光学薄膜、电子特种气体等)、核心设备(光刻、镀膜、清洗、检测设备等)全环节的企业分布地图,快速识别区域产业优势赛道与薄弱环节,为地方精准招商、产业扶持政策制定提供数据依据,避免产业同质化布局。
二是供应链寻源与技术合作效率提升。可赋能京东方、华星光电等头部面板制造商,快速匹配上游材料、设备领域的合格供应商,缩短供应链调研周期,为国产化替代选型、跨主体技术合作决策提供数据参考,降低供应链断供风险。
三是技术趋势与竞争格局量化研究。可支持投资机构、行业研究团队对光刻胶、OLED材料、光学薄膜等细分领域的技术布局、企业研发动态、市场竞争格局进行长期跟踪与量化分析,提升投研决策的准确性与效率。
为保障数据的合规性与标注质量,该数据集的加工全流程设置了严格的标准规范:
一、加工前数据合规处理
本数据集旨在构建用于新型显示产业链智能分析的人工智能模型训练语料。在加工前,数据已进行严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,并彻底移除所有的个人及商业敏感信息,确保数据完全符合《数据安全法》《个人信息保护法》等相关法律法规要求,为模型训练提供了洁净、可靠的输入基础。
二、标准化数据处理规则
数据处理严格遵循 “体系先行、业务匹配、特征抽取” 的核心规则,形成了一套从分类框架构建到最终标签生成的完整流程:
1. 分类体系搭建:依据国家战略性新兴产业分类及显示产业技术架构,预先定义了以“新型显示”为一级节点,按产业环节划分为“面板制造与模组组装”、“材料”、“设备”三个二级节点,并进一步细分为显示面板、光刻胶、电子特种气体、光学薄膜、靶材、光刻显影设备、镀膜设备、检测设备等三级/四级节点的树状分类体系,为数据加工提供了清晰、符合行业通用认知的结构化框架。
2. 业务匹配校验:采用“自动化规则匹配与人工校验相结合”的策略。首先,依托Spark大数据处理框架,对海量企业公开简介文本进行分布式清洗、分词与关键词匹配,通过预构建的新型显示产业语义规则库自动计算并推荐初步分类节点。随后,由具备半导体及显示行业专业知识的标注专家进行审核与最终判定,确保企业被精准归入对应的产业链环节与技术领域。
3. 核心特征抽取:在完成业务匹配的同时,从同一段企业简介文本中,系统性地抽取代表其核心产品与技术的关键术语与名词性短语,经过去重与标准化格式化,组合成“正向词”特征串,作为对分类标签的语义补充,提升后续模型训练的准确性。
三、加工后数据形态
加工后的数据集为一条条标准化的“文本-标签”配对数据。每条数据均包含经过脱敏处理的原始企业描述文本,以及与之对应、经人工校验的完整分类标签(一至四级节点)、反映核心业务的关键词(正向词)与多维度的产业标签。数据内容全面覆盖了新型显示产业链的面板制造、关键材料及核心设备各主要环节,形成了一个分类体系专业、特征标注丰富、可直接用于新型显示产业链分析、技术供应商识别与市场竞争研判等模型训练与评估的高质量专用数据集。
登记内容:
本次登记的完成,不仅是产业数据合规化资产化运营的典型实践,也为先进制造领域训练数据集的知识产权登记、市场化流通提供了可参考的样本,对于加速数据要素与实体经济深度融合,助力新型显示产业高质量发展具有积极意义。





_1769672084863.jpg)