当前我国数据要素市场化配置改革持续深化,数据知识产权登记作为明确数据权益归属、保障数据合规流通、激活数据资产价值的核心前置环节,已成为各垂直产业领域数据要素落地的重要基础。作为国内率先推进数据知识产权制度落地的省份,浙江省打造的省级数据知识产权登记平台,承担着全省数据资产确权登记、流通溯源、权益保护、价值评估等公共服务职能,为各类市场主体的数据资产合规化提供了官方通道。2026年5月22日,火石创造科技有限公司申报的航空航天产业链结构文本训练数据,正式在该平台完成数据知识产权登记,成为航空航天产业领域专业训练数据集合规化的典型实践。
作为支撑航空航天产业链智能分析模型训练的专用语料库,该数据集从源头就严格遵循数据安全与隐私保护要求,加工前已完成全量数据的匿名化与去标识化处理,原始企业名称统一替换为不可逆规范标识符,所有个人及商业敏感信息被彻底移除,为后续模型训练提供了合规、洁净的输入基础。
在数据加工环节,该数据集严格遵循“体系先行、业务匹配、特征抽取”的核心逻辑,形成了标准化的生产流程:首先依据国家战略性新兴产业分类标准及航空航天产业专项分类规则,搭建了以“航空航天”为一级节点,下辖“卫星及应用产业”“航空装备产业”两个二级节点,向下延伸至“航天器及运载火箭制造”“航天相关设备制造”“卫星通信终端设备制造”“航空零部件制造”“航空运输业”等四、五级细分业务节点的树状分类体系,为数据标注提供了专业的框架依据。其次采用“自动化匹配+人工校验”的双重标注机制:依托Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的航空航天产业语义规则库自动推荐初步分类节点,再由具备航空航天、高端装备产业专业背景的标注专家进行全文语境审核与最终判定,确保企业分类的精准性。最后同步完成特征抽取,从企业文本中系统性提取核心产品、核心技术、典型应用场景等关键术语,经过去重、标准化处理后形成“正向词”特征串与产业标签,作为分类标签的语义补充,进一步提升数据集的业务价值。
最终形成的结构化“文本-标签”数据集,每条数据都包含脱敏后的企业描述文本、经人工校验的全层级分类标签、业务特征词与产业标签,覆盖卫星制造、卫星应用终端、卫星运营服务、航空零部件、航空运输等航空航天全产业链核心环节,可直接用于航空航天产业链分析、核心技术企业识别、应用场景挖掘等方向的AI模型训练与评估。
从当前产业需求来看,这套数据集的落地应用空间十分广泛:在地方政府与产业园区的产业链布局与招商引资场景中,可基于该数据集训练的模型快速绘制卫星制造、地面设备、终端应用、航空运输、航空零部件等全环节的企业分布地图,精准识别区域产业优势与短板环节,为精准招商、产业强链补链提供数据支撑,避免传统招商过程中信息不对称、定位不清晰的问题;在链主企业供应商寻源场景中,可赋能卫星总体单位、航空公司、大型集成商等主体,快速匹配上游卫星平台、有效载荷、通信终端、航空零部件等领域的潜在供应商与技术合作伙伴,大幅降低供应链调研成本,提升供应链韧性;在行业研究与投资决策场景中,可支持投资机构、研究团队对卫星通信、卫星遥感、北斗导航应用、航空物流等细分赛道的企业分布、技术实力、市场竞争格局进行量化分析与动态跟踪,提升行业研究的效率与准确性。
本次数据知识产权登记的完成,不仅明确了该数据集的知识产权归属,为后续的合规流通、商业化应用提供了权益保障,也为垂直产业领域专业数据集的合规化登记、资产化运营提供了可复制的实践参考,对于推动数据要素在战略性新兴产业领域的落地应用、助力数字经济与实体经济深度融合具有积极意义。





_1769672084863.jpg)