five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江完成输变电产业链结构文本训练数据知识产权登记 赋能电力产业数字化全场景应用

五号数据雷达数据知识产权登记2026-05-28 05:112
2026年5月27日,火石创造科技有限公司旗下输变电产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记,该合规数据集可广泛应用于电力供应链优化、产业布局研判、行业投资分析等多个场景,为能源领域数据要素确权流通与产业数字化发展提供了典型样本。

当前我国数据要素市场化配置改革进入落地攻坚阶段,数据知识产权登记作为数据资产确权、合规流通、权益保护的核心前置环节,已成为各垂直产业释放数据价值的重要基础。作为全国数据要素改革先行试点省份,浙江省搭建的数据知识产权登记平台承担着官方数据确权备案、流通服务、合规监管的核心职能,已为多个领域的合规数据资产提供确权背书,为数据要素跨主体流通筑牢了信任基础。电力作为国民经济命脉产业,随着新型电力系统建设提速,输变电产业链上下游主体对结构化、标准化的产业数据需求持续攀升,高质量的训练数据更是电力领域AI应用落地的核心支撑。

2026年5月27日,火石创造科技有限公司旗下的输变电产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记,该数据集定位为输变电产业链智能分类与产业图谱构建模型的专用训练语料,通过关联企业文本与设备制造、技术服务标签,为电力能源产业分析提供核心数据工具。

为满足数据安全与隐私保护的合规要求,该数据集在加工前已完成全量匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,所有个人及商业敏感信息被彻底移除,从源头保障了数据的合规性,为后续的模型训练、开放流通筑牢了安全底线。

本次数据集的加工严格遵循“体系先行、业务匹配、特征抽取”的核心规则,形成了一套标准化的处理流程:首先对接国家电力行业标准及输变电设备分类体系,预先搭建了从“输变电”一级节点向下延伸的四级树状分类框架,覆盖电力一次设备、电力二次设备、电力电子元件等二级类目,进一步下沉到载流导线、成套配电装置、电能转换设备、保护类设备、配电自动化等细分产品与技术类别,为数据标注提供了专业、统一的框架依据。其次采用“自动化规则匹配+人工校验”的双重处理机制,依托Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词初匹配,通过预构建的输变电产业语义规则库自动推荐初步分类节点,再由具备电力行业专业背景的标注专家完成最终审核判定,确保分类结果的准确性与专业度。同时在完成业务匹配的过程中,同步从企业文本中抽取核心产品与技术关键术语,经过去重、标准化格式化后形成“正向词”特征串,作为分类标签的语义补充,进一步丰富了数据集的信息维度。

加工完成后的数据集为结构化的“文本-标签”格式,每条数据均包含脱敏后的企业描述文本、经人工校验的一至四级完整分类标签、细粒度产品与技术特征词、产业标签等核心字段,全面覆盖输变电产业一次设备、二次设备、电力电子元件等核心领域,是可直接用于输变电产业链分析、设备供应商识别、技术路线研究等模型训练与评估的高质量专用数据集。从应用场景来看,该数据集可服务于三类核心主体的数字化需求:其一面向电力工程公司、电网建设单位、大型项目承包商等采购主体,可辅助其精准识别与匹配变压器、开关柜、电缆、继电保护装置等各类输变电设备的制造商与供应商,优化采购决策,提升供应链韧性;其二面向地方政府、产业研究机构,可支撑其分析区域在输变电设备制造、智能配电系统、新能源并网设备等细分领域的产业集聚程度与技术发展水平,为产业规划、精准招商提供数据依据;其三面向投资机构与行业分析师,可助力其对光伏配套设备、储能变流器、电力电子元件等热点赛道的企业分布、技术路线、市场竞争格局进行量化跟踪,降低决策信息差。

本次输变电产业链训练数据的成功登记,不仅为电力产业数字化转型提供了合规、高质量的训练数据源,也为工业垂直领域的数据知识产权确权、流通探索了可参考的落地路径,对推动能源领域数据要素市场化配置、加快数字经济与实体经济深度融合具有积极的示范意义。

查看输变电产业链结构文本训练数据

登记内容:

输变电产业链结构文本训练数据登记证书

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们