随着我国数据要素市场化建设持续推进,数据知识产权登记作为明确数据权属、保障数据流通安全、激活数据资产价值的核心前置环节,正在各细分产业领域加速落地。作为国内率先投入运营的省级数据知识产权登记载体,浙江省数据知识产权登记平台承担着数据资源合规存证、权属确认、流通前置核验等公共职能,为不同领域的合规数据资产打通从确权到应用的全链路通路。
当前在双碳目标驱动下,储能作为新型电力系统的核心支撑产业,技术路线迭代快、产业链覆盖环节多、市场主体分散,传统人工调研式的产业分析、供应链梳理效率极低,市场对AI驱动的产业链智能分析、产业图谱自动构建工具需求迫切,而高质量标注的产业文本训练数据,正是这类智能工具准确率、实用性的核心基础。2026年5月26日,火石创造科技有限公司申报的储能产业链结构文本训练数据正式在该平台完成知识产权登记,成为储能领域完成合规确权的专用AI训练数据集代表。
本次登记的数据集核心定位为储能产业链智能分析类AI模型的训练语料,全流程严格符合数据安全与隐私保护要求:加工前已完成100%匿名化与去标识化处理,原始企业名称全部替换为不可逆规范标识符,彻底移除个人及商业敏感信息,为后续模型训练与数据应用筑牢合规底座。
在数据加工环节,团队严格遵循“体系先行、业务匹配、特征抽取”的核心规则,形成了标准化的处理流程:1. 分类体系搭建:首先参考国家能源技术与战略性新兴产业分类标准,构建了覆盖一级分类“储能”、二级分类“电储能”、三级分类“物理储能/电化学储能/电磁储能”、四级分类包含“抽水蓄能/电池储能/超级电容储能”等具体技术路线的树状分类体系,为自动化标注提供统一的结构化框架;2. 业务匹配:采用“自动化规则匹配+人工校验”的双轨策略,依托Spark大数据处理框架对海量企业公开文本进行分布式清洗、分词与关键词匹配,通过覆盖全产业链的语义规则库(涵盖“抽水蓄能”“超级电容”“电池制造”“储能系统”等核心术语)自动生成初步分类结果,再由产业标注专家逐一审核校准,确保企业分类的准确性;3. 特征抽取:在完成分类的同时,还会从企业文本中系统性抽取核心产品、技术相关的关键术语,经去重、标准化格式化处理后形成“正向词”特征串,作为分类标签的语义补充,进一步提升数据集的标注丰富度。
加工完成后的数据集为标准化“文本-标签”结构化数据,每条数据均包含脱敏后的企业描述文本、经人工校验的四级完整分类标签与业务特征词,覆盖抽水蓄能、电池储能、超级电容器等储能产业主流技术领域,标注一致性高,可直接用于各类储能产业链分析模型的训练与评估。
从应用场景来看,该数据集赋能的产业链智能分析工具可覆盖三类核心需求:一是产业规划与投资分析方向,可辅助地方政府、产业园区快速梳理区域内储能产业的技术路线布局、产业链薄弱环节,为精准招商、补链强链提供数据支撑,也可帮助投资机构批量识别储能赛道的优质企业与技术迭代趋势,提升投研效率;二是供应链与供应商识别方向,可帮助储能系统集成商、电站开发商快速匹配上游电池、水泵、BMS、PCS等核心设备的潜在供应商与技术合作伙伴,降低供应链搜寻成本,提升供应链韧性;三是技术路线研究与监测方向,可支持科研机构、行业协会对超级电容、新型储能电池等细分技术领域的研发动态、企业分布、产业化进度进行量化跟踪,为能源技术政策制定、技术路线研判提供数据参考。
本次储能领域训练数据的成功登记,不仅为能源产业数字化提供了高质量的基础数据资产,也为产业类训练数据的确权、流通、应用提供了可复制的实践样本,对推动数据要素与实体经济融合、助力能源结构转型具有典型示范意义。





_1769672084863.jpg)