five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

国内首份氢能产业链结构文本训练数据在浙完成知识产权登记 可直接赋能全产业链智能分析

五号数据雷达数据知识产权登记2026-05-24 03:045
2026年5月22日,火石创造旗下氢能产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成登记,作为国内氢能领域首个完成官方确权的AI专用训练数据集,其可广泛应用于产业图谱构建、产业链智能分类等场景,为氢能产业数字化治理提供核心数据支撑。

当前我国氢能产业正处于规模化发展关键期,产业链覆盖制氢、储运、加注、应用等十余个细分领域,跨环节企业识别、产业布局研判、赛道投资分析长期面临分类标准不统一、语义分析基础缺失的痛点。与此同时,随着全国数据要素市场化配置改革加速推进,数据知识产权登记作为数据资产确权、合规流通的前置核心环节,已成为激活产业数据价值、保障数据开发者权益的重要制度基础。作为全国数据要素改革先行试点省份,浙江省搭建的省级数据知识产权登记平台,是国内首批具备官方公信力的数据确权存证载体,承担着数据资产合规校验、权属公示、流通赋能的公共服务职能,为各类产业数据的市场化应用提供权威背书。
2026年5月22日,火石创造科技有限公司研发的氢能产业链结构文本训练数据正式在该平台完成知识产权登记,成为国内氢能领域首个完成官方确权的专用AI训练数据集,填补了新能源产业结构化训练语料合规确权的空白。
据介绍,本次登记的数据集核心定位为氢能产业链智能分析模型的专用训练语料,全流程符合数据安全与隐私保护要求:加工前已完成严格的匿名化与去标识化处理,原始企业名称被替换为不可逆规范标识符,所有个人及商业敏感信息被彻底移除,从源头保障了数据的合规性。
在加工环节,数据集严格遵循“体系先行、业务匹配、特征抽取”的核心规则构建:首先依托国家氢能产业发展战略规划及产业链技术路线,搭建了覆盖一级节点“氢能”、6个二级产业链节点、数十个三级细分业务领域的树状分类体系,为数据标注提供专业的产业逻辑框架;其次采用“自动化规则匹配+人工校验”的双轨策略,先通过Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,再由具备新能源产业专业背景的标注团队完成最终审核,确保企业分类的精准度;最后同步抽取企业核心产品、技术相关的关键术语形成语义补充特征串,进一步提升数据集的可用性。
最终形成的结构化“文本-标签”数据集,每条均包含脱敏企业描述文本、经人工校验的三级分类标签、细化业务特征词与产业标签,全面覆盖氢能上游制氢、中游储运加注、下游燃料电池及应用、配套检测服务等全产业链环节,可直接用于氢能产业链分析、核心技术企业识别、投资赛道研判等模型的训练与评估。
从应用价值来看,该数据集可支撑多类产业数字化场景落地:在政府端,可辅助产业规划部门绘制全产业链企业地图,识别区域产业优势与短板,为精准招商、政策制定提供数据支撑;在投资端,可赋能投资机构与研究团队对电解槽、双极板、加氢设备等关键技术路线的市场格局、企业竞争力进行量化分析与动态跟踪;在产业端,可支持氢能项目开发商、能源集团、整车企业精准匹配上下游供应商与服务商,构建高效协同的产业生态。行业人士指出,本次登记不仅为氢能产业的智能化分析工具研发提供了合规的核心数据底座,也为战略性新兴产业领域的产业数据知识产权保护、合规流通提供了可复制的实践样本,对推动数据要素与实体经济深度融合、助力数字经济与新能源产业双发展具有典型示范意义。

查看氢能产业链结构文本训练数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们