当前,我国新能源产业正处于高速发展阶段,产业链细分赛道多达上百个,上下游市场主体超百万家,政府产业规划、园区招商、投资机构赛道研判、链主企业供应链匹配等场景对结构化、高精准度的产业数据需求持续上涨。作为保障数据权益、规范数据流通的核心制度安排,数据知识产权登记正在为高价值产业数据的资产化、市场化应用提供合规基础。2026年5月29日,火石创造科技有限公司旗下的新能源产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成登记,为新能源产业数字化分析场景提供了合规可用的标准化训练语料。
据了解,本次登记的数据集核心服务于新能源产业智能分析与图谱构建,通过精准关联企业信息与多级产业标签,可为多类产业决策场景提供数据支撑:在产业规划场景,可辅助政府及园区精准洞察太阳能、风能、智能电网等细分领域的设备制造、材料供应与技术服务的空间分布、产能布局,为产业政策制定、差异化招商提供客观依据;在市场研判场景,可为投资机构分析光伏设备、储能电池、电力电子元器件等热门赛道的竞争格局、技术路线分布提供标准化参考,大幅降低行业研究与项目尽调成本;在供应链协同场景,可赋能新能源项目方或链主企业智能匹配从专用材料、核心设备到工程服务的上下游供应商,提升供应链韧性与应急配套效率。
本次登记的数据集在加工前已完成严格的合规处理,所有原始数据均经过匿名化与去标识化操作:原始企业名称被统一替换为不可逆的规范标识符,企业简介中的具体地址、联系人等敏感信息已全部移除,完全符合《数据安全法》《个人信息保护法》等法律法规关于隐私保护与数据安全的要求,为后续的模型训练、数据流通提供了洁净、可靠的输入基础。
在数据加工环节,本次数据集严格遵循“体系先行、业务匹配、特征抽取”的核心规则,并针对新能源产业的全链条特性优化了分类逻辑:首先构建了覆盖全产业的四级分类体系,以“新能源”为根节点,下设“太阳能产业”“风能产业”“智能电网产业”“生物质能及其他新能源产业”等二级节点,进一步细分出“太阳能设备和生产装备制造”“智能电力控制设备及电缆制造”等三级节点,最终落地到“泵及真空设备制造”“电线、电缆制造”“新能源技术推广服务”等四级业态节点,完整覆盖新能源从发电、输配到服务的全链条环节,保障了产业分类的逻辑性与精细度。
分类匹配环节采用“自动化规则匹配与人工校验相结合”的策略:首先依托Spark等大数据处理框架,对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过包含“光伏”“风电”“储能”“电缆”“逆变器”等领域术语的预构建新能源产业语义规则库,自动计算并推荐初步分类节点;随后由具备新能源产业背景的标注专家对系统推荐结果进行全文语境审核,结合企业核心产品与服务属性完成最终的四级节点归类,大幅提升了分类标注的准确率。在完成分类的同时,加工流程还会从企业简介中系统性抽取体现其技术特性、产品属性或业务模式的关键词,最终形成与分类标签一致的“四级节点”核心特征,清晰标定企业的具体业务活动。
最终加工完成的数据集为标准化的“文本-标签”结构化数据,每条数据均包含脱敏后的企业描述文本,以及经人工校验的完整一至四级产业链分类标签,覆盖光伏材料、风电装备、智能电缆、新能源技术推广等全产业链关键环节,可直接用于新能源产业精细图谱构建、企业智能分类、供应链分析等AI模型的训练与评估,未来还可拓展应用于产业景气度预测、技术迭代趋势分析等更多产业数字化场景。
本次新能源产业链训练数据的成功登记,是产业数据与数据知识产权制度结合的典型实践,既为新能源产业的数字化分析提供了合规可用的高质量数据资产,也为国内高价值产业训练数据的合规登记、流通应用提供了可参考的落地样本,对推动数据要素向实体经济赋能、加快战略性新兴产业的数字化转型具有积极意义。
首页 / 数据知识产权登记 / 正文
新能源产业链结构文本训练数据完成浙江数据知识产权登记 覆盖全链条支撑多类产业应用
五号数据雷达数据知识产权登记2026-05-30 03:086
2026年5月29日,火石创造科技有限公司旗下新能源产业链结构文本训练数据正式完成浙江省数据知识产权登记,该数据集为覆盖新能源全产业链的标准化标注训练语料,可支撑产业图谱构建、产业链智能分析等多类产业数字化场景,为产业类数据资产的合规流通与应用提供了可参考的落地样本。

社区讨论
近期热门




_1769672084863.jpg)