five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

光伏产业链结构文本训练数据完成浙江省数据知识产权登记 覆盖全环节可支撑多场景产业智能分析

五号数据雷达数据知识产权登记2026-05-30 04:422
2026年5月29日,火石创造科技有限公司旗下光伏产业链结构文本训练数据正式完成浙江省数据知识产权登记。该数据集为光伏领域专用结构化训练语料,可支撑产业链布局规划、供应链寻源、竞争格局研判等多场景AI模型开发,为光伏产业数字化决策提供标准化数据支撑。

随着双碳目标的持续推进,光伏产业已成为我国战略性新兴产业的核心赛道之一,产业链各环节的数字化分析、智能决策需求持续攀升;与此同时,在全国数据要素市场化建设的政策导向下,垂直领域专业数据集的知识产权确权、合规流通,已成为产业数字化发展的重要基础。2026年5月29日,火石创造科技有限公司旗下的光伏产业链结构文本训练数据,正式在浙江省数据知识产权登记平台完成登记。作为国内较早落地的数据知识产权官方登记渠道,浙江省数据知识产权登记平台承担着数据权益确认、合规流通背书、数据资产化支撑等核心职能,本次登记完成后,该数据集的知识产权权益将得到官方认可,为后续的合规共享、商业化应用提供了基础保障。

据了解,本次登记的光伏产业链结构文本训练数据,核心定位是为光伏产业链智能分类、产业图谱构建类AI模型的训练与开发提供标准化语料,通过关联企业文本与产业链环节标签,为光伏产业全维度分析提供核心数据工具。

一、加工前数据说明
本数据集旨在构建用于光伏产业链智能分析的人工智能模型训练语料。在加工前,开发团队已对所有原始数据完成了严格的匿名化与去标识化处理:原始企业名称被统一替换为不可逆的规范标识符,所有个人信息、商业敏感信息均被彻底移除,完全符合《数据安全法》《个人信息保护法》等法律法规要求,为后续模型训练提供了洁净、合规的输入基础。

二、数据处理规则
本次数据加工严格遵循“体系先行、业务匹配、特征抽取”的核心逻辑,形成了完整的标准化加工流程:
1. 分类框架搭建:团队依据国家《战略性新兴产业分类》,结合光伏行业专业分工特点,搭建了三级树状分类框架:一级节点为“光伏”产业大类,二级节点按产业链位置划分为光伏材料、光伏部件、光伏电池与组件、光伏设备、光伏发电系统5大板块,三级节点则进一步细化为多晶硅、光伏支架、光伏逆变器、集中式光伏电站等具体产品与技术类型,为数据标注提供了清晰的产业逻辑依据。
2. 业务匹配:采用“自动化规则匹配与人工校验相结合”的策略,先依托Spark大数据处理框架,对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的光伏产业语义规则库自动计算并推荐初步分类节点,再由具备光伏行业专业知识的标注专家进行逐一审核与最终判定,确保企业被精准归入对应的产业链环节与产品类型。
3. 特征抽取:在完成业务匹配的同时,从同一段企业简介文本中,系统性地抽取代表其核心产品、核心技术及企业资质的关键术语与名词性短语,经过去重与标准化格式化,组合成“正向词”特征串,并归纳其“产业标签”,共同作为对分类标签的精准语义补充,进一步提升数据集的应用灵活性。

三、加工后数据内容
加工完成后的数据集为结构化的“文本-标签”配对数据,每条数据均包含脱敏后的企业描述文本、经人工校验的一至三级完整分类标签、业务特征词与产业标签,全面覆盖光伏上游材料、中游部件与设备、下游电池组件及电站系统等所有核心环节,是分类体系专业、业务特征鲜明、可直接投入模型训练的光伏领域专用训练数据集。

从应用价值来看,该数据集可支撑多个领域的光伏产业数字化应用:在政府与产业园区端,可用于绘制光伏产业链上中下游企业分布地图,识别区域在硅材料、电池组件、逆变器、电站开发等领域的集聚程度与链条短板,为产业政策制定、精准招商提供数据支撑;在电站开发等市场主体端,可用于精准识别光伏支架、逆变器、电缆、接线盒等关键部件的优质供应商,优化供应链管理效率,降低采购成本;在投资机构、行业研究端,可用于不同技术路线的研发企业分布、市场集中度、竞争格局的量化分析与动态跟踪,为投资决策、行业研究提供数据依据。除此之外,该数据集还可用于行业协会的产业运行监测、金融机构的光伏企业授信评估等多个场景,为光伏产业全链路的数字化决策提供基础支撑。

本次光伏产业链专业训练数据完成知识产权登记,是垂直产业领域数据要素确权、流通的典型实践,既为数据开发方的知识产权权益提供了保障,也为产业AI模型的落地提供了合规、高质量的语料来源,对推动光伏产业数字化、数据要素市场化均具备正向示范意义。

查看光伏产业链结构文本训练数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们