five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

新能源材料产业链结构文本训练数据完成浙江数据知识产权登记 可赋能多类产业数字化场景

五号数据雷达数据知识产权登记2026-05-28 04:362
2026年5月27日,火石创造科技有限公司旗下新能源材料产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记,该合规专用数据集可直接用于产业链智能分类、供应链分析、产业投资研判等多场景的AI模型训练,为新能源产业数字化治理提供核心数据支撑。

当前我国数据要素市场化配置改革持续深化,数据知识产权登记作为明确数据权属、保障数据资产权益、规范数据流通交易的核心基础性制度,正在加快向生物医药、新能源等垂直产业领域渗透。作为全国数据要素改革先行试点省份,浙江省搭建的浙江省数据知识产权登记平台,是国内率先落地的省级官方数据知识产权登记服务载体,承担着数据合规性核验、权属确认、流通溯源等核心职能,为各类产业数据资源的合法合规开发利用、资产化流通提供官方制度背书。

2026年5月27日,火石创造科技有限公司旗下的新能源材料产业链结构文本训练数据,正式在该平台完成数据知识产权登记。据介绍,该数据集专门面向新能源材料产业链智能分析领域打造,用于产业链智能分类与产业图谱构建模型的训练与开发,通过关联企业文本与材料类型标签,为新能源产业全链路分析提供核心数据工具,其潜在应用场景覆盖产业治理、企业经营、投资决策三大维度:

一是产业链分析与强链补链:可辅助政府产业主管部门、产业研究机构,绘制燃料电池、风电叶片、光伏组件、锂电池等新能源核心赛道关键环节的材料企业分布地图,快速识别产业链优势环节与潜在技术短板,为产业政策制定、区域产业招商、园区产业定位提供数据依据,提升产业治理的精准性与效率。

二是供应链寻源与技术合作:可赋能新能源装备制造商,包括燃料电池系统集成商、风电叶片厂、光伏组件厂、动力电池厂商等市场主体,精准识别上游电催化剂、双极板、增强纤维、基体树脂、光伏胶膜、正极材料等关键材料的潜在供应商与技术合作伙伴,降低供应链寻源成本,提升应对供应链波动、开展国产替代的效率。

三是技术竞争与投资研判:可支持投资机构、行业分析师对铂基催化剂、碳纳米管、碳纤维复合材料等细分材料领域的研发动态、技术路线迭代、市场竞争格局进行量化跟踪,为技术价值评估、投资标的筛选、赛道布局决策提供数据支撑,降低信息不对称带来的决策风险。

为保障数据合规性与可用性,该数据集在加工全流程建立了严格的标准规范:
一、加工前数据合规处理
本数据集旨在构建用于新能源材料产业链智能分析的人工智能模型训练语料。在加工前,数据已进行严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,并彻底移除所有的个人及商业敏感信息,完全符合《数据安全法》《个人信息保护法》等相关法律法规要求,为模型训练提供了洁净、可靠的输入基础。

二、数据处理规则
数据处理严格遵循 “体系先行、业务匹配、特征抽取” 的核心规则,形成了一套从分类框架构建到最终标签生成的完整流程:1.首先,依据国家战略性新兴产业分类及新能源材料专业分类,预先定义了以“新能源材料”为一级节点,按应用领域划分为“燃料电池材料”、“风电叶片材料”、“光伏电池材料”、“锂电池材料”等二级节点,并进一步细分为“电催化剂”、“双极板”、“增强纤维”、“基体树脂”、“光伏胶膜”、“正极材料”等具体材料类型(三级及四级节点)的树状分类体系,为数据加工提供了科学、系统的分类框架,确保分类标准的通用性与权威性。2.业务匹配:采用“自动化规则匹配与人工校验相结合”的策略。首先,依托Spark大数据处理框架,对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的新能源材料产业语义规则库自动计算并推荐初步分类节点。随后,由具备材料科学与新能源产业知识的标注专家进行审核与最终判定,确保企业被精准归入最贴切的材料类型与应用领域节点,大幅提升分类准确率。3.特征抽取:在完成业务匹配的同时,从同一段企业简介文本中,系统性地抽取代表其核心产品与技术的关键术语与名词性短语,经过去重与标准化格式化,组合成“正向词”特征串,作为对分类标签的语义补充,进一步丰富数据集的信息维度。

三、加工后数据内容
加工后的数据集为一条条结构化的“文本-标签”数据。每条数据均包含经过脱敏处理的原始企业描述文本,以及与之对应、经人工校验的完整分类标签(一至四级节点)、高度细化的产品技术特征词(正向词)与产业标签。数据内容全面覆盖了氢能燃料电池、风电叶片、光伏组件、锂电池等新能源关键领域的上游核心材料环节,形成了一个分类体系专业、技术特征鲜明、可直接用于新能源材料产业链分析、关键技术企业识别、供应链寻源等模型训练与评估的高质量专用数据集。

查看新能源材料产业链结构文本训练数据

登记内容:

业内人士指出,本次新能源材料产业链训练数据完成省级官方知识产权登记,是垂直产业类训练数据资产化的典型实践,一方面标志着产业专用训练数据的资产价值得到官方制度层面的认可,另一方面也为新能源领域数据要素的合规开发、流通交易提供了可参考的样本,对推动新能源产业数字化转型、加快数据要素市场向垂直产业领域下沉均具有积极的探索意义。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们