five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江完成新能源材料产业链文本训练数据知识产权登记 可支撑多场景产业智能决策

五号数据雷达数据知识产权登记2026-05-28 05:143
2026年5月27日,火石创造科技有限公司旗下新能源材料产业链结构文本训练数据正式完成浙江省数据知识产权登记平台确权登记,该数据集可广泛应用于产业链智能分类、供应链分析、投资研判等多个场景,为新能源产业数字化决策提供合规数据支撑。

当前,新能源产业已成为我国战略性新兴产业的核心赛道,产业链强链补链、供应链风险防控、产业投资布局等环节对结构化、高精准度的产业数据需求持续攀升。作为全国数据要素市场化配置改革先行区,浙江近年来持续完善数据知识产权登记服务体系,官方搭建的浙江省数据知识产权登记平台承担着数据确权、权益存证、流通支撑等核心职能,是国内少数具备成熟数据知识产权登记服务能力的省级官方平台,完成登记的数据可获得官方确权凭证,为后续的流通交易、权益保护、开发利用提供合规依据。

2026年5月27日,火石创造科技有限公司旗下的新能源材料产业链结构文本训练数据正式在上述平台完成知识产权登记。据了解,该数据集是专门面向新能源材料产业链智能分析场景开发的AI训练语料,主要服务于产业链智能分类与产业图谱构建模型的训练与开发,通过关联企业文本与材料类型标签,为新能源产业全链路分析提供核心数据工具,目前可覆盖三大核心应用方向:
一是产业链分析与强链补链:可辅助政府及产业研究机构,绘制燃料电池、风电叶片、光伏组件等关键环节的材料企业分布地图,快速识别产业链优势环节与潜在技术短板,为产业政策制定、园区招商、产业集群培育提供数据依据;
二是供应链寻源与技术合作:能够赋能新能源装备制造商(如燃料电池系统集成商、风电叶片厂、光伏组件厂),精准识别上游电催化剂、双极板、增强纤维、基体树脂等关键材料的潜在供应商与技术合作伙伴,降低供应链寻源成本,提升供应链应急响应能力;
三是技术竞争与投资研判:可支持投资机构与行业分析师,对铂基催化剂、碳纳米管、碳纤维复合材料等细分材料领域的研发动态、技术路线及市场竞争格局进行量化跟踪,提升投研效率与决策精准度。

为保障数据合规性与质量,该数据集在全流程加工环节设置了严格的标准体系:
一、加工前数据说明
数据集在加工前已完成严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,所有个人及商业敏感信息被彻底移除,完全符合《数据安全法》《个人信息保护法》等法律法规要求,为模型训练提供了洁净、可靠的输入基础。
二、数据处理规则
数据处理严格遵循 “体系先行、业务匹配、特征抽取” 的核心规则,形成了完整的标准化流程:
1. 分类体系构建:依据国家战略性新兴产业分类及新能源材料专业分类,预先定义了以“新能源材料”为一级节点,按应用领域划分为“燃料电池材料”、“风电叶片材料”、“光伏电池材料”、“锂电池材料”等二级节点,并进一步细分为“电催化剂”、“双极板”、“增强纤维”、“基体树脂”、“光伏胶膜”、“正极材料”等具体材料类型(三级及四级节点)的树状分类体系,为数据加工提供了科学、系统的分类框架;
2. 业务匹配:采用“自动化规则匹配与人工校验相结合”的策略,首先依托Spark大数据处理框架,对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的新能源材料产业语义规则库自动计算并推荐初步分类节点,随后由具备材料科学与新能源产业知识的标注专家进行审核与最终判定,确保企业被精准归入最贴切的材料类型与应用领域节点;
3. 特征抽取:在完成业务匹配的同时,从同一段企业简介文本中,系统性地抽取代表其核心产品与技术的关键术语与名词性短语,经过去重与标准化格式化,组合成“正向词”特征串,作为对分类标签的语义补充。
三、加工后数据内容
加工后的数据集为一条条结构化的“文本-标签”数据,每条数据均包含经过脱敏处理的原始企业描述文本,以及与之对应、经人工校验的完整分类标签(一至四级节点)、高度细化的产品技术特征词(正向词)与产业标签。数据内容全面覆盖了氢能燃料电池、风电叶片、光伏组件、锂电池等新能源关键领域的上游核心材料环节,形成了一个分类体系专业、技术特征鲜明、可直接用于新能源材料产业链分析、关键技术企业识别、供应链寻源等模型训练与评估的高质量专用数据集。

业内人士指出,本次新能源材料产业链专用训练数据集完成知识产权登记,不仅为新能源产业智能化应用提供了合规的高质量数据源,也为垂直产业领域训练数据集的确权、流通提供了可复制的实践样本,对推动数据要素与实体经济深度融合、助力新能源产业高质量发展具有积极意义。

查看新能源材料产业链结构文本训练数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们