five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江完成纤维及复合材料产业链结构文本训练数据知识产权登记 赋能新材料全产业链数字化应用

五号数据雷达数据知识产权登记2026-05-24 07:206
2026年5月22日,火石创造科技有限公司旗下纤维及复合材料产业链结构文本训练数据正式完成浙江省数据知识产权登记平台确权登记,该数据集可直接用于产业链图谱构建、供应链优化、产业政策研判等场景的AI模型训练,为新材料产业数字化转型提供合规数据支撑。

作为支撑高端制造的核心基础领域,新材料产业是我国战略性新兴产业的重要组成部分,而纤维及复合材料更是航空航天、轨道交通、新能源汽车等高端领域的关键原材料。随着产业链复杂度不断提升,依托人工智能技术实现产业链动态监测、精准决策已经成为行业共性需求,但专业领域训练数据不足、权属不清、合规性存疑一直是阻碍相关AI应用落地的核心痛点。
作为国内较早落地的数据知识产权确权登记基础设施,浙江省数据知识产权登记平台主要为各类数据资产提供权属公示、合规核验服务,是数据要素流通交易的前置性核心环节。本次火石创造登记的纤维及复合材料产业链结构文本训练数据,正是针对新材料领域AI训练数据缺口推出的专用合规数据集,主要服务于纤维及复合材料产业链智能分类与产业图谱构建模型的训练与开发,通过关联企业文本与材料技术标签,为新材料产业发展提供核心数据工具。
其核心应用场景覆盖产业链上中下游多个参与方:
一是上游供应链寻源:航空航天、汽车制造、轨道交通等下游应用领域对高性能复合材料的性能、供应稳定性要求极高,依托该数据集训练的产业链分析模型,可帮助企业精准识别碳纤维、芳纶、玻璃纤维等高性能复合材料及特种纤维的优质供应商,降低寻源成本,优化供应链抗风险能力。
二是区域产业集群分析:新材料是各地布局战略性新兴产业的核心赛道,该数据集可辅助政府及产业规划部门快速摸清区域在高性能纤维、树脂基复合材料等细分领域的企业分布、技术积累与产业链短板,为制定精准的产业扶持政策、招商方案提供数据依据,避免同质化布局。
三是技术路线与投资研判:复合材料领域技术迭代快、细分路线多,该数据集可支持投资机构与行业研究团队对热塑性复合材料、热固性复合材料、金属基复合材料等不同技术路线的研发动态、企业竞争格局与市场渗透率进行量化跟踪与分析,降低行业信息差,提升决策效率。
为保障数据的合规性与可用性,该数据集的生产全流程均严格遵循国家数据安全、隐私保护相关要求:
一、加工前数据说明
本数据集旨在构建用于纤维及复合材料产业链智能分析的人工智能模型训练语料。在加工前,数据已进行严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,并彻底移除所有的个人及商业敏感信息,确保数据完全符合《数据安全法》《个人信息保护法》等法律法规要求,为模型训练提供了洁净、可靠的输入基础。
二、数据处理规则
数据处理严格遵循 “体系先行、业务匹配、特征抽取” 的核心规则,形成了一套从分类框架构建到最终标签生成的完整流程:
1.首先,依据国家新材料产业分类标准及复合材料技术体系,预先定义了从“纤维及复合材料”(一级节点)出发,按材料类型与产品形态划分为“高性能纤维复合材料”和“高性能纤维”(二级节点),并进一步细分为“树脂基复合纤维”、“金属基复合材料”、“玻璃纤维”、“有机纤维”(三级节点)及“碳纤维增强树脂基复合材料”、“芳纶纤维”等具体材料品类(四级节点)的树状分类体系。该体系与国家产业统计标准对齐,为自动化处理提供了专业、清晰的结构化框架,也保障了数据的跨场景通用性。
2.业务匹配:采用“自动化规则匹配与人工校验相结合”的策略。首先,依托Spark大数据处理框架,对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的纤维复合材料产业语义规则库自动计算并推荐初步分类节点。随后,由具备材料科学背景的标注专家进行全文语境审核与最终判定,确保企业被精准归入最贴切的材料品类与技术路线节点,大幅提升数据标注准确率。
3.特征抽取:在完成业务匹配的同时,从同一段企业简介文本中,系统性地抽取代表其核心产品与技术的关键术语与名词性短语,经过去重与标准化格式化,组合成“正向词”特征串,作为对分类标签的语义补充,让模型对企业的技术能力、产品布局的识别精度进一步提升。
三、加工后数据内容
加工后的数据集为一条条结构化的“文本-标签”数据。每条数据均包含经过脱敏处理的原始企业描述文本,以及与之对应、经人工校验的完整分类标签(一级至四级节点)、高度细化的产品技术特征词(正向词)与多维度产业标签。数据内容全面覆盖了碳纤维、芳纶、玻璃纤维、超高分子量聚乙烯纤维等高性能纤维材料,以及热固性、热塑性树脂基复合材料、金属基复合材料等关键品类,企业应用领域涵盖航空航天、轨道交通、汽车制造、建筑建材、医疗健康等。本数据集形成了一个分类体系专业、特征粒度精细、标签信息丰富的专用语料库,可直接用于纤维及复合材料产业链图谱构建、技术成熟度评估、供应商竞争力分析等高价值模型的训练与评估。
本次该数据集完成知识产权登记,是数据要素市场化配置改革在新材料产业领域的典型实践,一方面明确了数据资产的权属,保护了数据开发方的合法权益,另一方面也为合规产业训练数据的流通、交易奠定了基础,未来可通过合法授权的方式供给给产业链各方使用,进一步降低新材料产业数字化转型的门槛,助力我国高端材料产业的高质量发展。

查看纤维及复合材料产业链结构文本训练数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们