five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江完成有色金属产业链文本训练数据知识产权登记 可支撑全链条产业数字化分析

五号数据雷达数据知识产权登记2026-05-27 06:035
2026年5月26日,火石创造科技有限公司旗下有色金属材料产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记,该合规专业数据集可广泛应用于有色金属产业链分析、企业智能分类、供应链优化等场景,为有色产业数字化治理提供核心数据支撑。

当前我国数据要素市场化配置改革正进入落地攻坚阶段,数据知识产权登记作为明确数据权益归属、规范数据流通交易、保障数据主体合法权益的核心基础制度,已成为各地推进数据要素市场建设的标配抓手。作为全国首批数据要素市场化配置综合改革试点省份,浙江省打造的省级数据知识产权登记平台具备官方公示公信力,其出具的登记凭证可作为数据资产确权、流通交易、权益维护的重要依据。

本次火石创造登记的有色金属材料产业链结构文本训练数据,是面向有色金属产业数字化分析场景打造的专用AI训练数据集,核心服务于有色金属材料产业链智能分类与产业图谱构建模型的训练与开发,通过关联企业文本与材料加工标签,为金属材料产业分析提供核心数据工具。为保障数据合规性,数据集在加工前已进行严格的匿名化与去标识化处理:原始企业名称被统一替换为不可逆的规范标识符,所有个人及商业敏感信息被彻底移除,完全符合《数据安全法》《个人信息保护法》等相关法律法规要求,为后续模型训练、数据流通提供了洁净、可靠的合规基础。

在数据加工环节,该数据集严格遵循“体系先行、业务匹配、特征抽取”的核心规则,形成了全流程标准化处理体系:首先依据国家《战略性新兴产业分类》及有色金属行业标准,搭建了覆盖4级节点的专业分类框架——从一级节点“有色金属材料”出发,二级节点按材料大类划分为“有色轻金属”“有色重金属”“稀有稀土金属”“其他有色金属材料”,三级节点细分为“铝及铝合金”“铜及铜合金”“钛及钛合金”“硬质合金材料”等具体材料品类,四级节点再按加工形态或工艺细化为“铝压延加工”“铜材”“铝铸件”“电解铜”等具体环节,为数据标注提供了清晰的专业标尺。随后采用“自动化规则匹配与人工校验相结合”的策略,依托Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的有色金属产业语义规则库自动推荐初步分类节点,再由具备材料科学与工程背景的标注专家进行审核判定,确保企业被精准归入对应的材料品类与加工环节。同时还会从企业文本中抽取代表核心产品与技术的关键术语,经过去重标准化后形成“正向词”特征串,作为分类标签的语义补充。

加工完成后的数据集为结构化“文本-标签”格式,每条数据均包含脱敏后的企业描述文本、经人工校验的4级完整分类标签、产品特征词与产业标签,全面覆盖铝、铜、钛、硬质合金等主要有色金属材料品类,以及压延加工、铸造、冶炼、深加工等核心制造环节,是当前国内有色金属领域少有的分类体系专业、工艺特征鲜明、可直接用于模型训练与评估的高质量专用数据集。

从应用场景来看,该数据集训练形成的分析模型可支撑多主体的产业数字化需求:在企业端,可赋能汽车制造、航空航天、电子电器、建筑装饰等下游用材企业,精准识别各类有色金属材料的压延加工、铸造、冶炼供应商,优化采购决策、降低供应链断供风险;在政府端,可辅助地方政府与产业规划部门,分析区域在轻金属、重金属、稀有金属等细分领域的产业布局、加工能力与链条短板,为制定产业招商、强链补链政策提供数据依据;在研究与投资端,可支持行业研究机构与投资方,洞察高端铝材、精密铜材、硬质合金刀具等细分领域的技术发展趋势、市场竞争格局,挖掘潜在投资标的。此外该数据集还可延伸应用于用材替代研究、产业能耗核算等双碳相关场景。

本次数据集完成知识产权登记,不仅为有色金属产业数字化提供了合规的核心数据工具,也为制造类产业训练数据集的确权、流通提供了可参考的实践样本,对推动数据要素向实体经济特别是先进制造领域落地具有典型意义。
查看有色金属材料产业链结构文本训练数据

登记内容:

有色金属材料产业链结构文本训练数据登记凭证

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们