当前,我国数据要素市场化配置改革持续深化,数据知识产权登记作为数据资产确权、流通交易的核心前置环节,已经成为工业垂直领域数据要素价值释放的重要基础。作为全国率先落地的数据知识产权登记试点平台,浙江省数据知识产权登记平台承担着为市场主体提供数据资产存证、确权背书、流通溯源的公共服务职能,本次登记也是工业制造领域垂直产业链训练数据合规化的典型实践。
作为支撑新能源汽车、航空航天、绿色建筑、新型包装等战略性新兴产业的关键基础材料,铝加工产业近年进入高端化、智能化转型的关键期,产业链上下游对精准的供需匹配、产业格局研判、技术趋势洞察工具的需求持续攀升,而训练相关AI分析模型所需的合规、标注精准、产业逻辑清晰的垂直领域训练数据,一直是市场供给的短板。2026年5月26日,火石创造科技有限公司旗下铝材产业链结构文本训练数据正式完成浙江省数据知识产权登记,为相关AI模型的训练开发提供了合法合规的核心数据工具。
本次登记的数据集专为铝加工产业链智能分类与产业图谱构建模型训练打造,核心通过关联企业文本与加工材产品标签,实现对铝产业各环节主体、产品、技术的精准识别。在数据加工前,所有原始数据已完成严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,所有个人及商业敏感信息被彻底移除,完全符合《数据安全法》《个人信息保护法》等相关法律法规要求,为后续模型训练提供了洁净、合规的输入基础。
在数据处理环节,本次数据集严格遵循“体系先行、业务匹配、特征抽取”的核心规则,构建了全链路标准化加工流程:首先依托有色金属加工行业官方分类标准,搭建了以“铝材”为一级节点,向上延伸至铝土矿、氧化铝上游环节,向下按加工工艺细分为铝压延材、铝挤压材、铝压铸件、铝锻件、铝丝线材等二级节点,再按产品形态细分到汽车用铝铸件、航空铝材、药用包装箔等四级节点的树状分类体系,为数据标注提供了专业的产业逻辑框架。其次采用“自动化规则匹配+人工校验”的双重校验策略,先通过Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,依托预构建的铝加工产业语义规则库自动推荐初步分类节点,再由具备材料科学与工程专业背景的标注专家进行审核确认,确保企业被精准归入对应的产品类别与产业链环节。最后同步完成核心特征抽取,从企业简介文本中系统性抽取代表其核心产品、技术能力的关键术语,经去重、标准化处理后形成“正向词”特征串,作为分类标签的语义补充。
加工完成后的数据集为结构化的“文本-标签”配对数据,每条数据均包含脱敏后的企业描述文本、经人工校验的一至四级完整分类标签、细化业务特征词与产业标签,全面覆盖从氧化铝原料到各类铝加工材的核心生产主体,可直接用于铝加工产业链分析、供应商精准识别、技术应用场景挖掘等多场景的模型训练与评估。
从应用价值来看,该数据集训练形成的AI模型可覆盖三大核心场景:一是供应链寻源与客户开发,可赋能汽车零部件、包装、建筑幕墙等下游用铝企业,精准识别和匹配铝箔、铝型材、铝板带等各类铝加工材的优质供应商,优化采购决策,提升供应链韧性,尤其适配当前新能源汽车轻量化、储能结构件用铝需求爆发下的供需匹配需求;二是产业集聚与竞争力分析,可辅助地方政府、产业园区精准研判区域在铝压延、铝挤压、铝铸造等细分领域的产业集聚度、企业技术能力与产品结构,为产业规划、精准招商提供决策依据,避免产业同质化布局;三是市场研究与技术洞察,可支持行业研究机构、投资方快速捕捉高附加值铝材赛道的技术迭代趋势、市场竞争格局,挖掘潜在优质投资标的,助力高端铝材产业的创新发展。
本次铝材产业链训练数据的成功登记,不仅为铝产业数字化分析提供了合规的数据底座,也为工业制造领域其他垂直赛道的训练数据知识产权确权、流通提供了可参考的实践样本,对推动细分产业数据要素价值释放、助力工业数字化转型具有积极的示范意义。
首页 / 数据知识产权登记 / 正文
铝材产业链结构文本训练数据完成浙江数据知识产权登记 为铝产业数字化分析提供合规训练底座
五号数据雷达数据知识产权登记2026-05-27 08:593
2026年5月26日,火石创造科技有限公司旗下铝材产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记,该数据集可直接用于铝加工产业链分析、产业图谱构建等领域的AI模型训练,为铝产业全链路数字化升级提供合规、精准的数据支撑。

社区讨论
近期热门




_1769672084863.jpg)