five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江完成传统汽车产业链结构文本训练数据知识产权登记 赋能产业强链补链多场景应用

五号数据雷达数据知识产权登记2026-05-24 02:594
2026年5月22日,火石创造科技有限公司旗下传统汽车产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记,该合规数据集可广泛应用于汽车产业链智能分类、供应链文本挖掘等领域,为汽车产业数字化治理、供应链韧性建设提供标准化数据支撑。

当前我国数据要素市场化建设正进入深化落地阶段,数据知识产权登记作为数据资产确权、合规流通的核心前置环节,正在各细分产业领域加速渗透。与此同时,汽车产业作为国民经济支柱产业,正处于电动化、智能化转型关键期,供应链韧性保障、区域产业布局优化、细分赛道投资研判等场景对标准化、结构化的产业链标注数据需求持续攀升。作为浙江省官方打造的数据知识产权确权服务载体,浙江省数据知识产权登记平台承担着数据资源合规审核、权属登记、流通背书的核心职能,本次登记也是汽车产业细分领域训练数据资产合规化的重要实践。

2026年5月22日,火石创造科技有限公司旗下传统汽车产业链结构文本训练数据正式在该平台完成知识产权登记。据介绍,本数据集核心定位为传统汽车产业链智能分类与图谱构建模型的专用训练语料,通过精准关联企业文本与产业标签,为汽车产业多维度分析提供核心数据工具。

为保障数据安全合规,本数据集在加工前已完成严格的匿名化与去标识化处理:原始企业名称被统一替换为不可逆的规范标识符,所有个人及商业敏感信息被彻底移除,完全符合《数据安全法》《个人信息保护法》等相关法律法规要求,为后续模型训练与产业应用筑牢了合规基础。

本次数据集的加工严格遵循“体系先行、业务匹配、特征抽取”的核心逻辑,形成了全流程标准化的处理规范:首先依托汽车产业专业分类框架,搭建了从一级节点“传统汽车”、二级节点“传统汽车零部件”,到三级节点“汽车底盘”“车身”“汽车电子电器”“汽车发动机”等子系统,再到四级节点具体部件的四层树状分类体系,确保分类逻辑清晰、覆盖全面、互不交叉;其次采用“自动化规则匹配+人工校验”的双轨匹配策略,依托Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的汽车产业语义规则库自动推荐初步分类节点,再由具备汽车产业专业背景的标注专家对推荐结果进行全文语境审核与最终判定,确保每家企业精准归入最适配的产业链节点;最后在业务匹配完成的同时,从企业简介文本中系统性抽取核心产品、技术、工艺相关的关键术语,经去重、标准化格式化后形成“正向词”特征串,为模型训练提供细粒度的语义特征支撑。

加工完成后的数据集为标准化的“文本-标签”结构化数据,每条数据均包含脱敏后的企业描述文本,以及经人工校验的四级完整分类标签、产业标签与业务特征词,全面覆盖传统汽车底盘、车身、发动机、电子电器等核心零部件领域,具备分类体系专业、标注一致性高、特征维度明确的特点,可直接用于汽车产业链图谱构建、供应商智能分类与风险评价等模型的训练与评估。

目前该数据集已明确可覆盖三大类核心应用场景:一是供应链管理与寻源,可赋能整车厂及一级供应商智能识别、精准匹配全国范围内底盘、车身、电子电器等细分领域的供应商,优化采购决策,同时还可支撑供应链风险预警,当核心部件主供区域出现突发风险时,快速定位替代供应商,保障产业链稳定;二是产业集聚与布局分析,可辅助政府、产业园区分析区域汽车零部件产业的集聚程度与产业链完整度,为强链补链政策制定、精准招商提供决策依据;三是技术跟踪与投资洞察,可为投资机构、研究机构提供标准化的企业业务标签,支持对线控底盘、智能车灯等细分技术领域的趋势分析与竞争格局研判,同时也可支撑车企识别前沿技术布局的创新企业,助力技术合作与产业协同。

查看传统汽车产业链结构文本训练数据

登记内容:

业内人士指出,本次传统汽车产业链训练数据完成知识产权登记,不仅为汽车产业数字化应用提供了合规、高质量的核心数据资产,也为产业类训练数据的确权、流通、交易提供了可参考的实践样本,对推动汽车产业数据要素价值释放、支撑区域数字经济发展具有积极意义。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们