five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

火石创造数字技术产业链训练数据完成浙江数据知识产权登记 可支撑多类数字产业分析场景

五号数据雷达数据知识产权登记2026-05-27 08:535
2026年5月26日,火石创造科技有限公司旗下数字技术产业链结构文本训练数据正式完成浙江省数据知识产权登记平台登记,该合规标注数据集可广泛应用于产业链智能分类、产业图谱构建、数字经济产业分析等场景,为产业类训练数据的合规确权与流通提供了示范样本。

随着全国数据要素市场化建设进入落地深化阶段,数据知识产权登记作为明确数据资产权属、保障数据加工方合法权益、支撑数据合规流通的核心基础性制度,已成为各地推进数据要素市场建设的重点抓手。作为国内率先落地的省级数据知识产权登记公共服务平台,浙江省数据知识产权登记平台主要承担数据资产权属存证、合规核验、流通公信力背书等核心职能,为合规数据资产入市交易、授权使用提供官方认可的权属证明。2026年5月26日,火石创造科技有限公司旗下的数字技术产业链结构文本训练数据正式在该平台完成知识产权登记,成为国内数字产业领域又一完成合规确权的高质量训练数据集。

据介绍,本次登记的数据集核心定位为数字技术产业链智能分析类AI模型的专用训练语料,主要服务于数字技术产业链智能分类、数字技术产业图谱构建相关模型的训练与开发,通过关联企业文本信息与技术方向标准化标签,为数字经济发展监测、产业分析等场景提供核心数据工具。从应用场景来看,该数据集可覆盖政府产业规划、投资赛道研判、企业数字化转型三大核心方向:
一是可用于技术赛道与产业布局分析,辅助地方政府、产业园区等规划主体,绘制元宇宙、物联网、人工智能、工业互联网等重点数字技术领域的企业分布热力图,精准识别区域在交互技术、网络安全、AR/VR等细分赛道的产业集聚程度与核心竞争力,为地方补链强链、产业招引、数字经济政策制定提供数据支撑;二是可用于技术与服务能力评估,赋能投资机构、行业研究团队从技术领域、业务模式两个维度快速筛选目标标的,精准评估不同赛道企业的核心技术能力与商业模式成熟度,降低行业研究与投资研判的信息成本;三是可用于数字化转型服务寻源,支持大型制造企业、产业园区根据自身具体技术需求(如物联网安全、工业控制系统部署、生物特征识别应用等),快速匹配具备对应技术能力与项目实施经验的数字化服务商,提升数字化转型的供需对接效率。

为保障数据全流程合规性,该数据集在加工前已完成严格的匿名化与去标识化处理:原始企业名称被统一替换为不可逆的规范标识符,所有个人信息、未公开商业敏感信息均被彻底移除,完全符合《数据安全法》《个人信息保护法》等相关法律法规对数据流通的隐私保护要求,为后续模型训练提供了洁净、可靠的输入基础。

在数据加工环节,本次数据集严格遵循“体系先行、业务匹配、特征抽取”的核心规则,形成了覆盖分类框架构建到标签生成的全流程标准化处理体系:
1. 分类体系构建:参考国家数字经济发展战略及新一代信息技术产业分类国家标准,预先搭建了以“数字技术”为一级节点,下设“元宇宙”“物联网”“工业互联网”“人工智能”“高端芯片”等二级节点,进一步细分至“交互技术”“安全”“AR/VR”“工业控制系统”等具体技术方向的三级树状分类体系,为数据加工提供了符合官方产业统计逻辑的标准框架;
2. 业务匹配校验:采用“自动化规则匹配+人工专业校验”的双层校验策略,首先依托Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的数字技术产业语义规则库自动计算推荐初步分类节点,再由具备多年信息技术产业研究经验的标注专家进行审核判定,确保企业分类的精准度符合产业研究级要求;
3. 核心特征抽取:在完成业务匹配的同时,从企业简介文本中系统性抽取代表企业核心产品、核心技术的关键术语与名词性短语,经过去重、标准化格式化处理后组合成“正向词”特征串,作为分类标签的语义补充,进一步提升数据集的标注丰富度。

最终加工完成的数据集为结构化“文本-标签”配对数据,单条数据包含脱敏后的企业描述文本、经人工校验的一至三级完整分类标签、细粒度业务特征词(正向词)、多维度产业标签(技术领域+业务模式)四类核心字段,全面覆盖元宇宙、物联网、工业互联网、人工智能、高端芯片等当前数字技术核心赛道,是一套分类体系专业、特征标注精准、可直接用于数字技术产业链分析、技术赛道评估、服务商分类等模型训练与评估的高质量专用数据集。

业内人士指出,本次数字技术产业链结构文本训练数据完成知识产权登记,一方面为数据生产加工方的劳动成果提供了官方权属证明,有效保护了数据生产主体的知识产权权益;另一方面也为这类产业研究类训练数据的合规流通、授权使用提供了权属依据,对完善数据要素市场中产业数据类资产的登记、流通规则具有较强的示范意义,后续该类合规数据集可通过授权调用、产品化输出等多种方式向市场开放,进一步释放产业数据的应用价值。

查看数字技术产业链结构文本训练数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们