five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

国内首份机器人产业链结构文本训练数据完成浙江省级知识产权登记 覆盖全链路产业应用场景

五号数据雷达数据知识产权登记2026-05-29 03:138
2026年5月28日,火石创造科技有限公司旗下机器人产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记,该数据集可直接支撑产业链分类、图谱构建等AI模型训练,为政府、园区、投研机构及产业链主体提供标准化的数字化决策工具。

当前机器人产业已成为我国“十四五”重点布局的战略性新兴产业核心赛道,产业链覆盖核心部件、本体制造、系统集成、配套服务等数十个细分领域,数字化产业分析工具正在成为地方招商、行业投研、供应链协同的核心刚需。作为国内率先推进数据要素市场化配置改革的先行省份,浙江省搭建的省级数据知识产权登记平台是当地开展数据权属确认、合规存证、流通交易的核心公共基础设施,本次登记也是国内机器人产业领域首份完成省级官方存证的产业链专用训练数据,对于产业类训练数据的确权流通具有典型示范意义。

火石创造本次完成登记的机器人产业链结构文本训练数据,核心定位为机器人产业链智能分类与图谱构建模型的专用训练语料,通过精准关联企业文本与产业标签,为全链路产业分析提供标准化的核心数据工具。其应用价值覆盖三大核心产业场景:一是支撑地方产业规划与靶向招商,可辅助政府及产业园区快速绘制本地机器人产业链全景图谱,精准识别产业链薄弱环节、卡脖子赛道,实现基于数据的精准招商、产业生态优化,大幅降低地方梳理产业家底的人力与时间成本;二是赋能产业投研与竞争格局洞察,为投资机构、行业研究机构提供统一的产业分类标签体系,可支持对伺服系统、控制器、减速器等机器人核心细分赛道开展快速、大规模的量化分析,实时掌握产业发展动向与竞争格局;三是驱动产业链供应链匹配协同,可接入各类产业服务平台、供应链管理系统,实现上游供应商智能推荐、潜在下游客户精准挖掘,有效降低产业链信息差,促进跨区域的产业资源协同。

为保障数据全链路合规性,本次登记的数据集在加工前已完成严格的匿名化与去标识化处理:原始企业名称被统一替换为不可逆的规范标识符,所有个人信息、商业敏感信息均被彻底移除,完全符合《数据安全法》《个人信息保护法》等法律法规要求,为后续模型训练提供了洁净、合规的输入基础。

本次数据集的加工严格遵循“体系先行、业务匹配、特征抽取”的核心原则,形成了一套可复制的标准化处理流程:1.参考国家行业标准与产业专家知识,预先搭建了从“机器人”一级节点到具体部件、产品、服务的四级树状分类体系,确保分类逻辑清晰、类目互斥且覆盖全面,为自动化处理提供了统一的结构化框架;2.采用“自动化规则匹配+人工校验”的双层处理策略,依托Spark大数据处理框架对海量企业简介文本开展分布式清洗、分词与关键词匹配,通过预构建的语义规则库自动推荐初步分类节点,再由专业标注团队对系统推荐结果开展全文语境审核与最终判定,确保每家企业的主营业务被精准归入对应产业链节点,保障标签的准确性与业务一致性;3.在完成业务匹配的同时,通过自动化流程从企业简介文本中系统性抽取代表其核心业务、技术能力的关键术语与名词性短语,经去重、标准化格式化后形成“正向词”特征串,作为分类标签的细粒度语义补充,为AI模型训练提供更丰富的学习特征。

加工完成的数据集为结构化的“文本-标签”配对数据,每条数据均包含脱敏后的企业描述文本,以及经人工校验的四级分类标签、产业标签与业务特征词,全面覆盖机器人全产业链核心环节,分类体系清晰、标注一致性高、特征维度明确,可直接用于产业链图谱构建、企业智能分类等AI模型的训练与评估。

本次数据知识产权登记的落地,也为我国战略性新兴产业训练数据的确权、流通提供了典型参考样本。作为产业AI模型训练的核心生产资料,合规、标准化的产业链训练数据此前普遍面临权属不清、流通壁垒高的问题,通过官方平台的知识产权登记,既明确了数据的权属归属,也为后续数据的合规交易、开放共享提供了合规基础,将进一步加快数据要素在产业数字化转型中的价值释放。

查看机器人产业链结构文本训练数据

登记内容:

机器人产业链结构文本训练数据登记证书

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们