five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

具身智能产业链结构文本训练数据在浙完成知识产权登记 支撑多场景产业数字化应用

五号数据雷达数据知识产权登记2026-05-30 04:492
2026年5月29日,火石创造科技有限公司旗下具身智能产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记,该合规脱敏的结构化训练数据集可覆盖产业治理、投资研究、供应链寻源等多元场景,为具身智能产业的数字化分析与决策提供核心数据支撑。

当前,具身智能已成为全球先进制造业布局的核心赛道,产业链上游核心零部件的国产化突破、供应链安全建设是产业发展的核心命题,而高质量、合规可用的产业训练数据是推动具身智能产业链数字化分析、AI辅助决策的核心基础。作为国内数据要素市场化配置改革的先行省份,浙江搭建的省级数据知识产权登记平台,承担着数据资产存证、权属确认、流通溯源等核心职能,是保障数据合规流通、激活数据要素价值的重要公共基础设施。

2026年5月29日,火石创造科技有限公司研发的具身智能产业链结构文本训练数据正式在该平台完成知识产权登记,成为国内首个获得省级官方确权的具身智能领域专用训练数据集,可广泛应用于产业链图谱构建、核心部件识别等领域。据介绍,该数据集专为具身智能产业链智能分类与核心部件图谱构建模型的训练与开发打造,通过关联企业文本与核心零部件标签,为机器人及智能装备产业的全链条参与者提供标准化数据工具。

为保障数据安全合规,数据集在加工前已完成全量匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,所有个人及商业敏感信息被彻底移除,完全符合《数据安全法》《个人信息保护法》等相关法律法规要求,为后续模型训练与数据流通扫清了合规障碍。

本次数据集的加工严格遵循“体系先行、业务匹配、特征抽取”的核心原则,形成了全流程标准化的处理逻辑:首先依托机器人及智能装备产业的技术分工体系,搭建了以“具身智能”为一级节点,向下细分至产业链上游核心基础支撑、硬件、执行器与驱动系统、传感器,直至旋转关节、线性关节、机器人传感器等五级节点的精细化树状分类体系,完全适配国内具身智能产业的技术分工现状。其次采用“自动化规则匹配+人工校验”的标注模式,先通过Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,依托预构建的具身智能产业语义规则库推荐初步分类节点,再由具备机器人、自动化产业专业背景的标注专家进行审核判定,确保企业分类的精准性。最后同步从企业文本中抽取核心产品、技术相关的关键术语,经去重、标准化后形成“正向词”特征串与产业标签,作为分类标签的语义补充,进一步提升数据集的标注颗粒度。

加工完成后的数据集为标准化的“文本-标签”结构化数据,每条数据均包含脱敏后的企业描述文本、经人工校验的五级分类标签、产品特征词与产业标签,全面覆盖具身智能上游核心零部件的所有关键赛道,可直接用于具身智能产业链分析、核心技术企业识别、零部件国产化率研究等模型的训练与评估。

从实际应用来看,该数据集的价值覆盖产业全链路参与方:在政府与产业规划端,可辅助绘制具身智能上游伺服系统、减速器、控制器、传感器等核心零部件的企业分布地图,精准识别关键技术领域的国产化程度与区域集聚效应,为产业政策制定、招商布局、集群建设提供数据支撑;在投资与研究端,可帮助投资机构、研究机构分析谐波减速机、行星减速机、伺服驱动、3D视觉传感器等不同技术路线的研发动态、市场竞争格局,挖掘优质投资标的;在产业端,可赋能机器人整机制造商、系统集成商精准匹配旋转关节、线性关节、智能传感器等核心零部件的优质供应商,优化供应链安全体系,加快国产替代进程。

查看具身智能产业链结构文本训练数据

登记内容:

业内人士指出,本次具身智能产业链训练数据的成功登记,不仅填补了国内具身智能领域标准化训练数据的知识产权存证空白,也为产业类商用数据的合规确权与流通提供了可参考的实践样本,对推动数据要素与先进制造业深度融合,加快全国数据要素市场建设具有重要的示范意义。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们