近年具身智能已成为全球人工智能领域的核心赛道之一,机器人通用操作能力的迭代高度依赖高标注质量、多维度匹配的真实场景训练数据,但长期以来,训练数据的知识产权归属模糊、采集标准不统一、跨主体流通无合规依据等问题,始终制约着行业的研发效率与数据要素价值释放。作为全国数据要素市场化配置改革的先行试点,北京市搭建的数据知识产权登记体系,可为市场主体的数据资产提供权益存证、流通溯源、合规支撑等核心服务,是国内数据知识产权制度落地的重要实践载体。2026年4月30日,睿源机器人(北京)有限公司旗下的机器人基础技能多模态数据集正式完成北京市数据知识产权登记,成为国内具身智能赛道为数不多的拥有明确知识产权归属的公开训练类数据资产。
本次完成登记的机器人基础技能多模态数据集,专门针对具身智能机器人系统基础操作技能的学习与模型训练场景打造,适配具备机械臂及二指夹爪等末端执行器的通用操作型机器人平台,覆盖视觉、关节状态、末端执行器状态等多模态数据的同步采集标准,可满足机器人基础动作精准控制与技能泛化的训练需求。不同于行业普遍使用的仿真生成数据集,该数据集全部来自真实机器人在标准操作环境中对各类形态物体连续操作过程的一手采集,有效规避了仿真数据与真实物理场景的偏差问题,能够支撑算法模型训练出泛化性更强的基础操作策略。
从应用范围来看,该数据集可广泛用于具身大模型基础技能模块训练、视觉—动作映射基础策略学习、机器人抓取与操作基础能力优化及跨场景技能迁移算法研究等核心研发环节,服务对象覆盖机器人本体厂商、具身智能算法企业、机器人通用能力研发机构及相关科研院所等全产业链主体。在实际研发中,该数据集可支撑机器人抓取、放置、推拉、翻转、开合容器及物体堆叠等核心基础操作技能的学习与策略优化,还可延伸应用于工业场景的3C产品组装、零部件分拣、物流拆码垛,服务场景的家用物品整理、公共服务物品递送等多类机器人技能的研发,有效降低相关主体的训练数据采集成本,提升机器人在不同场景下的技能复用能力与动作精确性。
本次数据集的成功登记,不仅为睿源机器人的核心数据资产提供了明确的知识产权保护,降低后续数据授权、流通、作价等环节的权益纠纷风险,也为国内人工智能训练类数据集的确权登记提供了可参考的实践样本,对于推动AI训练数据要素的规范化流通、加速具身智能产业的技术迭代具有重要的示范意义。





_1769672084863.jpg)