随着通用服务机器人、人形机器人商业化进程持续提速,模仿学习、示教学习已成为机器人快速习得通用操作技能的核心技术路径,但高质量、多模态、标注完备的细分场景操作训练数据供给不足,始终是制约机器人落地效率的核心痛点之一。近日,开发者jokeru正式对外发布机器人操作专用数据集record_p3_cups_merge,为相关领域的研发团队提供了标准化的训练数据源选择。
据了解,该数据集于2026年5月16日首次在HuggingFace平台上线,是国内为数不多面向杯子操作场景的专用机器人数据集,依托HuggingFace旗下开源机器人学习框架LeRobot构建而成,数据集共包含101个完整操作episodes,总计51059帧标注数据,可直接适配各类机器人操作任务的训练需求。
从数据结构来看,该数据集的标注维度覆盖机器人操作全链路需求:动作特征维度标注了7个关节位置和夹爪位置数据,可直接对齐机器人实体的控制指令,无需额外的标注转换;观测特征维度包含机器人状态数据与多视角图像视频数据,覆盖顶部、腕部、底部三个核心观测视角,可支撑机器人视觉感知、姿态判断、环境适配等多模块的训练需求;除此之外,数据集还配套了时间戳、帧索引、episode索引等完备的元数据,方便研发人员按需拆分、调用训练数据。存储层面,结构化数据采用Parquet格式存储,视频资源采用MP4格式存储,帧率为30fps,适配主流AI训练框架的读取需求。目前该数据集仅开放训练分割,采用商业友好的Apache-2.0许可证,开发者、科研机构与企业用户可免费使用、修改、二次分发数据集,无需额外授权。
从应用价值来看,该数据集可广泛应用于服务机器人端杯、移杯、物品堆叠等日常操作技能的模仿学习训练,也可用于机器人动作规划、力控适配、多视角感知融合等技术模块的效果验证,未来可延伸至餐饮服务、家庭陪护、办公助理等多个机器人落地场景的模型迭代,有效降低相关研发团队的自主数据采集成本,加快机器人操作技能的落地效率。





_1769672084863.jpg)