首页 / 开源数据市场 / 正文

jokeru发布多模态机器人操作数据集record_p3_cups_merge 支撑模仿学习、操作训练核心研发需求

五号数据雷达开源数据市场2026-05-17 00:2210

开发者jokeru于2026年5月16日在HuggingFace首发多模态机器人操作数据集record_p3_cups_merge，该数据集依托LeRobot开源框架构建，包含完备的动作标注与多视角观测数据，可直接服务于机器人操作学习、模仿学习领域的模型训练，有效降低相关技术研发的数据集构建成本。

随着通用服务机器人、人形机器人商业化进程持续提速，模仿学习、示教学习已成为机器人快速习得通用操作技能的核心技术路径，但高质量、多模态、标注完备的细分场景操作训练数据供给不足，始终是制约机器人落地效率的核心痛点之一。近日，开发者jokeru正式对外发布机器人操作专用数据集record_p3_cups_merge，为相关领域的研发团队提供了标准化的训练数据源选择。

据了解，该数据集于2026年5月16日首次在HuggingFace平台上线，是国内为数不多面向杯子操作场景的专用机器人数据集，依托HuggingFace旗下开源机器人学习框架LeRobot构建而成，数据集共包含101个完整操作episodes，总计51059帧标注数据，可直接适配各类机器人操作任务的训练需求。

从数据结构来看，该数据集的标注维度覆盖机器人操作全链路需求：动作特征维度标注了7个关节位置和夹爪位置数据，可直接对齐机器人实体的控制指令，无需额外的标注转换；观测特征维度包含机器人状态数据与多视角图像视频数据，覆盖顶部、腕部、底部三个核心观测视角，可支撑机器人视觉感知、姿态判断、环境适配等多模块的训练需求；除此之外，数据集还配套了时间戳、帧索引、episode索引等完备的元数据，方便研发人员按需拆分、调用训练数据。存储层面，结构化数据采用Parquet格式存储，视频资源采用MP4格式存储，帧率为30fps，适配主流AI训练框架的读取需求。目前该数据集仅开放训练分割，采用商业友好的Apache-2.0许可证，开发者、科研机构与企业用户可免费使用、修改、二次分发数据集，无需额外授权。

从应用价值来看，该数据集可广泛应用于服务机器人端杯、移杯、物品堆叠等日常操作技能的模仿学习训练，也可用于机器人动作规划、力控适配、多视角感知融合等技术模块的效果验证，未来可延伸至餐饮服务、家庭陪护、办公助理等多个机器人落地场景的模型迭代，有效降低相关研发团队的自主数据采集成本，加快机器人操作技能的落地效率。

查看record_p3_cups_merge

Dataset card内容：

Files and versions内容：

社区讨论

近期热门