five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

jokeru发布多模态机器人操作数据集record_p3_cups_merge 支撑模仿学习、操作训练核心研发需求

五号数据雷达开源数据市场2026-05-17 00:2210
开发者jokeru于2026年5月16日在HuggingFace首发多模态机器人操作数据集record_p3_cups_merge,该数据集依托LeRobot开源框架构建,包含完备的动作标注与多视角观测数据,可直接服务于机器人操作学习、模仿学习领域的模型训练,有效降低相关技术研发的数据集构建成本。

随着通用服务机器人、人形机器人商业化进程持续提速,模仿学习、示教学习已成为机器人快速习得通用操作技能的核心技术路径,但高质量、多模态、标注完备的细分场景操作训练数据供给不足,始终是制约机器人落地效率的核心痛点之一。近日,开发者jokeru正式对外发布机器人操作专用数据集record_p3_cups_merge,为相关领域的研发团队提供了标准化的训练数据源选择。

据了解,该数据集于2026年5月16日首次在HuggingFace平台上线,是国内为数不多面向杯子操作场景的专用机器人数据集,依托HuggingFace旗下开源机器人学习框架LeRobot构建而成,数据集共包含101个完整操作episodes,总计51059帧标注数据,可直接适配各类机器人操作任务的训练需求。

从数据结构来看,该数据集的标注维度覆盖机器人操作全链路需求:动作特征维度标注了7个关节位置和夹爪位置数据,可直接对齐机器人实体的控制指令,无需额外的标注转换;观测特征维度包含机器人状态数据与多视角图像视频数据,覆盖顶部、腕部、底部三个核心观测视角,可支撑机器人视觉感知、姿态判断、环境适配等多模块的训练需求;除此之外,数据集还配套了时间戳、帧索引、episode索引等完备的元数据,方便研发人员按需拆分、调用训练数据。存储层面,结构化数据采用Parquet格式存储,视频资源采用MP4格式存储,帧率为30fps,适配主流AI训练框架的读取需求。目前该数据集仅开放训练分割,采用商业友好的Apache-2.0许可证,开发者、科研机构与企业用户可免费使用、修改、二次分发数据集,无需额外授权。

从应用价值来看,该数据集可广泛应用于服务机器人端杯、移杯、物品堆叠等日常操作技能的模仿学习训练,也可用于机器人动作规划、力控适配、多视角感知融合等技术模块的效果验证,未来可延伸至餐饮服务、家庭陪护、办公助理等多个机器人落地场景的模型迭代,有效降低相关研发团队的自主数据采集成本,加快机器人操作技能的落地效率。

查看record_p3_cups_merge

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们