five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

jokeru发布record_p3_cups_2机器人专用数据集 赋能多模态控制与模仿学习研发

五号数据雷达开源数据市场2026-05-16 23:579
开发者jokeru于2026年5月16日在HuggingFace首发record_p3_cups_2机器人专用数据集,该数据集基于LeRobot工具开发适配piper_follower型机器人,覆盖多视角视觉、关节动作等全链路标注数据,可为机器人模仿学习、多模态控制等研发场景提供高质量训练素材,降低行业研发门槛。

当前机器人智能化已进入落地攻坚期,模仿学习作为让机器人快速复现人类复杂操作的核心技术路径,对同时覆盖感知、动作、时序特征的多模态标注数据集需求持续攀升,但高质量、场景适配的开源数据集供给不足,一直是制约中小研发团队效率提升的核心痛点。近日,开发者jokeru正式发布面向机器人技术领域的专用数据集record_p3_cups_2,该数据集首发于全球最大的AI模型与数据集开源社区HuggingFace,瞄准机器人模仿学习、多模态机器人控制两大核心应用场景,为行业提供了新的高质量训练数据选择。

record_p3_cups_2基于HuggingFace旗下开源机器人学习工具栈LeRobot创建,专门适配piper_follower型机器人的训练需求。据公开参数显示,该数据集共包含70个训练片段,总计36442帧采样数据,采样帧率为30fps,完整覆盖机器人操作的时序动作特征。存储层面,结构化数据采用大数据领域通用的parquet列式存储格式,读写效率远高于传统文件格式,总结构化数据文件大小为100MB,配套原始视频文件大小为500MB,兼顾AI训练效率与数据可追溯性。

具体来看,数据集的标注特征覆盖机器人控制全链路维度:既包含动作数据(7个关节位置和夹爪位置)、观测状态数据(7个关节位置和夹爪位置)两类结构化控制数据,也包含来自顶部、腕部、底部三个摄像头视角的彩色图像观测数据,其中顶部摄像头分辨率为640x480,腕部和底部摄像头分辨率为480x640,多视角覆盖实现了全局环境感知、操作端近距离观测、底部盲区补全的全维度视觉采集,能够支撑多模态感知算法的交叉验证。此外数据集还配套了时间戳、帧索引、片段索引等元数据,方便研发人员按需拆分训练集、验证集,适配不同研发场景的调用需求。

从应用价值来看,该数据集可广泛应用于多类机器人研发场景:比如工业场景下的零部件分拣、装配机器人的示教模仿学习,家庭服务机器人的物品抓取、摆放操作训练,以及多模态感知-控制联动算法的效果验证等。值得注意的是,该数据集采用商业友好的Apache 2.0许可证,开发者可自由修改、分发甚至用于商业用途,将有效降低机器人领域中小研发团队的数据集采集与标注成本,助力机器人智能化技术的普惠发展,也为数据要素在人工智能细分赛道的开放共享提供了参考样本。

查看record_p3_cups_2

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们