首页 / 开源数据市场 / 正文

jokeru发布record_p3_cups_2机器人专用数据集赋能多模态控制与模仿学习研发

五号数据雷达开源数据市场2026-05-16 23:579

开发者jokeru于2026年5月16日在HuggingFace首发record_p3_cups_2机器人专用数据集，该数据集基于LeRobot工具开发适配piper_follower型机器人，覆盖多视角视觉、关节动作等全链路标注数据，可为机器人模仿学习、多模态控制等研发场景提供高质量训练素材，降低行业研发门槛。

当前机器人智能化已进入落地攻坚期，模仿学习作为让机器人快速复现人类复杂操作的核心技术路径，对同时覆盖感知、动作、时序特征的多模态标注数据集需求持续攀升，但高质量、场景适配的开源数据集供给不足，一直是制约中小研发团队效率提升的核心痛点。近日，开发者jokeru正式发布面向机器人技术领域的专用数据集record_p3_cups_2，该数据集首发于全球最大的AI模型与数据集开源社区HuggingFace，瞄准机器人模仿学习、多模态机器人控制两大核心应用场景，为行业提供了新的高质量训练数据选择。

record_p3_cups_2基于HuggingFace旗下开源机器人学习工具栈LeRobot创建，专门适配piper_follower型机器人的训练需求。据公开参数显示，该数据集共包含70个训练片段，总计36442帧采样数据，采样帧率为30fps，完整覆盖机器人操作的时序动作特征。存储层面，结构化数据采用大数据领域通用的parquet列式存储格式，读写效率远高于传统文件格式，总结构化数据文件大小为100MB，配套原始视频文件大小为500MB，兼顾AI训练效率与数据可追溯性。

具体来看，数据集的标注特征覆盖机器人控制全链路维度：既包含动作数据（7个关节位置和夹爪位置）、观测状态数据（7个关节位置和夹爪位置）两类结构化控制数据，也包含来自顶部、腕部、底部三个摄像头视角的彩色图像观测数据，其中顶部摄像头分辨率为640x480，腕部和底部摄像头分辨率为480x640，多视角覆盖实现了全局环境感知、操作端近距离观测、底部盲区补全的全维度视觉采集，能够支撑多模态感知算法的交叉验证。此外数据集还配套了时间戳、帧索引、片段索引等元数据，方便研发人员按需拆分训练集、验证集，适配不同研发场景的调用需求。

从应用价值来看，该数据集可广泛应用于多类机器人研发场景：比如工业场景下的零部件分拣、装配机器人的示教模仿学习，家庭服务机器人的物品抓取、摆放操作训练，以及多模态感知-控制联动算法的效果验证等。值得注意的是，该数据集采用商业友好的Apache 2.0许可证，开发者可自由修改、分发甚至用于商业用途，将有效降低机器人领域中小研发团队的数据集采集与标注成本，助力机器人智能化技术的普惠发展，也为数据要素在人工智能细分赛道的开放共享提供了参考样本。

查看record_p3_cups_2

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

jokeru发布record_p3_cups_2机器人专用数据集 赋能多模态控制与模仿学习研发

Dataset card内容：

Files and versions内容：

社区讨论

jokeru发布record_p3_cups_2机器人专用数据集赋能多模态控制与模仿学习研发