five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

jae0311于HuggingFace发布多模态机器人专用数据集 为操作技能学习、模仿学习提供标准化训练支撑

五号数据雷达开源数据市场2026-05-14 23:597
贡献者jae0311近日在HuggingFace平台首发由LeRobot打造的serving_b4_20260514_200153数据集,该数据集覆盖机器人关节动作、本体状态、双视角视觉三类对齐数据,可广泛应用于各类具身智能机器人的技能训练场景。

近年来,随着具身智能产业进入落地攻坚期,模仿学习作为机器人快速习得操作技能的核心技术路径,对“动作-状态-视觉”多维度对齐的高质量训练数据集的需求持续攀升。不同于通用视觉或文本数据集,机器人操作类数据集对数据的时序同步性、参数匹配度要求极高,此前行业内可供开源使用的垂直场景数据集供给相对有限,一定程度上制约了中小团队、高校科研机构的具身智能技术研发效率。

近日,贡献者jae0311在全球最大的AI开源资源平台HuggingFace正式首发serving_b4_20260514_200153数据集,该数据集由LeRobot团队打造,专门面向机器人学研发任务设计,核心服务于机器人操作技能训练、模仿学习模型开发两大方向。

从数据构成来看,该数据集共包含20个完整操作序列(episodes),总计15058帧同步数据,结构化数据以parquet格式存储,视频数据以mp4格式存储,总大小约300MB,其中结构化数据文件100MB,视频文件200MB,轻量化的体积大幅降低了开发者的下载、训练门槛。数据集的特征维度完全匹配机器人模仿学习的端到端训练需求:6维动作数据完整对应omx_follower型机器人肩部平移、肩部提升、肘部弯曲、手腕弯曲、手腕旋转、夹爪位置的全关节运动参数;同步采集的6维观测状态数据与动作参数一一对应,可直接用于模型训练过程中的动作执行偏差校验;双路视觉数据覆盖顶部全局摄像头、手腕第一视角摄像头两路画面,分辨率为480x640、3通道、30fps、采用AV1编码,同时还原了操作场景的全局空间信息与末端执行器的近距离操作细节;除此之外,数据集还配套了时间戳、帧索引、episode索引、任务索引等完整元数据,所有维度数据实现毫秒级对齐,无需开发者额外进行标注、清洗工作即可直接用于训练。目前该数据集已完成训练集划分,覆盖episodes 0到20的全部序列。

从应用场景来看,该数据集可适配多类机器人研发需求:工业场景下可用于训练机械臂的分拣、装配、搬运等精细化操作技能,降低传统示教编程的人力成本;服务机器人场景下可支撑物品递送、桌面操作等日常功能的快速迭代;同时也适合高校、创业团队开展小型具身智能模型的研发、验证工作,为机器人操作算法的 benchmark 测试提供标准化的数据基底。

该数据集的发布进一步丰富了国内开源机器人训练数据的供给体系,也为后续更大规模机器人操作数据集的研发、标注提供了可参考的范式。

查看serving_b4_20260514_200153

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们