当前,工业协作机器人、服务机器人的落地进程不断加快,而物体抓取作为机器人完成装配、分拣、搬运等绝大多数作业的基础能力,其算法研发高度依赖高质量的场景化训练数据。其中模仿学习路径通过复刻人类操作的标注数据训练机器人,可大幅降低算法研发门槛、提升场景适配效率,是当前机器人领域的主流技术方向,但垂直场景的标注数据集缺口始终是行业共性痛点。
近日,数据提供方igaryo正式发布rollout_dagger_pick_masking_tape_20260509_184603机器人专用数据集,该数据集由LeRobot团队创建,于2026年5月9日首发于全球知名AI开源社区HuggingFace,定向服务机器人模仿学习、物体抓取两大核心研发场景。
本次公开的数据集维度覆盖机器人研发的全链路训练需求:动作维度包含7个关节位置和夹爪位置的精准标注,可直接作为算法动作输出的对标基准;观察状态同步采集7个关节位置和夹爪位置数据,可支撑强化学习框架下的实时状态反馈训练;同时包含机器人头部、腕部双视角采集的720x1280分辨率、30fps视频数据,真实还原抓取作业时的第一视角视觉输入环境,研发团队无需额外搭建采集环境即可获取标准化的视觉训练素材;配套的干预标记、时间戳、帧索引、episode索引、任务索引等字段,可帮助研发人员快速筛选有效训练片段,大幅降低数据预处理的人力成本。数据集共包含1个完整任务episode、2003帧有效数据,采用parquet结构化数据+mp4视频的组合存储格式,适配dk1_follower型机器人的研发测试需求。
作为聚焦抓取场景的专用数据集,其可覆盖多个典型研发应用方向:一是工业精密作业场景的算法训练,例如3C制造生产线的胶带自动粘贴工位、包装环节的胶带自动裁剪抓取作业等细分场景的机器人算法训练,可直接复用该数据集的标注特征快速迭代模型;二是模仿学习框架的优化测试,研发人员可基于数据集内置的人机交互干预标记,优化DAgger(数据集聚合)算法的样本采集效率,进一步降低人工示范的成本;三是多模态机器人感知系统的验证,结合同步的关节状态数据与双视角视觉数据,可测试机器人视觉感知与动作控制的协同准确率,提升复杂场景下的抓取作业成功率。
当前数据要素已成为人工智能领域的核心生产资料,面向垂直场景的高质量标注数据集,是破解机器人落地“场景适配难”问题的关键支撑。本次数据集的开放,为工业机器人细分场景的算法研发提供了低成本的标准化训练素材,也进一步完善了全球机器人领域的开放数据生态,对推动机器人抓取技术的落地普及具有积极意义。
查看rollout_dagger_pick_masking_tape_20260509_184603





_1769672084863.jpg)