当前,具身智能产业正处于技术落地的关键窗口期,模仿学习作为机器人快速习得复杂操作技能的核心技术路径,高度依赖真实场景采集的高质量多模态标注数据集,但目前全球范围内面向细分机器人操作场景的公开训练数据供给仍存在较大缺口。近期,人工智能领域开发者dmowns正式发布专项机器人学数据集rollout_so101_pick_place_items_20260516_112348,该数据集基于HuggingFace旗下机器人学习开源工具栈LeRobot构建,专门针对机器人操作任务场景设计,首发于HuggingFace平台,为全球相关研发团队提供了新的高性价比训练数据选择。
该数据集共包含1个完整操作序列(episode),总计204帧同步采集数据,采集帧率为30fps。其数据特征覆盖多维度机器人运行信息:核心动作维度包含肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置共6维关节位置数据,同步的观测状态数据与动作维度完全对应,可直接用于算法训练的效果校验;除此之外,数据集还同步收录了机器人前部摄像头、腕部摄像头的双视角图像观测数据,视频采用AV1编码,分辨率为480x640、3通道、30fps,可满足视觉引导机器人操作算法的训练需求。配套元数据还包含干预标志(布尔值)、时间戳、帧索引、序列索引、任务索引等完整字段,可支撑不同研发场景的自定义数据筛选需求。
本次发布的数据集对应机器人型号为so_follower,结构化数据采用大数据领域通用的高效压缩格式parquet存储,视频文件采用通用mp4格式存储,总数据大小约300MB,其中结构化数据文件100MB,视频文件200MB,便于研发团队快速下载、部署使用,无需额外做复杂的数据格式转换。
从应用场景来看,该数据集可广泛适配机器人控制算法优化、模仿学习模型训练、强化学习效果验证等多个研发方向:在工业场景中可用于3C电子零部件分拣、柔性装配等抓取放置任务的算法训练,在服务机器人场景中可用于家居物品拾取、整理等操作技能的模仿学习,还可作为基准数据集用于相关机器人操作算法的效果横向对比。这类垂直细分场景的高质量公开数据集的持续涌现,将进一步降低具身智能领域的研发门槛,推动机器人操作技术的落地迭代,为数据要素支撑AI产业发展提供典型样本。
查看rollout_so101_pick_place_items_20260516_112348





_1769672084863.jpg)