当前,人形机器人、工业协作机器人赛道进入高速落地期,高质量、场景匹配的标注数据集已成为机器人算法迭代的核心生产要素。其中面向特定机器人架构的多模态同步数据集供给严重不足,大量研发团队需要投入较高成本自行完成数据采集、标注与治理,极大拉长了研发周期。2026年5月11日,rol09正式在HuggingFace平台首发ex2-fixed机器人学专用数据集,为细分领域的机器人研发提供标准化的数据支撑。
据介绍,ex2-fixed是基于开源机器人数据集构建工具LeRobot创建的垂直品类数据集,专门适配so_follower类型的机器人。本次公开的数据集包含108个训练片段(episodes),总计41307帧有效数据,覆盖5类典型机器人操作任务,数据采用parquet格式存储,总结构化数据体量为100MB,配套的视频数据体量为200MB,采样帧率为30fps,所有数据目前仅开放训练集,暂未划分验证集与测试集。
该数据集的标注维度覆盖机器人研发的核心需求,包含四大类核心特征:一是机器人动作参数,覆盖肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置共6个核心关节的位置数据;二是机器人观测状态数据,同步匹配6个关节的实时状态参数;三是夹爪第一视角图像数据,以AV1编码的视频形式提供,分辨率为640x480,采用RGB三通道采集,可直接用于视觉相关算法训练;四是全链路索引数据,包含时间戳、帧索引、episode索引、任务索引、episode标签等维度,方便研发人员按需调取特定场景的数据片段。
从应用价值来看,ex2-fixed数据集可广泛应用于机器人手臂控制、视觉伺服操作两大核心领域:在机械臂控制方向,研发团队可基于标准化的关节数据训练轨迹规划、柔顺控制、动作模仿等算法,覆盖工业分拣、精密装配、物料搬运等典型场景的机器人功能开发,降低自有数据采集的成本投入;在视觉伺服操作方向,同步对齐的第一视角视频与关节数据可支撑跨模态算法训练,解决视觉感知与机械动作的对齐问题,助力动态目标抓取、高精度操作等复杂功能的落地。该数据集的发布也为垂直领域机器人数据集的标准化建设提供了参考样本,进一步丰富了我国机器人产业的数据要素供给体系。





_1769672084863.jpg)