随着人形机器人、协作机器人赛道的快速落地,高质量标注的实操场景数据集,已经成为制约机器人控制算法、视觉感知模型迭代的核心瓶颈。不同于通用计算机视觉数据集,机器人学数据集需要同步覆盖运动状态、多视角视觉、时序关联等多维度信息,采集和标注成本极高,长期以来是中小研发团队、高校科研团队的核心准入门槛。
近日,开源贡献者juyoungggg于2026年5月23日在全球最大的开源AI模型与数据集社区HuggingFace正式发布0523_organize_Cup机器人学专用数据集,定向服务机械臂控制、机器人视觉感知领域的研发需求。
据悉,该数据集基于HuggingFace官方推出的机器人学习开源工具集LeRobot构建,共包含30个完整任务流程(episodes),累计12164帧标注数据,所有数据采用大数据领域通用的高效存储格式parquet保存,配套视频采用mp4格式、30fps帧率录制,完美匹配当前主流机器人算法训练的输入规范,无需额外格式转换即可快速调用。
从标注维度来看,数据集同时覆盖动作(action)与观察(observation)两类核心特征:其中动作维度由12个浮点数构成,精准对应左右机械臂肩部、肘部、腕部等核心关节的位置信息,可直接用于机械臂运动控制策略的训练;观察维度除了12个浮点数记录的关节实时状态之外,还包含左腕、右腕、右顶部三个视角的同步图像数据,单帧分辨率为480x640的3通道彩色画面,同时覆盖操作第一视角与全局视角,可支撑视觉定位、物体识别、端到端操作策略学习等多类视觉感知算法研发。此外,数据集还附带完整的时间戳、帧索引、episode索引、任务索引等元数据,支持训练集分割(train: 0:30),可直接用于强化学习、行为克隆等算法的时序轨迹对齐,大幅降低研发人员的数据预处理成本。该数据集总数据文件大小为100MB,视频文件大小为200MB,体积小巧便于下载传播,适合小团队快速开展算法验证实验。
从应用方向来看,该数据集可广泛覆盖多类机器人研发场景:工业场景下可用于3C电子装配、小件分拣、螺丝锁付等场景的双臂协作算法训练;服务场景下可支撑家庭服务机器人桌面整理、物品递送、餐具摆放等功能的模型研发;科研领域可作为基准数据集用于双臂人机共融、动态操作策略等前沿方向的研究,大幅降低相关研发的前期数据采集成本。
作为开源社区贡献的垂直领域高质量数据集,0523_organize_Cup的发布填补了双臂操作细分场景的小型基准数据集空白,对于完善机器人领域开源数据供给体系、降低行业研发门槛、推动数据要素在机器人产业的流通应用均有积极意义。





_1769672084863.jpg)