当前,随着人形机器人、工业协作机器人赛道商业化进程提速,机器人操作算法的训练迭代对高质量实采数据集的需求持续攀升。相较于仿真生成数据,真实环境下采集的、覆盖动作、姿态、视觉多维度标注的机器人学数据集,能够显著提升算法的泛化能力,降低落地过程中的现实适配成本,是当前机器人研发领域的核心刚需资源。
近日,机器人技术研发机构nodogoro正式发布cell1_20260518_mohamehossam_sorting20260518_185902数据集,该数据集是使用LeRobot创建的机器人学数据集,专门针对双机械臂操作任务场景设计,已率先上线HuggingFace面向全球研发团队开放。
据公开信息显示,该数据集包含6个完整的情节(episodes),总计3446帧数据,覆盖1个具体操作任务。数据以parquet文件格式存储,视频文件为MP4格式,帧率为30fps,能够适配主流机器人算法训练框架的接入需求。数据集的特征维度覆盖全链路操作数据:动作数据为14维浮点数,可对应控制两个机械臂的x、y、z位置、rx、ry、rz旋转以及抓取宽度;观察状态数据为32维浮点数,包括机械臂的编码器角度、IMU加速度和角速度、姿态位置和四元数、抓取器开合状态和距离;同时还包含来自多个摄像头的图像观察数据:左腕部0号摄像头RGB图像和深度图像、右腕部0号摄像头RGB图像和深度图像、基座0号摄像头RGB图像、基座1号摄像头RGB图像(分辨率分别为480x640和768x1024)。此外,数据集还配套了时间戳、帧索引、情节索引、全局索引和任务索引等元数据,方便研发团队按需调用。
从应用价值来看,该数据集可广泛支撑多个机器人研发方向的研究工作:在工业双臂协作场景中,相关算法团队可基于该数据集训练分拣、精密装配等任务的模仿学习模型,提升机器人操作的精准度与协作效率;在服务机器人领域,数据集覆盖的抓取动作全维度标注可支撑家用机器人物品摆放、杂物整理等功能的算法迭代;此外,该数据集同时包含动作、姿态、多视角视觉的同步标注,也可为强化学习算法提供真实环境基准测试依据,大幅降低中小研发团队的原始数据采集成本。目前该数据集已适用于机器人控制、模仿学习或强化学习等多个研究方向。
查看cell1_20260518_mohamehossam_sorting20260518_185902





_1769672084863.jpg)