当前人形机器人、工业协作机器人赛道正处于快速落地期,模仿学习作为机器人实现类人精细操作的核心技术路径,对实机采集的高质量标注数据集需求持续攀升。但由于多机械臂协同操作的场景搭建成本高、多模态数据同步标定流程复杂,面向乐高装配等细分操作场景的公开标准化数据集供给长期不足,成为制约中小研发团队技术迭代的核心瓶颈之一。针对这一行业痛点,机器人技术研发主体nodogoro近期正式发布专项双机械臂操控数据集,为相关领域研发提供核心数据支撑。
nodogoro本次发布的数据集cell1_20260516_youssef-mohamed_9pm-12pm_lego20260516_230001,是使用LeRobot框架创建的机器人操控数据集,专门针对starpilot_yam_gripper双机械臂系统采集生成。数据集包含2个完整的乐高搭建任务片段,总计5821帧同步采集的30fps数据,覆盖操控动作、状态传感、视觉观测三大类核心数据维度:14维动作空间完整记录了两个机械臂的末端位置、旋转角度和夹爪宽度的实时控制指令,可直接作为模仿学习模型的动作输出对标基准;32维状态观测空间覆盖两个机械臂的编码器角度、IMU加速度和角速度、末端位姿(位置和四元数)、夹爪开合状态和距离等全链路运行数据,为模型训练提供了完整的状态反馈依据;多视角视觉观测数据则包含左右手腕摄像头RGB图像(480x640)、左右手腕深度图像、基座两个摄像头RGB图像(其中一个为768x1024分辨率),可支撑视觉引导下的机器人操控算法研发,满足端到端多模态模型的训练需求。所有结构化数据以parquet格式存储,兼容性强可直接接入主流训练框架,总数据文件大小约100MB,配套视频文件约200MB,轻量化的存储设计大幅降低了开发者的获取和调试成本。
作为面向精细装配场景的专项数据集,其可广泛应用于多个典型研发场景:包括工业柔性装配场景下的双机械臂协同操控算法训练、服务机器人的精细物品操作模型开发、人机协作场景下的动作模仿与泛化性验证、机器人操控模型的仿真到实机迁移(Sim2Real)效果测试等,为机器人操作控制领域的技术迭代提供了标准化的基准数据支撑。此次该数据集首发上线HuggingFace开源社区,进一步丰富了机器人领域的公开训练数据供给,对于完善机器人领域的数据要素流通生态、降低通用机器人研发门槛、加速相关技术落地应用具有积极意义。
查看cell1_20260516_youssef-mohamed_9pm-12pm_lego20260516_230001





_1769672084863.jpg)