随着具身智能产业进入商业化落地关键期,高质量、场景化的真实操作训练数据已成为机器人操作算法迭代的核心瓶颈。尤其是商超、家庭等民用场景的非结构化操作任务,涉及多模态感知、双臂协同、精细力度控制等多重需求,现有公开数据集的覆盖度仍存在明显缺口,制约了服务机器人场景泛化能力的提升。
近日,nodogoro正式发布cell1_20260523_mohammed_groceries_packing_20260523_213710数据集,该数据集由LeRobot创建,瞄准机器人杂货包装这一典型民用服务场景打造,可广泛应用于机器人学习相关研发任务。
本次发布的数据集基于starpilot_yam_gripper双臂机器人的杂货包装实操场景采集,共包含5个完整的操作流程片段,累计2883帧标注数据,采样率为30帧每秒,所有结构化数据以Parquet格式存储,总容量为100MB,同时配套总大小200MB的操作全流程h264编码视频素材。数据标注维度覆盖机器人操作全链路核心要素:包含14维动作向量,可完整还原两个机械臂的位置控制、旋转角度及夹爪宽度调节指令;32维观察状态数据,涵盖机器人编码器角度、IMU传感数据、实时姿态信息等核心运行参数;同时配套左腕摄像头、右腕摄像头、基座摄像头三个视角的RGB图像与深度图像素材,图像分辨率覆盖480x640、768x1024两种规格,可满足多模态感知算法的训练需求。数据集适用于训练机器人控制模型,支持强化学习或模仿学习任务。
从应用价值来看,该数据集可直接用于机器人控制模型训练,支持强化学习、模仿学习等主流技术路线的研发需求:一方面可作为模仿学习的训练基底,帮助算法复刻真实场景下的杂货包装操作逻辑,掌握不同形态、重量商品的摆放技巧、力度控制及包装效率优化方法;另一方面也可作为强化学习的仿真环境输入,降低机器人实操训练的硬件成本与试错风险。除此之外,该数据集还可支撑双臂协同控制算法验证、多模态感知融合模型训练、服务机器人场景泛化能力测试等多个方向的研发工作,未来可应用于商超自动包装机器人、家庭服务机器人物品整理功能、仓储理货机器人等多个民用场景的技术落地。
作为具身智能领域细分场景的高质量公开数据集,本次发布的杂货包装操作数据集进一步丰富了民用服务场景的机器人训练数据供给,对降低具身智能研发门槛、推动机器人操作技能从标准化工业场景向非结构化民用场景渗透具有重要意义,也为数据要素支撑人工智能产业落地提供了典型样本。
查看cell1_20260523_mohammed_groceries_packing_20260523_213710





_1769672084863.jpg)