近年,具身智能、服务与工业机器人赛道进入落地攻坚期,而覆盖真实物理场景、同步包含本体状态、视觉感知、动作标注的高质量标准化数据集,是制约机器人操作学习算法迭代、降低研发门槛的核心基础资源。近日,机器人技术研发机构nodogoro正式发布杂货打包场景专用机器人操作数据集cell1_20260523_mohammed_groceries_packing_20260523_222458,该数据集于2026年5月24日首发于全球知名AI开源社区HuggingFace,面向机器人操作学习、机械臂控制领域开放使用。
据介绍,该数据集属于真实场景下的专用机器人操作数据集,采用业界广泛应用的LeRobot工具完成标准化采集制作——作为专门面向机器人学习任务开发的数据集构建工具,LeRobot可实现机器人本体运行数据、多视角视觉数据、动作标注数据的同步采集与自动对齐,有效保障了数据集的标注精度与场景适配性。本次发布的数据集共包含5个完整杂货打包任务流程(episodes)、3186帧同步采集的全维度数据,所有采集流程均由starpilot_yam_gripper机器人执行真实杂货打包操作完成,最大程度还原了真实场景下的操作逻辑与环境变量。
从数据构成来看,该数据集覆盖了机器人操作学习所需的全维度数据类型:一是14维动作标注数据,涵盖两个机械臂的空间位置、旋转角度、夹爪开合宽度等核心控制参数,可直接用于机械臂精细动作控制模型的训练与效果验证;二是32维本体观测状态数据,包括关节编码器角度、IMU加速度与陀螺仪数据、机械臂实时姿态、夹爪运行状态等,可为算法提供机器人本体的全量状态感知信息,支撑控制逻辑的动态校准与鲁棒性优化;三是多视角多模态视觉观测数据,包括左腕、右腕相机的RGB视频与深度数据,以及基座相机的RGB视频,分辨率分别达到480x640和768x1024,能够完整还原操作场景的视觉信息与空间深度信息,支撑视觉感知与动作控制的端到端模型研发。所有数据均以30fps的帧率同步采集,并配套时间戳、帧索引、episode索引等完整元数据,方便研发人员按需调用与二次处理。
从应用价值来看,该数据集瞄准杂货打包这一兼具民用服务、商用仓储需求的通用场景,可支撑多个方向的机器人技术研发:在民用领域,可用于训练家用服务机器人的商品整理、食材分拣、日常储物等功能,加速服务机器人走进家庭场景的落地进程;在商用领域,可为仓储物流、零售快消场景的自动打包、拆码垛、订单分拣机械臂提供训练数据,降低相关场景的算法研发门槛;在基础研究领域,还可用于具身智能通用操作学习、跨场景动作迁移、多模态感知控制融合等方向的算法验证与效果评估。当前我国数据要素市场正处于快速发展阶段,AI训练数据作为核心的数字生产要素,其场景化、标准化供给能力的提升,对于加速AI技术从实验室走向落地场景、推动数字经济与实体经济融合发展具有重要意义。
查看cell1_20260523_mohammed_groceries_packing_20260523_222458





_1769672084863.jpg)