当前服务机器人、人形机器人赛道正处于落地关键期,而细分非结构化场景的高质量标注训练数据缺口,已成为制约机器人精细操作能力迭代的核心瓶颈:尤其是杂货包装这类涉及多品类物品、复杂力控需求的民用高频场景,此前行业内可复用的标准化多模态数据集供给十分有限,大量研发团队需要自行投入成本完成数据采集与标注,大幅拉高了研发门槛。
近日,机器人技术厂商nodogoro正式发布杂货包装场景专用机器人操作数据集cell1_20260523_mohammed_groceries_packing_20260523_220607,该数据集于2026年5月24日首发上线HuggingFace,采用Apache 2.0开源许可证,可供全球研发团队免费使用、修改甚至商用,大幅降低了相关方向的研发成本。
作为专门面向机器人操作任务打造的专业数据集,本次发布的数据集基于机器人领域主流开源工具LeRobot构建,共包含5个完整的杂货包装操作情节(episodes),总计3669帧标注数据,覆盖完整的单任务操作全流程。从数据结构来看,该数据集实现了动作、状态、视觉三类核心数据的同步标注:首先是14维浮点数组组成的动作数据,完整记录两个机械臂的位置、旋转角度和夹爪宽度参数,可直接用于训练机械臂的运动控制、力控调节模型;其次是32维浮点数组组成的观测状态数据,包含编码器角度、IMU测量值、位姿和夹爪状态等机器人核心运行参数,可支撑机器人状态校准、运动误差修正相关研发;视觉感知层面则同步采集了左腕、右腕和基座三个位置的多摄像头数据,同时提供RGB和深度视频,分辨率覆盖480x640到768x1024多个档位,帧率为30fps,最大程度还原真实操作场景下的视觉输入特征。此外,数据集采用Parquet列式存储格式,配套完整的时间戳、帧索引、情节索引等元数据,适配主流AI训练框架的快速读取需求,可直接适配starpilot_yam_gripper型号机器人的相关研发。
从应用方向来看,该数据集可广泛用于机器人控制、视觉导航和强化学习等多个领域的研发工作:在商超服务场景,可用于训练自动包装机器人对软袋、纸盒、易碎容器等不同材质、形状商品的识别与安全抓取;在家庭服务场景,可支撑服务机器人完成物品整理、食材收纳等操作的模型训练;在仓储物流场景,可用于拆零拣选环节的货物包装机器人的视觉导航、无碰撞路径规划研发;同时其标准化的多模态标注结构,也可作为基准数据集用于不同机器人控制算法的效果横向验证。
当前数据要素已成为机器人与通用人工智能领域的核心生产资料,这类细分场景高质量标注数据集的开源供给,能够大幅降低研发团队的原始数据采集、标注成本,缩短模型迭代周期,进一步推动服务机器人从结构化工业场景向非结构化民用场景的落地渗透。
查看cell1_20260523_mohammed_groceries_packing_20260523_220607





_1769672084863.jpg)