当前服务机器人在零售场景的落地进程中,末端柔性操作的算法精度不足是核心痛点之一,而面向具体场景的高质量标注训练数据稀缺,是制约算法迭代的核心瓶颈——不同于通用计算机视觉数据集,机器人操作数据集需要同时覆盖本体运动参数、多视角视觉信息、环境感知数据等多维度标注,采集与标注成本更高,行业供给长期不足。近日,机器人数据集研发机构nodogoro正式发布杂货装袋操作全周期数据集,为相关领域的研发提供了新的高质量数据选择。
nodogoro本次发布的数据集cell1_20260524_mohamed-salah_grocery_bagging_cycle_20260524_101034,基于LeRobot框架创建,专注于机器人技术任务开发,特别是针对starpilot_yam_gripper机器人类型优化。数据集包含5个episodes、1771帧和1个装袋核心任务,数据以parquet结构化文件和视频文件两类格式存储,其中结构化数据文件大小为100MB,视频文件大小为200MB,所有视频帧率为30fps。数据集的标注特征覆盖三大维度:一是动作类数据,包含机械臂的位置、旋转和抓取宽度等核心操作参数,可直接用于机械臂运动轨迹规划、力控策略的训练;二是观察状态数据,包含编码器角度、IMU加速度和陀螺仪数据、姿态和抓取器状态等本体感知信息,为机器人闭环控制算法的迭代提供了完整的标注支撑;三是多视角视觉数据,包含来自左腕、右腕和基础三个位置摄像头的RGB图像与深度图像,分辨率分别覆盖480x640和768x1024两个档位,多维度的视觉数据完美匹配视觉伺服控制的研发需求,可模拟人在执行装袋操作时的多视角感知逻辑。
该数据集的典型应用方向覆盖三大领域:一是零售场景服务机器人的自动化装袋功能研发,可直接用于无人收银、自助结算终端配套的装袋机器人算法训练,填补了该细分场景的标注数据空白;二是通用柔性操作机器人的迁移学习,针对分拣、包装、码垛等同类末端操作任务,研发团队可基于该数据集快速完成算法的预训练,降低研发成本;三是视觉伺服控制算法的基准验证,数据集同步匹配的多视角视觉数据与本体运动、感知标注,可作为算法精度、稳定性测试的标准化基准。
从数据要素市场发展的角度来看,垂直场景的专用训练数据是AI技术落地的核心生产资料,随着全球机器人产业规模的持续扩张,面向细分场景的机器人操作数据集的市场需求年增速超过40%。本次nodogoro发布的数据集,在降低中小研发团队数据获取门槛的同时,也为机器人操作类数据集的标注规范、采集标准提供了参考样本,对推动服务机器人在民生场景的规模化落地、完善人工智能训练数据要素供给体系均有积极意义。
查看cell1_20260524_mohamed-salah_grocery_bagging_cycle_20260524_101034





_1769672084863.jpg)