首页 / 开源数据市场 / 正文

nodogoro发布杂货分拣场景机器人专用训练数据集首发HuggingFace 赋能操作控制与视觉感知研发

五号数据雷达开源数据市场2026-05-25 00:447

AI机器人技术厂商nodogoro于2026年5月24日在HuggingFace首发杂货分拣场景专用机器人学习数据集，该数据集基于LeRobot框架打造，涵盖多传感器融合的标注数据，可为机器人操作控制、视觉感知、强化学习等方向的研发提供高质量场景化数据支撑。

随着具身智能与服务机器人赛道的快速爆发，场景化、多维度标注的实采训练数据集已经成为制约机器人精细操作能力落地的核心瓶颈之一。此前行业内公开的机器人操作类数据集多集中于工业场景，针对家用、零售等非结构化场景的高质量开源数据集供给长期不足，且普遍存在传感器维度单一、标注颗粒度较粗等问题，难以支撑算法的快速迭代。

近日，AI机器人技术厂商nodogoro正式发布cell1_20260523_mohammed_groceries_packing_20260523_211332专用机器人学习数据集，该产品于2026年5月24日首发于全球知名AI开源社区HuggingFace，面向全球研发人员开放使用。

据了解，本次发布的数据集基于LeRobot开源机器人学习框架创建，专门针对机器人杂货打包分拣的典型任务场景设计，共包含5个完整任务流程的episodes，总计2629帧标注数据，其中结构化数据文件大小为100MB，配套同步采集的视频文件大小为200MB，采集帧率为30fps，采用Apache 2.0开源许可证，支持商业与非商业场景的二次开发，大幅降低了中小研发团队、学术机构的数据集获取门槛。

从数据构成来看，本次发布的数据集覆盖了机器人操作全流程的多维度数据维度：其一为动作数据，完整记录了机械臂实时位置、旋转角度、抓取宽度等核心操作参数，是训练机器人精细动作控制能力的核心标注维度；其二为观测数据，涵盖编码器角度、IMU传感器数据、整机姿态信息、抓取器运行状态等多类本体传感数据，可为机器人运动控制算法的研发提供多维度的本体状态参考；其三为多源视觉数据，覆盖左腕、右腕、基座三个核心采集位置的摄像头，同时提供RGB彩色图像与深度图像两类数据，完整还原操作场景的三维视觉信息，为视觉感知算法的训练提供了贴近真实运行环境的数据源。所有结构化数据采用parquet格式存储，视频文件采用通用MP4格式，适配当前绝大多数主流AI训练框架，研发人员可直接调用无需额外进行格式转换。

从应用方向来看，该数据集可广泛适用于机器人控制、视觉感知、强化学习等多个研发领域：在服务机器人场景，可用于家用服务机器人储物整理、物品分拣功能的算法训练，提升机器人在非结构化家居环境下的操作适配性；在零售场景，可用于前置仓、商超末端自动打包工作站的算法迭代，替代人工完成订单打包流程，提升零售履约效率；在通用具身智能领域，可作为场景化训练数据支撑人形机器人操作技能的泛化训练，也可用于多模态具身大模型的操作类指令响应能力训练，加速通用人工智能在实体机器人领域的落地。

查看cell1_20260523_mohammed_groceries_packing_20260523_211332

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

nodogoro发布杂货分拣场景机器人专用训练数据集 首发HuggingFace 赋能操作控制与视觉感知研发

Dataset card内容：

Files and versions内容：

社区讨论

nodogoro发布杂货分拣场景机器人专用训练数据集首发HuggingFace 赋能操作控制与视觉感知研发