首页 / 开源数据市场 / 正文

nodogoro发布杂货打包场景双臂机器人操作数据集首发HuggingFace赋能多模态机器人精细操作训练

五号数据雷达开源数据市场2026-05-25 02:336

科技机构nodogoro近日发布由LeRobot打造的杂货打包场景双臂机器人专用操作数据集，该数据集于2026年5月24日首发上线HuggingFace，覆盖多维度动作、状态、视觉标注数据，可支撑机器人精细操作模仿、视觉-运动控制等研发需求，助力具身智能领域算法迭代落地。

近年来，具身智能、多模态机器人已成为AI产业落地的核心赛道，而面向生活化非结构化场景的高标注多模态训练数据，一直是制约机器人精细操作算法迭代的核心瓶颈——尤其是涉及双臂协作、视觉感知与力控结合的民用操作场景，现有公开数据集的覆盖度、标注精度普遍难以满足研发需求。近日，科技机构nodogoro正式发布由LeRobot创建的杂货打包场景专用双臂机器人操作数据集cell1_20260523_mohammed_groceries_packing_20260523_214749，主要面向机器人精细操作、多模态机器人学习两大核心领域提供训练支撑。

据披露，该数据集是专门针对starpilot_yam_gripper型号双臂机器人操作任务开发的训练数据集，共包含5个完整训练片段，总帧数达3477帧，采样帧率为30fps，覆盖了杂货打包全流程的操作动作、状态反馈、多视角视觉感知等全链路数据。其标注特征维度包括三大类：第一类是14维动作向量，可精准对应两个机械臂末端执行器的x/y/z轴位置、rx/ry/rz轴旋转参数以及夹爪开合宽度控制指令；第二类是32维状态观测数据，涵盖两个机械臂的编码器角度、IMU加速度与角速度、位姿参数（位置+四元数）以及夹爪开合状态、开合距离等运行时动态数据；第三类是多视角视觉观测数据，包含左右腕部摄像头采集的480x640分辨率RGB图像与深度图像，以及两个基座摄像头分别采集的480x640、768x1024分辨率RGB图像，可完整还原操作场景的全局与局部视觉信息。此外，数据集还配套了时间戳、帧索引、片段索引、任务索引等全量元数据，方便研发人员快速筛选、调用对应场景的训练数据。

从应用方向来看，该数据集可为多类机器人学习任务提供训练支撑：一是动作模仿学习方向，可用于训练双臂机器人的物品拾取、分类摆放、打包封装等生活化操作技能，未来可落地到家用服务机器人的家务整理、线下零售门店的订单自动打包、仓储物流的货品分拣码放等场景；二是强化学习方向，依托多维度的状态反馈数据，可训练机器人在非结构化场景下的动态操作调整能力，尤其是针对异形、易碎物品的安全操作策略；三是视觉-运动控制方向，配套的多视角视觉+动作标注数据，可支撑多模态机器人的“感知-决策-执行”全链路算法迭代，降低机器人在复杂场景下的操作误差率。

业内普遍认为，专用场景的高质量标注数据集是具身智能落地的核心“生产资料”，此前公开领域面向民用生活化操作场景的双臂机器人数据集较少，本次nodogoro发布的数据集填补了杂货打包细分场景的训练数据空白，对于降低机器人研发企业的训练数据采集成本、加快民生领域服务机器人的商业化落地进程，都具有正向推动作用，也符合当前数据要素向垂直行业赋能、支撑数字经济核心产业创新的发展趋势。

查看cell1_20260523_mohammed_groceries_packing_20260523_214749

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

nodogoro发布杂货打包场景双臂机器人操作数据集 首发HuggingFace赋能多模态机器人精细操作训练

Dataset card内容：

Files and versions内容：

社区讨论

nodogoro发布杂货打包场景双臂机器人操作数据集首发HuggingFace赋能多模态机器人精细操作训练