近年来,随着具身智能成为人工智能领域的核心落地方向之一,机器人操作学习、多模态感知控制相关技术研发进度不断加快,但覆盖机械臂控制指令、本体状态、多视角视觉等全链路的真实场景标注数据集仍然是行业稀缺资源,直接制约了相关算法的迭代效率与落地适配性。近日,机器人技术研发机构nodogoro正式对外发布全新双机械臂操作数据集,并于2026年5月24日率先上线全球最大的AI模型与数据集开源社区HuggingFace,为行业研发提供优质数据支撑。
据了解,本次发布的杂货包装操作多模态数据集(编号:cell1_20260523_mohammed_groceries_packing_20260523_225707)基于行业通用的LeRobot开源机器人研发平台构建,完整记录了starpilot_yam_gripper型号双机械臂执行杂货包装任务的全流程多模态数据,具体涵盖四大类数据维度:1)动作数据:包含两个机械臂的14维控制指令(位置、旋转和夹爪宽度),完整还原了机械臂操作的精确控制逻辑,可为模仿学习提供直接的动作标注;2)状态观测数据:包含两个机械臂的32维状态信息(编码器角度、IMU加速度和角速度、位姿、夹爪开合状态和距离),覆盖机械臂运行的全量本体参数,可用于感知算法与控制逻辑的联动验证;3)视觉观测数据:包含左腕摄像头、右腕摄像头和两个基座摄像头的RGB图像和深度图像,分辨率分别为480x640和768x1024,帧率为30fps,兼顾了操作细节观测与全局环境感知需求,适配多视角融合感知算法的训练需求;4)元数据:包括时间戳、帧索引、episode索引等,为数据集的分批次训练、时序分析提供了索引支撑。整个数据集共包含5个episodes、2881帧、1个任务,结构化数据以parquet格式存储,视频素材以mp4格式存储,兼顾了读取效率和兼容性,适用于机器人模仿学习、强化学习等研究。
从应用价值来看,该数据集可广泛用于机器人操作学习、多模态感知融合、动态环境控制等多个领域的研发工作:一方面可用于训练家政服务机器人、仓储分拣机器人完成杂货分类、易碎品包装、货箱码放等精细化操作任务,降低算法研发团队的真实场景数据采集成本;另一方面也可为多模态感知算法的验证、机械臂力控逻辑优化、仿真到真实场景的算法迁移提供标准化的测试基准。当前我国数据要素市场建设不断推进,面向垂直产业的优质AI训练数据集作为核心生产要素的价值持续凸显,本次针对细分操作场景的多模态数据集开源,将进一步推动具身智能领域的技术协同创新,加快相关商用场景的落地进度。
查看cell1_20260523_mohammed_groceries_packing_20260523_225707





_1769672084863.jpg)