five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

nodogoro发布杂货打包场景双臂机器人操作数据集 首发HuggingFace赋能多模态机器人精细操作训练

五号数据雷达开源数据市场2026-05-25 02:336
科技机构nodogoro近日发布由LeRobot打造的杂货打包场景双臂机器人专用操作数据集,该数据集于2026年5月24日首发上线HuggingFace,覆盖多维度动作、状态、视觉标注数据,可支撑机器人精细操作模仿、视觉-运动控制等研发需求,助力具身智能领域算法迭代落地。

近年来,具身智能、多模态机器人已成为AI产业落地的核心赛道,而面向生活化非结构化场景的高标注多模态训练数据,一直是制约机器人精细操作算法迭代的核心瓶颈——尤其是涉及双臂协作、视觉感知与力控结合的民用操作场景,现有公开数据集的覆盖度、标注精度普遍难以满足研发需求。近日,科技机构nodogoro正式发布由LeRobot创建的杂货打包场景专用双臂机器人操作数据集cell1_20260523_mohammed_groceries_packing_20260523_214749,主要面向机器人精细操作、多模态机器人学习两大核心领域提供训练支撑。

据披露,该数据集是专门针对starpilot_yam_gripper型号双臂机器人操作任务开发的训练数据集,共包含5个完整训练片段,总帧数达3477帧,采样帧率为30fps,覆盖了杂货打包全流程的操作动作、状态反馈、多视角视觉感知等全链路数据。其标注特征维度包括三大类:第一类是14维动作向量,可精准对应两个机械臂末端执行器的x/y/z轴位置、rx/ry/rz轴旋转参数以及夹爪开合宽度控制指令;第二类是32维状态观测数据,涵盖两个机械臂的编码器角度、IMU加速度与角速度、位姿参数(位置+四元数)以及夹爪开合状态、开合距离等运行时动态数据;第三类是多视角视觉观测数据,包含左右腕部摄像头采集的480x640分辨率RGB图像与深度图像,以及两个基座摄像头分别采集的480x640、768x1024分辨率RGB图像,可完整还原操作场景的全局与局部视觉信息。此外,数据集还配套了时间戳、帧索引、片段索引、任务索引等全量元数据,方便研发人员快速筛选、调用对应场景的训练数据。

从应用方向来看,该数据集可为多类机器人学习任务提供训练支撑:一是动作模仿学习方向,可用于训练双臂机器人的物品拾取、分类摆放、打包封装等生活化操作技能,未来可落地到家用服务机器人的家务整理、线下零售门店的订单自动打包、仓储物流的货品分拣码放等场景;二是强化学习方向,依托多维度的状态反馈数据,可训练机器人在非结构化场景下的动态操作调整能力,尤其是针对异形、易碎物品的安全操作策略;三是视觉-运动控制方向,配套的多视角视觉+动作标注数据,可支撑多模态机器人的“感知-决策-执行”全链路算法迭代,降低机器人在复杂场景下的操作误差率。

业内普遍认为,专用场景的高质量标注数据集是具身智能落地的核心“生产资料”,此前公开领域面向民用生活化操作场景的双臂机器人数据集较少,本次nodogoro发布的数据集填补了杂货打包细分场景的训练数据空白,对于降低机器人研发企业的训练数据采集成本、加快民生领域服务机器人的商业化落地进程,都具有正向推动作用,也符合当前数据要素向垂直行业赋能、支撑数字经济核心产业创新的发展趋势。

查看cell1_20260523_mohammed_groceries_packing_20260523_214749

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们