five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

nodogoro发布双臂乐高操作数据集 首发HuggingFace 支撑机器人操作学习与视觉抓取研发

五号数据雷达开源数据市场2026-05-17 23:5510
机器人学习领域技术厂商nodogoro于2026年5月17日在全球AI开源社区HuggingFace首发其最新专项数据集,该数据集基于LeRobot框架打造,覆盖全链路多模态标注,可为双臂机器人操作学习、视觉抓取控制领域的算法研发提供高可用性的场景化训练数据源。

在人形机器人、协作机器人技术迭代进入场景落地攻坚期的当下,高质量、场景化的标注训练数据已成为行业刚需。近日,机器人学习领域技术厂商nodogoro正式发布一款双臂乐高操作专项数据集,为行业提供了又一高质量开源数据供给。

本次发布的数据集命名为cell1_20260516_mohamed-ramadan_6pm-12pm_lego20260516_210632,核心面向机器人操作学习、视觉抓取控制两大研发场景。该数据集基于Meta开源的LeRobot框架构建——作为当前机器人学习领域应用最广的通用框架之一,LeRobot的标准化数据结构可大幅降低不同研发团队之间的数据适配成本,支持数据集直接接入主流机器人模型训练管线。

从数据集属性来看,本次发布的数据集专门适配starpilot_yam_gripper双臂机器人类型,覆盖2组完整操作序列(episodes)、共3048帧有效标注数据;结构化数据采用行业通用的Parquet格式存储,总文件大小100MB,配套视频文件大小200MB,采样帧率为30fps,符合机器人操作算法对时序数据的常规训练要求。

本次数据集的标注维度覆盖了机器人操作训练所需的全链路数据:其一为14维动作浮点数组,完整记录了两个机械臂的位置、旋转参数以及夹爪宽度数据,可直接用于端到端动作控制算法的训练;其二为32维观测状态浮点数组,包含机器人编码器角度、IMU惯性测量数据、机身姿态信息,可支撑机器人本体状态感知算法的迭代优化;其三为多视角多模态视觉观测数据,包含左右腕部摄像头采集的RGB+深度图像、基座摄像头采集的RGB图像,分辨率分别为480x640和768x1024,可用于视觉抓取、环境感知相关算法的训练。此外,数据集还配套了时间戳、帧索引、episode索引等完整元数据,实现了动作、状态、视觉三类数据的全链路时间对齐,研发人员无需额外做数据清洗对齐即可快速接入训练流程,大幅降低数据预处理成本。

作为聚焦乐高操作场景的专项数据集,该数据集可覆盖多个典型研发应用方向:首先是双臂协作精细操作算法训练,乐高块体积小、拼接精度要求高,是验证机器人小物体抓取、拼接操作能力的通用测试场景,相关算法可延伸应用到工业3C零部件组装、物流精细拆拣、家用服务机器人小件操作等落地场景;其次是多模态机器人大模型训练,融合视觉观测、本体状态、动作指令三类数据,可训练端到端的通用机器人操作大模型,降低机器人不同场景的适配成本;第三是Sim2Real(仿真到真实)迁移验证,该数据集的真实环境采集数据可用于校准机器人仿真环境参数,提升仿真训练模型在真实场景的落地效果。

当前全球机器人赛道正处于技术落地的关键期,场景化训练数据供给不足、标注成本高已经成为制约中小团队研发效率的核心痛点之一,本次nodogoro发布的开源专项数据集,不仅丰富了双臂操作细分领域的训练数据供给,也进一步完善了机器人学习领域的开源数据生态,对推动行业技术普惠、加速研发迭代有着积极作用。

查看cell1_20260516_mohamed-ramadan_6pm-12pm_lego20260516_210632

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们