five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

nodogoro发布乐高分拣双臂机器人多模态数据集 赋能模仿学习与多传感器融合研究

五号数据雷达开源数据市场2026-05-23 00:4816
机器人技术研发机构nodogoro于2026年5月22日在HuggingFace首发乐高分拣场景多模态机器人数据集,基于LeRobot开源框架构建,覆盖双臂动作、本体感知、多视角视觉等同步标注数据,可为机器人模仿学习、多传感器融合、视觉控制等领域的研究提供标准化训练支撑。

当前,全球人形机器人、工业协作机器人赛道正处于技术落地的关键攻坚期,精细操纵能力作为机器人替代人力完成复杂工业、服务业场景任务的核心指标,其算法迭代高度依赖高质量的真实场景标注数据。但长期以来,双臂协同场景下、覆盖多传感器同步标注的公开数据集稀缺,大量研究仅能依赖仿真数据或单模态数据开展训练,算法的真实场景泛化性受到严重制约。

近日,机器人技术研发机构nodogoro正式发布乐高分拣场景专项多模态数据集cell1_20260518_mohamed_lego_sorting20260518_181039,该数据集于2026年5月22日首发于全球最大的AI开源社区HuggingFace,是基于开源机器人学习工具链LeRobot构建的真实机器人操作数据集,专门面向机器人控制、模仿学习领域的研究需求打造。

本次发布的数据集记录了"starpilot_yam_gripper"双臂机器人系统完成单次乐高分拣全任务周期的同步数据,共包含1356帧对齐标注内容,覆盖三大类数据维度:一是动作特征数据,包含两个机械臂的3D空间位置、旋转参数、抓取宽度等末端执行器控制核心参数;二是本体状态特征数据,包含关节编码器角度、IMU加速度与陀螺仪数据、机器人全身位姿信息、抓取器开合状态等本体感知数据;三是多视角视觉感知数据,包含左腕、右腕、基座三个位置摄像头同步采集的RGB图像与深度图像,分辨率分别为480x640和768x1024,采样帧率达30fps,同时覆盖了机器人第一人称操作视角与全局场景视角,所有模态数据均完成时间轴对齐,可直接用于AI模型训练。

该数据集采用大数据领域主流的列式存储格式Parquet存储,结构化数据文件总大小为100MB,配套视频文件总大小为200MB,具备轻量化、读取效率高的特性,研究人员可快速下载并适配至主流机器人学习算法框架,大幅降低数据预处理成本。

从应用场景来看,该数据集可广泛支撑多个机器人技术方向的研究:在模仿学习领域,研究人员可基于该数据集的动作轨迹标注,训练双臂机器人的精细分拣策略,复现乐高分拣操作,并可进一步拓展至电子元器件分拣、生物医药样本分拣、物流小件分拣等同类精细操作场景的策略迁移研究;在多传感器融合领域,同步的本体感知数据与多视角视觉数据可用于验证多模态状态估计算法,提升机器人在复杂光照、局部遮挡等非结构化场景下的感知鲁棒性;在视觉伺服控制领域,对齐的视觉输入与动作输出数据可用于训练端到端视觉控制模型,降低机器人工业部署过程中的环境标定成本。此外,该数据集还可作为标准基准测试集,用于不同机器人学习算法的效果对比,统一行业评估标准。

本次nodogoro发布的数据集进一步丰富了开源机器人学习数据集体系,填补了双臂精细分拣场景多模态标注数据的供给空白,对降低机器人操纵技术研发门槛、加快相关技术的产业化落地具有积极意义。

查看cell1_20260518_mohamed_lego_sorting20260518_181039

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们