当前具身智能与工业柔性机器人领域正进入快速发展期,场景化、多模态的高质量标注训练数据,是制约机器人操作学习、视觉伺服控制等核心技术落地的关键瓶颈。不同于通用数据集,针对特定机械臂型号、特定操作场景的垂直类数据集,能够大幅降低研发团队的数据预处理成本,提升算法训练的场景适配性,也是当前全球AI科研领域的稀缺资源。
2026年5月17日,Nodogoro正式上线cell1_20260516_youssef-mohamed_9pm-12pm_lego20260516_221252数据集,该数据集由LeRobot团队打造,专为starpilot_yam_gripper型号双机械臂的乐高操作任务研发,首发后登陆HuggingFace平台开放获取。
本次发布的数据集包含2个完整任务episode,总计6463帧采样数据,采样帧率为30fps,整体采用AI训练友好的parquet格式存储,结构化数据文件总大小为100MB,配套视频文件大小为200MB。其数据维度覆盖机器人操作全链路信息:首先是14维浮点型动作数据,完整记录两个机械臂的实时位置、旋转角度与夹爪宽度参数,可直接用于动作模仿学习模型的训练;其次是32维浮点型观测状态数据,涵盖编码器角度、IMU加速度与陀螺仪数据、整机姿态信息以及夹爪开合状态,为机器人状态感知算法研发提供了真实场景下的标定参考;此外数据集还搭载了左腕、右腕、基座三个位置的摄像头采集信息,同步覆盖RGB与深度图像,分辨率分别达到480x640与768x1024,配合时间戳、帧索引、episode索引等标准化元数据,实现了多模态数据的精准时间对齐,大幅降低了研发人员的数据清洗与标注成本。
据介绍,该数据集可广泛应用于机器人操作学习、动作识别、计算机视觉等多个研究方向,典型应用场景包括双机械臂精细组装任务的动作规划算法训练、低延迟视觉伺服控制的定位精度优化、乐高类小部件操作的力-视融合感知模型研发等,也可为具身智能多模态大模型的场景微调提供高质量垂直领域数据支撑,对推动消费级组装机器人、工业柔性装配工作站等产品的技术落地具备重要参考价值。
查看cell1_20260516_youssef-mohamed_9pm-12pm_lego20260516_221252





_1769672084863.jpg)