当前通用机器人技术进入落地攻坚期,模仿学习作为降低机器人操作训练成本、提升任务适配效率的核心技术路径,对真实场景下的多维度机器人操作数据需求持续攀升,但垂直领域高质量标注训练数据的供给不足,已成为制约相关技术迭代的重要瓶颈。近日,nodogoro正式对外发布全新机器人学数据集cell1_20260516_youssef-mohamed_9pm-12pm_lego20260517_002835,该数据集基于LeRobot工具创建,采集自starpilot_yam_gripper类型机器人的乐高拼接操作任务场景,于2026年5月17日首发于HuggingFace平台。
本次公布的数据集参数标注完整、特征维度覆盖全面:共包含2个完整操作片段、7627帧采集数据,采样帧率为30fps,已完成标准化训练集分割,可供研究者直接用于模型训练与效果验证。数据特征层面,动作维度包含机械臂位置、旋转参数、夹爪宽度等核心控制数据;观察维度除编码器角度、IMU传感器读数、机器人实时姿态、夹爪运行状态等动力学数据外,还同步采集了左腕、右腕、基座三个机位的多视角视觉数据,包含分辨率480x640的RGB图像与分辨率768x1024的深度图像,可充分支撑多模态感知算法的训练需求。存储层面,结构化数据以高压缩比、高读取效率的Parquet格式存储,视频内容以通用MP4格式存储,其中结构化数据总大小为100MB,视频资源总大小为200MB,可灵活适配不同规模的研发团队使用需求。
从典型应用场景来看,该数据集可广泛适配机器人领域的多类研究需求:在模仿学习方向,研究者可基于数据集中的标准化操作轨迹,训练机器人复现高精度小物件拼接、分拣等精细化操作任务;在机器人控制方向,可作为通用测试集验证不同控制策略在相同操作场景下的响应速度、定位精度与运行稳定性;在计算机视觉方向,多视角的RGB+深度数据可用于3D目标检测、视觉姿态估计、小物件识别等算法的训练优化。作为机器人学领域的细分场景高质量数据集,本次发布的资源进一步丰富了全球公共AI训练数据的供给池,可有效降低中小研发团队、学术机构的相关研究门槛,对于推动通用机器人操作技术的落地迭代、完善数据要素市场垂直领域的资源供给体系均有积极意义。
查看cell1_20260516_youssef-mohamed_9pm-12pm_lego20260517_002835





_1769672084863.jpg)