首页 / 开源数据市场 / 正文

nodogoro首发乐高操作多模态机器人数据集覆盖模仿学习、机器人控制等研究场景

五号数据雷达开源数据市场2026-05-17 23:3513

AI研发主体nodogoro于2026年5月17日在HuggingFace正式发布多模态机器人学数据集cell1_20260516_youssef-mohamed_9pm-12pm_lego20260517_002835，可为机器人模仿学习、操作控制、计算机视觉等领域的技术研发提供高标注度的真实场景训练数据支撑。

当前通用机器人技术进入落地攻坚期，模仿学习作为降低机器人操作训练成本、提升任务适配效率的核心技术路径，对真实场景下的多维度机器人操作数据需求持续攀升，但垂直领域高质量标注训练数据的供给不足，已成为制约相关技术迭代的重要瓶颈。近日，nodogoro正式对外发布全新机器人学数据集cell1_20260516_youssef-mohamed_9pm-12pm_lego20260517_002835，该数据集基于LeRobot工具创建，采集自starpilot_yam_gripper类型机器人的乐高拼接操作任务场景，于2026年5月17日首发于HuggingFace平台。
本次公布的数据集参数标注完整、特征维度覆盖全面：共包含2个完整操作片段、7627帧采集数据，采样帧率为30fps，已完成标准化训练集分割，可供研究者直接用于模型训练与效果验证。数据特征层面，动作维度包含机械臂位置、旋转参数、夹爪宽度等核心控制数据；观察维度除编码器角度、IMU传感器读数、机器人实时姿态、夹爪运行状态等动力学数据外，还同步采集了左腕、右腕、基座三个机位的多视角视觉数据，包含分辨率480x640的RGB图像与分辨率768x1024的深度图像，可充分支撑多模态感知算法的训练需求。存储层面，结构化数据以高压缩比、高读取效率的Parquet格式存储，视频内容以通用MP4格式存储，其中结构化数据总大小为100MB，视频资源总大小为200MB，可灵活适配不同规模的研发团队使用需求。
从典型应用场景来看，该数据集可广泛适配机器人领域的多类研究需求：在模仿学习方向，研究者可基于数据集中的标准化操作轨迹，训练机器人复现高精度小物件拼接、分拣等精细化操作任务；在机器人控制方向，可作为通用测试集验证不同控制策略在相同操作场景下的响应速度、定位精度与运行稳定性；在计算机视觉方向，多视角的RGB+深度数据可用于3D目标检测、视觉姿态估计、小物件识别等算法的训练优化。作为机器人学领域的细分场景高质量数据集，本次发布的资源进一步丰富了全球公共AI训练数据的供给池，可有效降低中小研发团队、学术机构的相关研究门槛，对于推动通用机器人操作技术的落地迭代、完善数据要素市场垂直领域的资源供给体系均有积极意义。

查看cell1_20260516_youssef-mohamed_9pm-12pm_lego20260517_002835

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

nodogoro首发乐高操作多模态机器人数据集 覆盖模仿学习、机器人控制等研究场景

Dataset card内容：

Files and versions内容：

社区讨论

nodogoro首发乐高操作多模态机器人数据集覆盖模仿学习、机器人控制等研究场景