随着具身智能产业进入快速落地期,高质量、多模态的标准化机器人训练数据集,已成为支撑视觉伺服、自主任务学习等核心技术迭代的关键基础设施。作为全球最大的AI开源数据与模型社区,HuggingFace也成为全球机器人领域研发人员共享数据集、协同技术攻关的核心阵地。2026年5月15日,贡献者jake123456789在该平台正式发布eval_2cameras_container_21_19专项数据集,瞄准机器人技术领域的研发需求设计。
该数据集基于HuggingFace推出的机器人学习专用开源工具栈LeRobot构建,后者是目前全球机器人学习领域应用最广泛的数据采集、处理工具之一,可实现机器人动作、视觉、状态等多源数据的标准化采集与格式统一,大幅提升数据集的兼容性与易用性。本次发布的数据集聚焦so_follower型机器人的操作场景,收录了机械臂动作、状态观测、多视角视觉等多维度标注数据,具体包括:对应肩部、肘部、手腕和夹爪位置的6维动作浮点值、与动作参数对齐的6维状态观测值、分别来自前置全局摄像头(分辨率800x1280)与腕部近距摄像头(分辨率960x1280)的3通道视频数据,同时配套时间戳、帧索引、episode索引、任务索引等结构化标注字段,可实现数据帧的精准定位与关联匹配。
存储层面,数据集结构化字段采用parquet格式组织,视频文件采用通用mp4格式存储,结构化数据总大小为100MB,视频文件总大小为200MB,视频帧率为30fps,整体结构采用每块1000帧的chunk模式管理,便于研发人员按需加载调用。值得注意的是,目前该数据集标注的总episodes、总帧数和总任务数均为0,大概率为未完全上传完成的示例版本,后续研发人员可关注平台更新获取完整数据资源。
从应用价值来看,该数据集同步覆盖全局+近距双目视觉数据与机械臂动作、状态标注的设计,针对性匹配机器人领域两大核心研发方向的需求:在视觉伺服场景下,研发人员可基于该数据集训练机器人通过视觉反馈实时调整机械臂位姿的算法,支撑精密装配、物料分拣、柔性操作等场景的技术落地;在机器人任务学习场景下,该数据集可作为模仿学习、强化学习算法的训练基准,帮助机器人快速掌握容器操作、物品搬运等典型任务的操作逻辑,此外还可用于小样本学习、跨平台算法迁移等前沿方向的验证测试。
查看eval_2cameras_container_21_19





_1769672084863.jpg)