在具身智能成为全球AI产业落地核心赛道的当下,高质量、场景化的实机操作数据集是训练机器人控制模型、降低研发门槛的核心基础资源,而具备多视角视觉、动作匹配标注的细分场景数据,长期以来是行业供给的短板。2026年5月15日,贡献者jake123456789正式在HuggingFace平台首发eval_2cameras_container_21_10数据集,该数据集由机器人研发项目LeRobot创建,专门针对跟随者型机器人(robot_type: so_follower)的操作场景设计,为机器人学相关研究提供了标准化的实机数据支撑。
该数据集的采集维度覆盖机械臂操作全链路数据,既包含肩部、肘部、腕部和夹爪位置等核心机械臂动作数据,也同步收录了两类观测数据:一是机器人关节位置等实时运行状态数据,二是来自前摄像头和腕部摄像头的双视角RGB图像观测,两类摄像头分辨率分别为800x1280和960x1280,30fps的采样帧率可完整还原操作过程中的细微动作变化与视觉特征,避免数据丢帧导致的训练偏差。
存储与结构设计方面,数据集的结构化数据采用parquet格式存储,兼顾高压缩率与快速读取能力,视频内容则采用通用性极强的MP4格式存储,可大幅降低开发者的数据预处理成本。整体数据集结构包含动作、观测、时间戳、帧索引、回合索引等标准化特征,无需额外标注即可直接接入主流机器人学习训练框架,适配性极强。
从应用价值来看,该数据集的双视角匹配设计与实机动作标注特性,可广泛应用于多个具身智能研发方向:在机器人视觉控制领域,开发者可基于多视角视觉与动作的对应关系,训练机械臂的视觉伺服能力,提升复杂操作场景下的定位精度与响应速度;在模仿学习领域,该数据集的完整操作链路数据可作为高质量示教样本,支撑行为克隆、逆强化学习等算法的训练,降低机器人完成容器抓取、搬运、放置等典型任务的研发成本;除此之外,该数据集还可用于多模态大模型的具身能力微调、机器人操作安全策略验证等方向的研究。
作为开源数据要素供给的重要组成部分,本次eval_2cameras_container_21_10数据集的公开,不仅为具身智能领域的研究者提供了免费的高质量数据支撑,也进一步完善了开源机器人数据集的品类布局,对降低具身智能研发门槛、推动机器人控制技术的落地应用具有积极作用。
查看eval_2cameras_container_21_10





_1769672084863.jpg)