当前具身智能产业正处于技术落地的关键期,高质量的实机运行数据集是支撑机器人控制模型训练、降低研发成本的核心生产要素。由于实机数据采集成本高、标注难度大,面向特定机器人型号的垂直场景公开数据集长期处于供给不足的状态,成为制约中小研发团队、学术机构开展相关研究的重要瓶颈。
近日,开发者jake123456789正式对外发布机器人学专用数据集eval_2cameras_container_21_11,该数据集于2026年5月15日首发于全球最大的AI开源社区HuggingFace,基于LeRobot框架创建,专为so_follower机器人研发场景设计。
本次发布的数据集为多模态结构化数据集,同时包含机器人的动作数据与观察数据:其中动作维度覆盖6个核心关节位置,分别为肩部平移、肩部提升、肘部弯曲、手腕弯曲、手腕旋转和夹爪位置,观察状态维度同步采集上述6个关节的实时运行数据,实现动作与状态的精准对齐。视觉维度配备双视角图像采集能力,包含分辨率为800x1280x3的前摄像头视频、分辨率为1280x1920x3的手腕摄像头视频,可完整覆盖机器人操作时的全局视野与末端执行器近景视野。除此之外,数据集还包含时间戳、帧索引、剧集索引、索引和任务索引等核心元数据,支撑研发人员按场景、按任务灵活调用数据。存储层面,数据集采用parquet文件格式分块组织,总结构化数据文件大小为100MB,视频文件大小为200MB,帧率为30fps,兼顾调用效率与数据精度。
从应用场景来看,该数据集可广泛适用于机器人领域的多类研发需求:在视觉伺服控制场景中,双视角视觉数据与关节状态的同步对齐特性,可支撑研发人员训练机器人基于视觉反馈的动态姿态调整能力,优化工业分拣、容器操作等场景下的作业精度;在模仿学习场景中,结构化的“动作-观测”数据对可直接作为训练样本,大幅降低研发团队的实机演示采集成本,帮助机器人快速复刻标准化操作流程;此外数据集也可支撑视觉导航、强化学习等相关任务的模型训练,为具身智能算法迭代提供基础数据支撑。
查看eval_2cameras_container_21_11
Dataset card内容:
Files and versions内容:
业内人士指出,本次专用数据集的开源发布,填补了so_follower机器人相关公开训练资源的空白,是数据要素开源共享在具身智能领域的典型实践,有助于降低行业研发门槛,推动机器人控制相关技术的普惠化创新。





_1769672084863.jpg)