当前,具身智能、工业机器人等领域正处于技术落地的关键周期,而高质量标注的垂直场景训练数据不足,是制约控制算法迭代效率的核心痛点之一——尤其对于同时匹配关节动作数据、多视角视觉数据的时序化机器人控制数据集,行业长期存在供给缺口。近日,开源数据贡献者kartoffelchips正式发布record-data002机器人控制专用数据集,该数据集于2026年5月7日首发于HuggingFace平台,面向全球研发人员开放获取。
据介绍,record-data002数据集基于LeRobot工具创建,后者是HuggingFace推出的专为机器人学习场景设计的开源工具栈,可支持机器人数据采集、模型训练、部署全流程工作,保障了数据集的采集标准性与行业兼容性。该数据集共包含50个episodes,总计32015帧时序数据,核心定位为机器人控制算法的训练与测试基准数据源。数据维度覆盖多类核心特征:一是机器人本体动作数据,包含肩部、肘部、腕部和夹爪的精准位置信息;二是观测状态数据,匹配与动作参数对应的关节位置信息,可用于控制算法的反馈校准;三是视觉感知数据,包含同步采集的前视、侧视两路图像,分辨率为480x640、采样率30fps,可支撑视觉相关控制算法的训练;此外还配套时间戳、帧索引、episode索引等辅助标注信息,方便研发人员做时序维度的数据处理。存储层面,结构化数据采用parquet格式存储,视频素材采用通用mp4格式,大幅降低了开发者的数据适配成本。
从应用场景来看,该数据集可广泛支撑机器人相关领域的技术研发:在工业机器人运动控制场景中,可用于训练机械臂精准抓取、精密装配、路径规划等算法,提升复杂工况下的动作稳定性与误差校准能力;在视觉伺服控制场景中,多视角同步视觉数据与关节动作数据的匹配,可帮助算法建立视觉特征与机器人动作的映射关系,支撑服务机器人动态避障、人机协作场景下的动作动态调整、移动机器人自主导航等技术的迭代;此外,该标准化数据集还可作为不同控制算法的性能测试基准,帮助研发团队统一评估指标,提升行业研发的可比性与效率,尤其能降低中小研发团队的数据采集成本,缩短技术落地周期。查看record-data002





_1769672084863.jpg)