近年具身智能作为人工智能落地的核心赛道之一,商用化进程持续提速,而机器人自主学习能力的提升高度依赖高质量、多模态的实机采集标注数据集,当前行业内此类数据供给存在明显缺口,实机数据采集的高成本也成为制约中小团队、高校实验室开展技术研发的重要瓶颈。近日,技术研发主体Nary002正式发布机器人学习数据集record-test,该数据集于2026年5月4日首发于HuggingFace,面向全球研发人员开放获取。
据介绍,record-test数据集基于LeRobot框架构建,共包含2个episodes和3592帧实采数据,数据特征覆盖多维度机器人运行参数:既包括机器人的动作状态(6个关节位置)、观测状态(6个关节位置)等结构化运行数据,也包含左右顶置摄像头采集的480x640分辨率、30fps的同步视频数据,同时配套时间戳、帧索引等元数据,实现了运动参数与视觉数据的精准对齐。存储层面,结构化数据采用大数据领域通用的parquet列式存储格式,可大幅提升数据读取与预处理效率,适配主流深度学习训练框架;视频数据采用通用mp4格式存储,方便研发人员直接调用开展视觉相关训练任务。
从应用场景来看,该数据集可广泛应用于机器人运动控制、视觉反馈学习两大核心研发方向:其中关节动作与观测的对照数据,可为机械臂轨迹规划、动态避障、力控优化等运动控制算法训练提供“动作-反馈”的闭环样本;双路视觉数据与运动参数的对齐标注,可支撑视觉引导下的精密操作、环境感知、多模态模型对齐等视觉反馈学习相关研发,尤其为高校实验室、中小创业团队降低了实机数据采集的高成本门槛,助力具身智能领域的技术普惠。





_1769672084863.jpg)