近年来,随着人形机器人、工业协作机器人商业化进程提速,机器人精细操作、运动控制算法的训练对多模态、高同步性的标注数据集需求持续上涨。但当前全球公开的机器人领域专用数据集普遍存在模态单一、时序匹配度低、标注维度不全等问题,成为制约中小团队机器人控制技术研发效率的核心瓶颈之一。近日,AI数据服务商Nesaispas正式发布Pos_6_1机器人操作专用数据集,该数据集于2026年4月23日率先在全球最大的AI开源社区HuggingFace上线,面向全球机器人研发群体开放使用。
据介绍,本次发布的Pos_6_1数据集基于机器人学习领域主流开源框架LeRobot创建,该框架专为机器人操作数据采集、标注及模型训练设计,生成的数据集可直接适配多数主流机器人控制模型的训练流程,兼容性更强。数据集结构覆盖25个完整操作序列(episodes)、共8142帧同步标注数据,针对1项标准化机器人操作任务设计,数据文件采用行业通用的parquet格式存储,配套操作过程视频采用mp4格式,总数据文件大小为100MB,视频文件大小为200MB,视频帧率为30fps,可满足时序类控制算法的训练精度要求。
从标注维度来看,Pos_6_1数据集的特征覆盖全链路机器人操作核心数据:动作层包含6个关节的实时位置指令数据,观测状态层同步收录6个关节的实际反馈位置数据,视觉层配套宏观(macro)、微观(micro)双视角RGB图像,分辨率均为480x640、3通道,同时每帧数据同步关联时间戳、帧索引、episode索引等标注信息,实现了指令数据、感知数据、时序信息的一一匹配,解决了多模态数据集普遍存在的不同步问题。
该数据集可广泛应用于机器人操作、机器人控制领域的研发工作,典型应用方向包括:工业协作机器人的精细操作算法训练,可支撑电子装配、小件分拣等场景的运动轨迹规划模型迭代;人形机器人臂部多关节协同控制算法研发,提升关节运动的精度和平滑度;机器人模仿学习算法验证,研发团队可基于标准化操作序列训练机器人复现指定动作,降低真实物理场景下的试错成本。
作为机器人控制领域的高质量公开数据集,Pos_6_1的发布进一步丰富了全球机器人学习领域的数据供给,其标准化的多模态同步标注结构,也为行业内相关数据集的规范建设提供了参考样本,有助于降低中小研发团队的数据采集门槛,加快机器人控制技术的落地迭代速度。





_1769672084863.jpg)