在人形机器人、工业智能机械臂技术快速迭代的当下,高标注质量、多模态匹配的专用数据集,是支撑机器人控制算法训练、环境感知能力优化的核心生产资料,也是当前机器人研发领域的稀缺资源之一。近日,AI数据集研发机构Nesaispas正式对外发布Pos_6机器人专用数据集,该数据集于2026年4月23日率先上线全球最大的AI开源社区HuggingFace,面向全球研发人员开放,主要应用于机器人控制、感知研究领域。
据介绍,Pos_6数据集基于LeRobot框架创建——作为当前全球应用最广泛的机器人学习专用开源框架之一,LeRobot产出的数据集天然适配主流机器人模仿学习、强化学习训练 pipeline,可大幅降低研发团队的数据适配成本。本次发布的数据集共包含25个完整任务序列(episodes)、7403帧对齐标注数据,覆盖机器人动作、状态、视觉、时序标签等多维度特征:其中动作数据包含肩部、肘部、腕部和夹持器的全关节位置信息,可直接用于机械臂路径规划、精细操作动作校准等方向的算法训练;观察状态数据为与动作数据一一对应的关节实时位置信息,可支撑机器人动作闭环控制、状态反馈模型的研发;同时数据集还配套了480x640分辨率、30fps的宏观、微观双视角视频数据,可分别用于全局环境感知、操作对象细节识别等视觉模型的训练;此外配套的时间戳、帧索引、episode索引等元数据,可帮助研发人员快速完成多模态数据时序对齐,大幅减少数据预处理环节的工作量。存储层面,结构化数据采用大数据领域通用的parquet列式存储格式,具备高压缩率、快速批量读取的优势,适配AI训练的批量数据加载需求,视频内容则采用通用mp4格式,无需额外转码即可适配各类训练框架。
业内人士指出,当前机器人研发领域的公开高质量数据集相对稀缺,多数中小团队、科研机构需要自行投入大量成本完成数据采集、标注工作,重复投入率高且标注标准不统一,制约了技术迭代效率。Pos_6这类标准化多模态机器人数据集的开放,将有效降低相关领域的研发门槛,为工业机械臂智能化升级、服务机器人操作能力优化、人形机器人运动控制研发等场景提供可靠的基础数据支撑,对推动机器人领域技术落地、完善数据要素在智能制造领域的应用体系具备积极意义。





_1769672084863.jpg)