当前人形机器人、工业协作机器人赛道进入快速落地期,控制算法的训练迭代高度依赖场景化、多模态的高质量标注数据,但目前行业内面向双肩跟随类双机械臂机器人的专用训练数据集供给相对稀缺,成为制约相关领域算法研发效率的核心瓶颈之一。近日,开发者juyoungggg正式对外发布0512_setting_2nd_4机器人控制专用数据集,该数据集定向覆盖机器人关节控制、多视角视觉模仿学习两大核心应用领域,进一步丰富了机器人垂直赛道的训练数据供给。
juyoungggg本次发布的0512_setting_2nd_4是面向双肩式跟随机器人(bi_so_follower)定制的垂直训练数据集,基于机器人学习领域主流的LeRobot工具创建完成。数据集共包含20个完整的任务情节(episodes),覆盖1项核心操作任务,累计采集24941帧有效数据,采集速率为30帧每秒(fps),完全满足机器人控制算法训练的时序精度要求。整体数据采用Parquet格式存储,结构化数据文件总大小为100MB,配套视频文件总大小为200MB,兼顾了存储效率与调用便捷性,方便研发团队快速接入训练流程。
该数据集的标注维度覆盖动作、观察两大核心模块:其中动作特征包含左右机械臂共12个关节的位置参数,覆盖肩部平移、肩部抬升、肘部弯曲、腕部弯曲与滚动、夹爪位置等全上肢运动维度;观察特征除同步收录12个关节的实时位置状态外,还包含左腕摄像头、右腕摄像头、右上方摄像头三个视角的同步视频数据,每路视频均为480x640分辨率3通道彩色画面,采用AV1编解码器压缩,可支撑多视角视觉融合算法的训练需求。此外,数据集还配套完整的时间戳、帧索引、情节索引、任务索引等元数据,所有20个情节数据全部划入训练集,可直接适配机器人模仿学习、强化学习等主流训练范式,大幅降低研发团队的数据预处理成本。
从行业应用价值来看,该数据集可广泛应用于多个机器人研发场景:一是双机械臂协同控制算法研发,可支撑跟随机器人完成工业分拣、辅助装配、陪护操作等场景的关节控制精度优化;二是多视角视觉模仿学习训练,开发者可基于多摄像头同步数据训练机器人复刻人类演示的复杂操作流程,降低算法对人工标注的依赖;三也可为通用人形机器人上肢控制算法的跨场景迁移验证提供标准化的测试基准,对推动机器人控制技术的落地迭代具有积极意义。





_1769672084863.jpg)