当前全球人形机器人、协作机器人赛道正处于技术落地的关键期,高质量、场景化的训练数据是支撑机器人模仿学习、多模态控制算法迭代的核心基础,而垂直场景的专用数据集稀缺一直是制约细分品类机器人研发效率的核心痛点。近日,开源贡献方rol09正式发布ex3-fixed机器人学习专用数据集,该数据集于2026年5月11日率先上线HuggingFace平台,定向服务机器人学习领域的研究与开发需求。
据了解,ex3-fixed是国内少有的面向so_follower类型机器人的专用训练数据集,基于HuggingFace开源的LeRobot机器人学习工具链构建,可适配同类型机器人的控制算法训练需求。官方披露的参数显示,该数据集共包含108个完整任务序列(episodes),累计采集35319帧有效数据,覆盖3类典型机器人操作任务,所有数据均以30fps的标准帧率采集,保障了动作序列的连贯性与时序标注精度。从数据结构来看,ex3-fixed覆盖三类核心数据维度:其一为动作数据,包含机器人肩部、肘部、腕部各关节的位置参数以及抓取器的开合状态数据,可直接用于动作复刻模型的训练;其二为观测数据,包含机器人实时运行状态参数与夹爪视角的RGB图像数据,图像分辨率为480x640,可支撑多模态感知-控制联动算法的研发;其三为标准化元数据,包含每帧数据对应的时间戳、帧索引、任务序列索引、任务类型索引等标注信息,方便研究者快速筛选所需数据子集。存储层面,数据集结构化数据采用parquet格式存储,总大小为100MB,配套视频文件总大小为200MB,轻量化的存储设计也降低了开发者的下载与使用门槛。
从应用价值来看,ex3-fixed数据集可广泛应用于机器人控制、模仿学习、强化学习等多个研究方向:针对工业协作机器人场景,可用于分拣、装配、搬运等任务的示教学习模型训练,降低工业机器人的部署适配成本;针对多模态机器人控制研究,可用于验证“视觉感知-动作输出”链路的算法精度,优化机器人动态作业的稳定性;同时该数据集的标准化格式也可作为基准测试集,用于不同机器人控制算法的效果比对。此次rol09发布的专用数据集,也进一步丰富了国内机器人学习领域的公共数据供给,为降低细分赛道研发成本、加速机器人控制技术落地提供了数据要素支撑。





_1769672084863.jpg)