当前,全球机器人技术迭代进入快车道,人形机器人、工业机械臂、服务机器人的商业化落地进程持续加速,而机器人控制算法的研发高度依赖高质量的实采标注数据集——由于机器人操作场景需要同步采集动作、状态、视觉等多维度的对齐数据,采集成本高、标注难度大,公开领域的优质专项数据集供给一直是制约行业普惠发展的核心短板。近日,开发者eazevedo正式发布Ex2_attempt_3机器人学习数据集,该数据集于2026年5月11日首发于HuggingFace,专门面向机器人模仿学习、视觉伺服控制等核心研发场景打造。
据悉,该数据集基于开源LeRobot框架构建,是面向机器人学习场景的标准化训练数据集,共包含20个完整任务执行周期(episodes),总计22078帧采集数据,所有数据均来自so_follower类型机器人的实机操作采集。数据维度覆盖机器人学习所需的全量核心特征:既包括6维关节位置的动作数据(覆盖肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置全关节动作),也包含与动作完全对齐的6维关节位置观测状态,同时搭载480x640分辨率、3通道、30fps的前视RGB视频观测数据,辅以时间戳、帧索引、episode索引、任务索引等结构化标注字段,无需额外标注即可直接用于算法训练。存储层面,结构化数据采用大数据领域通用的parquet格式存储,具备高压缩率、快速查询的优势,视频数据采用通用MP4格式,兼容绝大多数主流深度学习训练框架,可大幅降低开发者的数据预处理成本,适用于机器人控制、模仿学习或强化学习等多类研发任务。
从应用价值来看,该数据集可适配多个机器人技术研发的典型场景:在模仿学习领域,研发人员可基于该数据集的实机示教数据训练机械臂的轨迹复刻能力,快速实现工业分拣、零部件装配等常见任务的算法落地,减少线下实体机器人反复示教的时间与硬件成本;在视觉伺服控制领域,同步对齐的视觉数据与关节状态数据可用于训练端到端的视觉反馈控制模型,提升机器人在非结构化动态环境下的操作精度,可支撑服务机器人动态抓取、协作机器人人机交互等场景的技术研发;此外,该数据集也可作为强化学习的基准测试数据集,帮助研发人员验证机器人控制算法的泛化性,降低仿真环境到真实场景的技术迁移门槛。
作为垂直领域的开源专项数据集,Ex2_attempt_3的发布进一步丰富了全球公开机器人学习数据集的供给,对于降低中小科技团队、高校科研团队的机器人技术研发门槛,推动机器人控制算法的普惠化迭代具有积极意义,也为数据要素在人工智能垂直领域的流通、应用贡献了典型的开源样本。





_1769672084863.jpg)