当前具身智能已成为全球人工智能领域的核心赛道之一,而覆盖视觉、关节位姿、动作序列的多模态标注数据,是训练机器人自主决策、动作控制模型的核心生产要素,此前面向细分机器人类型的专用数据集供给缺口始终较大。近日,开发者eazevedo正式对外发布机器人学领域专用数据集Ex1_PoV2_attempt_0,该数据集于2026年5月15日首发于全球最大的AI模型与数据集开源社区HuggingFace,主要面向机器人模仿学习、关节视觉控制两大核心研发场景开放使用。
据悉,本次发布的数据集基于HuggingFace推出的机器人学习开源工具链LeRobot创建,专门针对so_follower类型机器人的训练需求打造,全量数据集包含20个任务episodes,总计15170帧标注数据,覆盖1类核心任务。存储层面,结构化标注数据采用parquet格式存储以提升读取效率,视觉素材采用mp4格式存储,帧率为30fps,可满足大多数机器人控制模型的训练精度要求。
从数据特征维度看,该数据集实现了机器人动作、观察状态、视觉信息、时序数据的全维度对齐标注:动作维度覆盖6个核心关节位置,包括shoulder_pan.pos、shoulder_lift.pos、elbow_flex.pos、wrist_flex.pos、wrist_roll.pos、gripper.pos;观察状态维度同步标注对应的6个关节位置,可用于对比动作指令与实际执行的偏差;视觉维度配套机器人第一视角前视图像,分辨率为480x640x3,视频采用av1编码,无音频轨;除此之外,数据集还同步标注了时间戳、帧索引、episode索引、全局索引、任务索引等时序字段,方便研发人员按需截取对应序列数据开展训练。
从应用场景来看,该数据集可广泛支撑各类机器人控制和学习任务,覆盖模型训练、效果评估全流程:在机器人模仿学习场景中,研发人员可基于“视觉-关节位姿”的配对标注数据,训练机器人复刻示教动作,快速完成抓取、搬运等高频操作的技能习得;在关节视觉控制场景中,可基于时序对齐的多模态数据优化视觉反馈与关节动作的协同逻辑,降低控制延迟,提升机器人在非结构化场景下的动作稳定性;此外,标准化的标注体系也可支持不同厂商、不同架构的机器人行为模型开展横向性能基准测试,降低行业研发的对比成本。这类细分场景专用标注数据集的开放,也将进一步丰富具身智能领域的数据要素供给,助力降低中小研发团队的数据采集成本,加快机器人通用智能的落地进度。





_1769672084863.jpg)