首页 / 开源数据市场 / 正文

eazevedo发布机器人专用数据集Ex1_PoV2_attempt_0 覆盖模仿学习、关节视觉控制核心场景

五号数据雷达开源数据市场2026-05-16 00:089

开发者eazevedo于2026年5月15日在HuggingFace首发机器人领域专用数据集Ex1_PoV2_attempt_0，该数据集针对so_follower类型机器人打造，全量标注覆盖动作、视觉、时序多维度信息，将为机器人模仿学习、关节视觉控制模型的训练与评估提供高质量数据支撑。

当前具身智能已成为全球人工智能领域的核心赛道之一，而覆盖视觉、关节位姿、动作序列的多模态标注数据，是训练机器人自主决策、动作控制模型的核心生产要素，此前面向细分机器人类型的专用数据集供给缺口始终较大。近日，开发者eazevedo正式对外发布机器人学领域专用数据集Ex1_PoV2_attempt_0，该数据集于2026年5月15日首发于全球最大的AI模型与数据集开源社区HuggingFace，主要面向机器人模仿学习、关节视觉控制两大核心研发场景开放使用。

据悉，本次发布的数据集基于HuggingFace推出的机器人学习开源工具链LeRobot创建，专门针对so_follower类型机器人的训练需求打造，全量数据集包含20个任务episodes，总计15170帧标注数据，覆盖1类核心任务。存储层面，结构化标注数据采用parquet格式存储以提升读取效率，视觉素材采用mp4格式存储，帧率为30fps，可满足大多数机器人控制模型的训练精度要求。

从数据特征维度看，该数据集实现了机器人动作、观察状态、视觉信息、时序数据的全维度对齐标注：动作维度覆盖6个核心关节位置，包括shoulder_pan.pos、shoulder_lift.pos、elbow_flex.pos、wrist_flex.pos、wrist_roll.pos、gripper.pos；观察状态维度同步标注对应的6个关节位置，可用于对比动作指令与实际执行的偏差；视觉维度配套机器人第一视角前视图像，分辨率为480x640x3，视频采用av1编码，无音频轨；除此之外，数据集还同步标注了时间戳、帧索引、episode索引、全局索引、任务索引等时序字段，方便研发人员按需截取对应序列数据开展训练。

从应用场景来看，该数据集可广泛支撑各类机器人控制和学习任务，覆盖模型训练、效果评估全流程：在机器人模仿学习场景中，研发人员可基于“视觉-关节位姿”的配对标注数据，训练机器人复刻示教动作，快速完成抓取、搬运等高频操作的技能习得；在关节视觉控制场景中，可基于时序对齐的多模态数据优化视觉反馈与关节动作的协同逻辑，降低控制延迟，提升机器人在非结构化场景下的动作稳定性；此外，标准化的标注体系也可支持不同厂商、不同架构的机器人行为模型开展横向性能基准测试，降低行业研发的对比成本。这类细分场景专用标注数据集的开放，也将进一步丰富具身智能领域的数据要素供给，助力降低中小研发团队的数据采集成本，加快机器人通用智能的落地进度。

查看Ex1_PoV2_attempt_0

Dataset card内容：

Files and versions内容：

社区讨论

近期热门