five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

开源贡献者cookiez2811发布机器人专用训练数据集training1 覆盖模仿学习与机械臂轨迹控制场景

五号数据雷达开源数据市场2026-05-18 23:2110
开源数据贡献者cookiez2811于2026年5月18日在全球AI开源社区HuggingFace首发机器人专用训练数据集training1,该数据集基于LeRobot框架构建,覆盖机械臂2类核心作业任务,可为机器人模仿学习、轨迹控制等领域的算法研发提供高质量多模态标注数据支撑。

当前人形机器人、工业机械臂的智能化迭代已进入深水区,模仿学习作为机器人快速复现人类操作、降低算法训练成本的核心技术路径,对多模态、高标注精度的场景化训练数据需求持续攀升。而公开领域覆盖机械臂全关节参数、同步视觉观测的高质量数据集供给仍存在明显缺口,成为制约中小研发团队、初创企业相关技术落地的核心瓶颈之一。近日,开源数据贡献者cookiez2811正式发布的机器人学习专用数据集training1,正是针对这一行业需求推出的垂直场景数据资产。

该数据集基于HuggingFace旗下机器人学习开源工具栈LeRobot创建,面向机器人模仿学习、机械臂轨迹控制两大核心研发场景设计,共包含200个episodes,总帧数达59730,覆盖2类典型机械臂作业任务。数据采用标准化存储结构:结构化标注数据以parquet文件格式存储,视觉采集内容以mp4格式存储,整体数据总大小约为300MB,其中数据文件100MB,视频文件200MB,全量数据被划为训练集供研发人员调用。

从数据维度来看,training1的标注覆盖了机器人研发所需的核心参数维度:动作维度包含肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置共6个关节位置数据;观测状态维度同步采集了与动作维度一致的6个关节位置数据,可支撑算法端动作与状态的映射关系训练;视觉维度搭载前视图像采集能力,视频分辨率为720x1280、3通道、帧率30fps,可匹配视觉感知算法的训练需求;此外数据集还配套了时间戳、帧索引、episode索引、索引和任务索引等完整元数据,采集所使用的机器人型号为so_follower。

从应用价值来看,training1数据集的多模态同步标注特性,可支撑多类机器人研发场景的算法训练:一是机器人模仿学习场景,研发团队可基于数据集中的关节动作与对应视觉观测的映射关系,训练机械臂快速复现指定操作流程,大幅降低示教编程的人力成本;二是机械臂轨迹控制场景,通过高时序密度的关节位置数据,可用于优化机械臂运动路径规划算法,提升运动精度、降低碰撞风险;此外该数据集也可作为小样本学习、跨域迁移学习等前沿方向的基准测试数据集,为相关算法的效果验证提供统一参照。作为开源社区最新贡献的垂直场景专用数据集,training1的上线进一步丰富了机器人领域的公开训练数据供给,尤其是为缺少自有数据采集能力的中小研发团队、高校科研团队提供了低成本的训练数据来源,对推动机器人智能化技术的普惠化发展、加快数据要素在人工智能实体经济场景的落地应用具有积极作用。

查看training1

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们