five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

jjr1007于HuggingFace首发机器人专用数据集 支撑运动控制与视觉模仿学习研发

五号数据雷达开源数据市场2026-05-12 23:1328
2026年5月12日,行业贡献者jjr1007在HuggingFace平台正式发布may7_TRIMMED_first_50_frames_merged专用数据集,该数据集基于LeRobot框架打造,专门适配so_follower型机器人的研发需求,将为具身智能领域的运动控制算法训练、视觉模仿学习模型迭代提供高质量的多模态标注数据源。

随着具身智能产业进入落地攻坚期,针对特定机器人机型的场景化、标注化训练数据不足,已经成为制约运动控制、视觉模仿学习等核心算法迭代的主要瓶颈之一。近日,行业贡献者jjr1007在全球领先的AI开源社区HuggingFace正式首发may7_TRIMMED_first_50_frames_merged数据集,为so_follower类机器人的研发环节提供了标准化的训练数据支撑。

据了解,本次发布的数据集基于LeRobot框架创建,是当前市场上为数不多专门针对so_follower机器人类型打造的垂直领域训练数据集,共包含271个完整任务序列(episodes),总计覆盖231525帧同步数据,整体采用parquet结构化文件格式存储并配套原始视频文件,兼顾了训练加载效率与二次开发灵活性。数据集的特征维度全面覆盖机器人控制的核心需求:既包含shoulder_pan.pos、shoulder_lift.pos等全量关节位置动作数据,也同步采集了与动作参数对齐的观测状态数据(包含同维度关节位置参数与分辨率为1080x1920的3通道前端视觉图像),同时配套时间戳、帧索引、episode索引等结构化标注信息,数据集整体帧率为30fps,可直接用于机器人学习与控制类算法的训练、验证环节。

从行业应用来看,该数据集可支撑多个机器人研发方向的落地:一是可用于so_follower类机器人的运动控制算法训练,助力研发团队优化关节轨迹规划、柔顺控制等核心算法的精度与响应速度;二是可支撑视觉模仿学习方向的研发,基于“视觉观测输入-关节动作输出”的配对标注数据,开发者可训练机器人通过视觉感知直接复刻演示动作,大幅降低示教学习的落地门槛;三是可作为多模态感知对齐的基准测试数据集,用于验证机器人视觉感知数据与运动执行数据的时间同步精度,优化具身智能系统“感知-决策-执行”全链路的协同效率。

作为数据要素市场的重要组成部分,垂直领域的高质量AI训练数据集是降低研发成本、加速产业迭代的核心公共资源。本次jjr1007发布的专用数据集,填补了so_follower类机器人训练数据供给的空白,对于降低中小研发团队的前端数据采集成本,推动机器人运动控制、视觉模仿学习相关技术的普惠化发展有重要意义,也进一步丰富了全球开源AI数据集的垂直品类供给。

查看may7_TRIMMED_first_50_frames_merged

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们