five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

开发者juyoungggg在HuggingFace首发机器人垂类数据集 覆盖模仿学习、多模态控制核心场景

五号数据雷达开源数据市场2026-05-25 00:347
开发者juyoungggg于2026年5月24日在HuggingFace平台首发机器人专用数据集0524_setting_2nd_1,该数据集基于LeRobot框架构建,覆盖双跟随机器人关节动作、多视角视觉等多维度数据,可支撑机器人模仿学习、多模态控制等核心研发场景,降低行业研发门槛。

当前人形机器人、工业协作机器人正进入技术落地的关键周期,多模态控制、模仿学习作为降低机器人调试成本、提升场景适配能力的核心技术路径,对高质量的实机耦合训练数据集存在旺盛需求。近日,开发者juyoungggg正式发布专用数据集0524_setting_2nd_1,并于2026年5月24日率先上线全球最大的AI开源社区HuggingFace,面向全球开发者开放使用。

据公开信息显示,该数据集基于LeRobot框架开发,是专为机器人任务设计的垂类数据集,整个数据集包含30个完整的操作情节,总计采集29969帧数据,采集帧率为30帧每秒,数据采集对象为bi_so_follower双肩跟随机器人,覆盖单任务全流程的多维度采集内容。

从数据构成来看,该数据集包含三大核心维度:第一是动作数据,由12个浮点数构成,分别对应机器人左右机械臂的12个关节位置,覆盖肩部、肘部、腕部及夹爪的全部运动参数;第二是观测状态数据,与动作数据的12个关节位置参数一一对应,可用于动作执行效果的校验与模型迭代;第三是多视角视觉观测数据,来自左腕摄像头、右腕摄像头、右顶部摄像头三个采集位,单帧分辨率为480x640像素,采用更高压缩效率的AV1格式编码,兼顾数据质量与存储效率。除此之外,数据集还配套包含时间戳、帧索引、情节索引、任务索引等完整元数据,方便开发者按需调用。存储层面,结构化数据采用Parquet格式存储,总数据文件大小为100MB,配套视频文件大小为200MB,30个完整情节全部划入训练集,可直接用于模型训练。

从应用场景来看,该数据集可广泛适配机器人领域的多个核心研发方向:在模仿学习领域,开发者可基于完整的关节动作序列训练机械臂的轨迹复刻能力,无需从零设计奖励函数,大幅降低低代码机器人训练的门槛;在多模态机器人控制领域,可融合视觉观测数据与关节状态数据,训练端到端的多模态控制模型,让机器人能够基于实时视觉反馈调整动作路径,适配工业分拣、协作装配、服务机器人辅助操作等场景;此外,多视角的视觉数据也可用于机器人视觉定位、动态障碍物识别等感知算法的训练优化。业内人士指出,当前机器人研发领域普遍存在实机测试成本高、多模态耦合数据供给不足的痛点,这类高质量开源垂类数据集的开放,能够有效降低中小研发团队、独立开发者的研发成本,推动机器人控制算法的开源迭代,助力数据要素在机器人产业的价值释放。

查看0524_setting_2nd_1

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们