five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

jjr1007发布dagger_generalization_24机器人学数据集 赋能操作控制与学习泛化领域研发

五号数据雷达开源数据市场2026-05-18 23:1810
2026年5月18日,开发者jjr1007在HuggingFace首发由LeRobot创建的dagger_generalization_24机器人学数据集,该数据集覆盖多维度机器人动作、视觉观测及配套元数据,可广泛用于机器人控制模型训练、泛化能力评估等研发场景,为机器人学习领域提供了新的标准化数据支撑。

当前通用协作机器人、人形机器人的技术迭代已进入落地攻坚期,机器学习模型的泛化能力不足、跨场景适配性差是制约商业化落地的核心痛点之一,而覆盖动作、感知、标注等多维度信息的高质量公开数据集,是支撑机器人学习算法迭代的核心基础资源。2026年5月18日,开发者jjr1007正式上线dagger_generalization_24机器人学数据集,该数据集由LeRobot打造,专门面向机器人控制任务研发,首发平台为全球知名AI开源社区HuggingFace。

据公开信息显示,该数据集包含1个完整任务序列(episode),总计255帧数据,采样帧率为30fps。数据维度覆盖四大类:一是机器人全关节动作数据,包含肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置等核心控制参数;二是观测状态数据,与动作维度匹配的关节位置实时监测数据;三是环境感知数据,即分辨率为640x480的3通道前端摄像头视频流;四是全量元数据,包含干预标志、时间戳、帧索引、episode索引、任务索引等标注信息。数据集采用parquet结构化文件+mp4视频的组合格式存储,其中结构化数据文件总大小为100MB,视频文件大小为200MB,适配机器人类型为so_follower,可直接用于训练和评估机器人学习模型,支撑泛化方向相关研究。

从应用场景来看,该数据集可覆盖机器人学习领域的多类研发需求:其一可作为机械臂控制模型的训练数据源,基于动作、观测、视觉的多模态融合数据,训练机器人完成指定操作任务的精准控制能力;其二可作为泛化研究的基准测试集,用于验证不同机器人学习模型在同类任务中的跨设备、跨场景适配能力;其三配套的干预标志元数据,可支撑人机共融场景下机器人干预响应机制的相关研究,优化机器人在人工介入场景下的动作切换流畅度与安全性。

作为垂直面向机器人学习泛化领域的公开数据集,dagger_generalization_24的开放进一步丰富了全球机器人领域的开源数据供给,为相关研究者、创业团队降低了原始数据采集的门槛与成本,也为不同算法的横向对比提供了标准化的验证基准,对推动机器人操作控制技术的落地、加速通用机器人的研发迭代具有积极意义。

查看dagger_generalization_24

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们