five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

jjr1007发布dino_diffusion_dagger_7多模态机器人数据集 支撑模仿学习与多模态控制研究

五号数据雷达开源数据市场2026-05-17 23:4612
2026年5月17日,开发者jjr1007基于LeRobot平台打造的dino_diffusion_dagger_7机器人技术数据集首发上线HuggingFace,覆盖机器人动作、状态、视觉等多维度对齐的交互数据,可为具身智能领域相关算法研发提供标准化训练样本支撑。

随着具身智能成为全球人工智能领域的核心落地赛道,机器人模仿学习、多模态控制等技术的迭代高度依赖高质量的实机交互训练数据,但由于实机数据采集成本高、多模态对齐难度大,垂直领域的公开高质量数据集供给长期存在缺口,成为制约中小团队技术创新的核心瓶颈之一。近日,开发者jjr1007正式发布的dino_diffusion_dagger_7数据集,正是针对这一行业需求打造的专属机器人技术数据集,该数据集基于全球应用广泛的机器人学习开源工具链LeRobot平台创建,专为机器人学习任务设计,于2026年5月17日首发上线HuggingFace平台。

从数据构成来看,该数据集完整记录了机器人执行任务过程中的全链路多模态数据:核心数据维度涵盖6个自由度的机器人动作指令(包含肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置)、与动作维度对应的6个关节位置的机器人状态观测,以及由前摄像头采集的外部图像观测(视频格式,分辨率480x640,30帧/秒,RGB三通道),可实现感知数据与动作状态的精准对齐。此外,数据集还配套包含干预标志、时间戳、帧索引、剧集索引、任务索引等完整元数据,方便研究人员快速调用、处理数据。目前数据集结构化内容以Parquet文件格式存储,视频内容以MP4格式存储,总剧集数为1,总帧数为741,总任务数为1。

作为专门面向机器人学习场景的公开数据集,dino_diffusion_dagger_7可提供机器人与环境交互的连续状态-动作对序列,适用于机器人模仿学习、行为克隆、强化学习等多个研究方向,典型应用场景包括多模态机器人控制算法的验证与迭代、工业机械臂精细操作任务的训练样本补充、具身智能感知-决策链路的对齐研究等,能够大幅降低相关研究团队的实机数据采集成本,加速算法落地验证效率,对于丰富具身智能领域数据要素供给、推动垂直领域AI技术创新具有积极意义。

查看dino_diffusion_dagger_7

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们