five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

LeRobot斜视角推拉操作数据集上线HuggingFace 10万帧多模态数据支撑机器人控制研发

五号数据雷达开源数据市场2026-05-02 23:1210
2026年5月2日,开发者KoukiHagiwara在HuggingFace平台首发由LeRobot打造的slide_push_pull_merged100ep_diagonal_view多模态数据集,同步覆盖视觉观测、关节状态、任务标签三类结构化数据,可为机器人操作控制、机械臂视觉反馈等领域的算法研发提供标准化训练与测试支撑。

随着具身智能产业进入落地攻坚期,工业机械臂、服务机器人的操作精度、场景泛化能力成为技术竞争的核心,而涵盖视觉信号、运动状态、任务标签的同步高质量数据集,是相关算法迭代的核心基础设施,也是当前行业的稀缺资源。2026年5月2日,开发者KoukiHagiwara正式在HuggingFace平台首发由LeRobot项目打造的slide_push_pull_merged100ep_diagonal_view数据集,填补了斜视角下机器人平面推拉操作多模态数据集的供给空白。

本次发布的数据集聚焦机器人平面滑动、推送、拉扯三类典型操作场景,共包含100个完整操作episodes、104800帧同步数据,覆盖2类核心操作任务,整体数据文件大小为100MB,配套视频文件大小为200MB。数据集的多模态特征覆盖三大维度:一是运动状态数据,包含6个关节的实时动作指令与实际观测位置数据;二是视觉观测数据,同步采集顶部全局摄像头与腕部第一视角摄像头的视频内容,分辨率为480x640、帧率达30fps,可完整还原操作过程中的环境变化与末端执行器状态;三是标准化元数据,涵盖时间戳、帧索引、episode索引、任务索引等结构化标签,大幅降低开发者的数据预处理成本。

从应用价值来看,该数据集可广泛应用于机器人领域的多个研发方向:首先可支撑机械臂视觉伺服算法迭代,双视角视觉数据与关节状态的同步匹配,可帮助算法实现基于视觉反馈的动态力控调整、末端定位修正,解决传统纯关节控制缺乏环境感知能力的痛点;其次可作为通用操作算法的基准测试集,100组不同场景的完整操作序列,可用于验证不同算法在推拉操作场景下的成功率、误差控制水平与泛化能力;此外还可用于具身大模型的微调训练,多模态数据的结构化标注可帮助模型更好地理解操作任务语义,提升动作规划的合理性。

作为开源共享的机器人领域专业数据集,该资源的发布也将有效降低中小研发团队的数据集采集门槛,无需搭建高成本的实机采集环境即可开展相关算法研发,加速机器人操作控制技术从实验室向工业装配、物流分拣、家庭服务等场景的落地进度,为数据要素支撑具身智能产业发展提供了典型样本。

查看slide_push_pull_merged100ep_diagonal_view

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们