five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

KoukiHagiwara在HuggingFace发布机器人专用多模态数据集 覆盖运动控制与视觉反馈训练需求

五号数据雷达开源数据市场2026-05-02 23:4413
2026年5月2日,开发者KoukiHagiwara于AI开源社区HuggingFace首发slide_push_pull_side50_diagonal100_merged150数据集,该数据集基于LeRobot工具构建,同步关联机器人关节姿态数据与双视角视觉数据,可直接用于机器人运动控制、视觉反馈算法训练,降低具身智能领域研发的数据集获取门槛。

当前具身智能产业正进入快速落地期,工业协作机器人、服务机器人的精细化操作能力迭代,对高质量标注的多模态训练数据集需求持续攀升。但行业内覆盖多操作动作、同步关联关节姿态与多视角视觉数据的开源数据集供给仍存在较大缺口,尤其缺乏适配中小团队轻量化训练需求的小体量、高标注质量数据集,成为制约算法迭代效率的核心瓶颈之一。

在此背景下,开发者KoukiHagiwara发布的slide_push_pull_side50_diagonal100_merged150数据集,为上述行业痛点提供了新的解决方案。该数据集是使用LeRobot创建的,主要面向机器人技术领域的算法训练场景,共包含150个数据集子集,总计164700帧数据,覆盖2类典型机器人操作任务。数据以通用的parquet格式存储,总结构化数据文件大小为100MB,配套视频文件大小为200MB,采样帧率为30fps,整体存储容量小、适配主流AI训练框架,无需复杂预处理即可直接加载使用。

从数据维度来看,该数据集的特征覆盖了机器人全链路操作的核心要素:既包含机器人肩部、肘部、腕部和夹持器的实时动作位置数据,以及对应观察状态的位置信息,也同步匹配了来自顶部全局摄像头和腕部第一视角摄像头的图像观察数据(分辨率为480x640,3通道),同时附带完整的时间戳、帧索引、集索引、索引和任务索引字段,所有数据维度一一对应,无需额外清洗对齐即可投入训练。

从应用价值来看,该数据集可广泛应用于多个机器人技术研发方向:一是可用于机器人运动规划算法训练,依托标注完善的关节姿态数据,快速优化机器人操作的路径规划精度与运动平顺性,适配滑动、推拉、侧向操作、对角移动等典型桌面操作场景需求;二是可用于视觉伺服算法开发,结合双视角图像与对应关节位置数据,训练机器人通过视觉反馈动态调整操作姿态的能力,提升复杂非结构化场景下的操作容错率;三是可用于具身智能大模型的多模态对齐训练,为语言指令-视觉感知-动作执行的跨模态映射提供基础数据支撑。

查看slide_push_pull_side50_diagonal100_merged150

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们