five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

LeRobot旗下多模态机器人数据集sweep_dataset_merged_group2上线HuggingFace 支撑关节控制与多视角观测研发

五号数据雷达开源数据市场2026-05-07 23:559
2026年5月7日,开发者saipuneethgottam于HuggingFace平台首发sweep_dataset_merged_group2数据集。该数据集隶属于LeRobot机器人控制系列,同步覆盖关节动作标注与多视角观测视频,可为机器人运动控制、环境感知等方向研发提供高质量开源数据支撑。

当前,全球人形机器人、工业机械臂赛道正进入技术落地的关键周期,多模态训练数据的稀缺,尤其是真实机器人采集的、同步覆盖动作标注与环境感知的高质量数据集,已经成为制约机器人控制算法迭代的核心瓶颈之一。作为AI领域全球最大的开源共享平台,HuggingFace的数据集板块已经成为全球研发团队获取训练数据的核心渠道,2026年5月7日,开发者saipuneethgottam正式在该平台首发sweep_dataset_merged_group2数据集,填补了机械臂运动控制场景下多模态同步开源数据集的供给空白。

据公开信息显示,本次上线的sweep_dataset_merged_group2数据集由LeRobot打造,属于机器人控制垂直领域的专属数据集,共包含60个完整任务片段,累计41115帧同步采集数据。数据集的标注维度覆盖两大核心模块:其一为机器人关节全链路动作数据,完整记录了肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置的全周期运动参数;其二为多视角观测视频数据,同步采集了前视、左侧和腕部三个不同机位的观测画面,分辨率分别为1280x720和640x480。所有数据均以30fps的标准帧率采集,采用parquet格式存储,视频部分使用更高压缩比的AV1编码,在保障数据精度的同时降低了存储与下载成本。

从应用场景来看,该数据集可广泛适配机器人领域的多类研发需求:在关节控制算法训练方向,连续标注的关节运动数据可以为机械臂轨迹规划、力控算法训练提供真实参考样本,大幅降低实体机器人试错的时间与经济成本;在多模态感知方向,同步采集的动作数据与多视角视频,可支撑“动作指令-视觉反馈”跨模态对齐模型的训练,帮助机器人实现基于环境视觉变化的自主运动调整;此外,该数据集还可用于数字孪生仿真场景的验证,真实采集的运动与视觉数据能够优化仿真环境的拟真度,提升算法从仿真环境到实体机器人部署的迁移成功率。

该数据集的开放也具备明确的行业价值:当前国内国际机器人研发赛道中小团队占比极高,自主采集同类多模态数据集需要投入大量硬件成本与标注人力,这类高质量开源数据集的开放,能够有效降低行业研发门槛,加速机器人控制、感知技术的落地进程,同时也为全球机器人研发领域的技术复用、评估标准统一提供了基础数据支撑。

查看sweep_dataset_merged_group2

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们